用于从音频流中提取单词(语音)的库?

gre*_*man 6 audio extract speech

我有一个音频流,我会从中提取单词(语音).所以例如有audio.wav我会得到001.wav,002.wav,003.wav等,其中每个XXX.wav是一个单词.

我正在寻找一个库或程序来做 - 平台没关系,但我更喜欢开源解决方案.

提前感谢您的帮助.

mat*_*tbh 2

Nuance是Dragon Naturallyspoken的开发公司,拥有许多软件开发工具包

音频挖掘套件似乎符合您的要求:

Dragon NaturallySpeaking SDK AudioMining 是一个独立于说话者的语音识别工具包,可以对音频文件中 100% 的语音信息进行索引。该技术使用高度准确的语音识别将音频文件转换为带有时间戳信息的 XML 文本。这可以与标准文本搜索产品集成,以便快速访问特定的音频内容。

语音到语音+元数据无疑是最难做好的部分。一旦有了语音+元数据,将单词提取为单独的音频文件就变得更加简单