如何识别语音文件中的短语

use*_*635 4 c# speech-recognition visual-studio-2010

如何让引擎成功识别语音文件中的短语(wav/mp3/etc ..)?

例如,如果我有一个语音文件和同一文件上下文的书面文本,那么要使它识别语音文件中的文字.

我尝试使用SpeechRecognitionEngine,但到目前为止没有成功.

我会欣赏这些想法,因为这是我第一次处理语音识别技术.

我已经看过使用词典的语音到文本的例子,但我不确定它在这里是如何有用的.我想的可能是将所有语音文件转换为文本,然后只是查找该文本中的特定短语,但我认为这不是正确的方法.将5小时语音转换为文本似乎没有意义....或者可能将特定短语用作"词典"并在语音文件中查找此项目.

Nik*_*rev 6

您似乎需要在长文件中查找特定单词.这种技术被称为"关键词定位",它与语音识别完全不同,更有效率.显然,您不需要转录整个文件来搜索其中的单词,您可以快速浏览该文件.Microsoft语音识别引擎对关键字定位的支持非常有限.

CMUSphinx这样的开源引擎可以用来有效地实现关键字定位.有关如何使用pocketsphinx实现唤醒监听的信息,请参阅参考资料.

有关基础算法的更多信息,请参阅语音中的声音,并应用于数据挖掘