同步文本和音频.是否有NLP /语音到文本库来执行此操作?

Jus*_*tin 13 speech-recognition nlp pattern-recognition

我想将语音记录与已知文本同步.是否有语音到文本/自然语言处理库可以促进这一点?我想我想要检测单词边界并从字典中计算候选匹配.我在SO上发现的大部分问题都与书面语言有关.

期望但不是必需的:

  • 开源
  • 兼容美式英语开箱即用
  • 跨平台
  • 彻底记录

编辑:我意识到这是一个非常广泛,甚至是天真的问题,所以提前感谢您的指导.

到目前为止我发现了什么:

dmc*_*cer 11

强制对齐

听起来你想要在音频和已知文本之间进行强制对齐.

几乎所有研究/行业级语音识别系统都能够做到这一点,因为强制对齐是训练识别系统的重要部分,这些数据在音频和抄本之间没有电话级别对齐.

对齐CMUSphinx

CMU的开源语音识别系统的Sphinx4-1.0 beta 5版本现在包括一个关于如何在成绩单和长语音记录之间进行对齐的演示.