Mik*_*679 18 speech-recognition sphinx speech-to-text
我已经设法最终构建并运行pocketsphinx(pocketsphinx_continuous).我遇到的问题是如何提高准确性.据我所知,您可以指定字典文件(-dict test.dic).所以我采用了默认的字典文件并添加了一些相同单词的发音,例如:
pencil P EH N S AH L
pencil(2) P EH N S IH L
spaghetti S P AH G EH T IY
spaghetti(2) S P UH G EH T IY
Run Code Online (Sandbox Code Playgroud)
然而,pocketphinx仍然无法识别任何一个词.我知道你也可以指定一个jsgf文件,但对于短语和语法来说似乎更多.如何让pocketphinx识别铅笔和意大利面等常用词?
谢谢
-麦克风
有了这样的东西,你无法确定,但我可以提出以下建议:
也许语言模型在某种程度上具有"意大利面"和"铅笔"的低概率.正如你所建议的那样,你可以使用JSGF来测试它如何用于识别,如果它不使用N-gram模型,而是做一个简单的语法(给它像20个单词,包括意大利面条和铅笔).通过这种方式,您可以看到它是否可能是难以识别这些单词的语言模型,如果它认为所有单词具有相同的概率,它就可以.
即使使用替代字典条目,也许你只是简单地发音这些单词.尝试A.测试其他人的声音,或B.使声学模型适应你的声音(见http://cmusphinx.sourceforge.net/wiki/tutorialam)
此外,它是什么让它们认识到失败的时候?如果可能,从词典中删除它误识别的单词.
同样,为了整体准确性,只有三件事能真正帮助你:限制语法,调整声学模型,以及获得更高质量的录音输入.
小智 7
为了提高准确度,您可能需要尝试根据您的声音调整声学模型. http://cmusphinx.sourceforge.net/wiki/tutorialadapt
要了解如何添加新单词:http://ghatage.com/tech/2012/12/13/Make-Pocketsphinx-recognize-new-words/
| 归档时间: |
|
| 查看次数: |
16948 次 |
| 最近记录: |