Pocketsphinx - 添加单词并提高准确性

Question

我已经设法最终构建并运行pocketsphinx(pocketsphinx_continuous).我遇到的问题是如何提高准确性.据我所知,您可以指定字典文件(-dict test.dic).所以我采用了默认的字典文件并添加了一些相同单词的发音,例如:

pencil P EH N S AH L
pencil(2) P EH N S IH L

spaghetti S P AH G EH T IY
spaghetti(2) S P UH G EH T IY

然而,pocketphinx仍然无法识别任何一个词.我知道你也可以指定一个jsgf文件,但对于短语和语法来说似乎更多.如何让pocketphinx识别铅笔和意大利面等常用词？

谢谢

-麦克风

Answer 1

有了这样的东西,你无法确定,但我可以提出以下建议:

也许语言模型在某种程度上具有"意大利面"和"铅笔"的低概率.正如你所建议的那样,你可以使用JSGF来测试它如何用于识别,如果它不使用N-gram模型,而是做一个简单的语法(给它像20个单词,包括意大利面条和铅笔).通过这种方式,您可以看到它是否可能是难以识别这些单词的语言模型,如果它认为所有单词具有相同的概率,它就可以.
即使使用替代字典条目,也许你只是简单地发音这些单词.尝试A.测试其他人的声音,或B.使声学模型适应你的声音(见http://cmusphinx.sourceforge.net/wiki/tutorialam)
此外,它是什么让它们认识到失败的时候？如果可能,从词典中删除它误识别的单词.

同样,为了整体准确性,只有三件事能真正帮助你:限制语法,调整声学模型,以及获得更高质量的录音输入.

Answer 2

为了提高准确度,您可能需要尝试根据您的声音调整声学模型. http://cmusphinx.sourceforge.net/wiki/tutorialadapt