ARPA语言模型文档

Luk*_*asz 15 speech-recognition nlp sphinx4 cmusphinx language-model

我在哪里可以找到有关ARPA语言模型格式的文档?

我正在使用pocket-sphinx STT引擎开发简单的语音识别应用程序.出于性能原因,建议使用ARPA.我想了解我可以做多少来调整我的语言模型以满足我的自定义需求.

我发现的只是一些非常简短的ARPA格式描述:

我是STT的初学者,我很难绕过这个(n-gram等等).我正在寻找更详细的文档.像这里的JSGF语法文档:

http://www.w3.org/TR/jsgf/

Car*_*arl 5

我发现此链接很有用:http://www.speech.sri.com/projects/srilm/manpages/ngram-format.5.html

它描述了n-gram又称ARPA又名Doug Paul格式.


Dar*_*usz 4

实际上,关于格式,除了这些文档中所说的之外,没有更多可说的了。

此外,您可能需要准备一个包含例句的文本文件,并根据它生成语言文件。有一个在线版本可以为您做到这一点:lmtool