使用德语字典和语言模型与Sphinx4

0__*_*0__ 7 sphinx4 cmusphinx

我可以使用Sphinx4附带的en-us东西,没问题:

cfg.setAcousticModelPath("resource:/edu/cmu/sphinx/models/en-us/en-us")
cfg.setDictionaryPath("resource:/edu/cmu/sphinx/models/en-us/cmudict-en-us.dict")
cfg.setLanguageModelPath("resource:/edu/cmu/sphinx/models/en-us/en-us.lm.bin")
Run Code Online (Sandbox Code Playgroud)

我可以用它来转录英文声音文件录制.

现在我想用德语录音.在网站上,我找到了声学和语言模型的链接.其中有一个档案'德国Voxforge'.我找到声学模型路径的相应文件.但就我所见,它不包含字典或语言模型.

如何在Sphinx4中获取德语的字典和语言模型路径?

Nik*_*rev 5

你自己创建它们.您可以从字幕或维基百科转储创建语言模型.文档在这里.

最新的德国模特实际上不在CMUSphinx页面上,他们在github/gooofy.在这个gooofy项目中,您可以找到字典文档,模型和相关的matherials.