让WAV文件转录与Sphinx4一起使用

Jim*_*nes 2 speech-recognition speech-to-text cmusphinx

我已经在我的Windows XP系统和JSAPI设置上安装了Sphinx-4.我想将英语口语WAV(或MP3)文件转录成文本.

当我运行"WavFile"演示时 - 它成功运行.

java -jar WavFile.jar
Run Code Online (Sandbox Code Playgroud)

但是,当我传递我自己的wav文件时:

java -jar WavFile.jar c:\test.wav
Run Code Online (Sandbox Code Playgroud)

我明白了:

":文件:/ C:罐子/sphinx4-1.0beta3-bin/sphinx4-1.0beta3/bin/WavFile.jar /edu/cmu/sphinx/demo/wavfile/config.xml"中定义加载识别器...

解码的jar:文件:/ C:/sphinx4-1.0beta3-bin/sphinx4-1.0beta3/bin/WavFile.jar /edu/cmu/sphinx/demo/wavfile/12345.wav结果:一二三四五

似乎这个演示设置为加载和运行内部wav文件("12345.wav")或其他东西.

我已经阅读了文档,并且无法想象如何设置"config.xml"甚至是放置它的目录.我只是想尝试使用标准演示进行简单的概念验证.

所以,问题是:如何运行Sphinx4程序来转录wav文件?

谢谢.

小智 6

我们需要的是编写一个新的应用程序(基于Transcriber.java),它使用CMU Dictionary(美国英语)而不是Transcriber.jar支持的数字.

很奇怪Sphinx没有这么有用的样本.