我们如何使用pocketsphinx 将.wav 文件转换为文本？

Question

我在我的 Linux 机器上正确安装了 Pocketsphinx，现在我想使用 Pocketsphinx 将音频文件 (.wave) 转换为文本，我该怎么做？有没有明确的命令和简短的命令来做到这一点？像这样的命令：

  ./src/programs/pocketsphinx_continuous -samprate 8000 -nfft 2048 -adcdev hw:1,0 -lm 2530.lm -dict 2530.dic myvoice.wav

以及如何使用 python 做到这一点？提前致谢。

Answer 1

我找到了我的答案，0.8 版的 Pocketsphinx 有一个选项可以做到这一点：

pocketsphinx_continuous -infile myfile.wav

但是文件必须采用特定格式：16khz 16bit mono wav 文件

错误：“acmod.c”，第 80 行：未使用 -mdef 选项或 -hmm 指定声学模型定义......突然变得更加复杂...... (3认同)
您可以使用以下命令将 mp3 转换为正确的波形格式：ffmpeg -i yourfile.mp3 -acodec pcm_s16le -ac 1 -ar 16000 myfile.wav (3认同)
任何在基于 Ubuntu 的机器上遇到与 Mike 相同的问题的人都应该尝试使用 apt install 安装 pocketsphinx-en-us 包。 (2认同)