我们如何使用pocketsphinx 将.wav 文件转换为文本?

Ali*_*Ali 5 python speech-recognition voice-recognition cmusphinx pocketsphinx

我在我的 Linux 机器上正确安装了 Pocketsphinx,现在我想使用 Pocketsphinx 将音频文件 (.wave) 转换为文本,我该怎么做?有没有明确的命令和简短的命令来做到这一点?像这样的命令:

  ./src/programs/pocketsphinx_continuous -samprate 8000 -nfft 2048 -adcdev hw:1,0 -lm 2530.lm -dict 2530.dic myvoice.wav 
Run Code Online (Sandbox Code Playgroud)

以及如何使用 python 做到这一点?提前致谢。

Ali*_*Ali 6

我找到了我的答案,0.8 版的 Pocketsphinx 有一个选项可以做到这一点:

pocketsphinx_continuous -infile myfile.wav 
Run Code Online (Sandbox Code Playgroud)

但是文件必须采用特定格式:16khz 16bit mono wav 文件

  • 错误:“acmod.c”,第 80 行:未使用 -mdef 选项或 -hmm 指定声学模型定义......突然变得更加复杂...... (3认同)
  • 您可以使用以下命令将 mp3 转换为正确的波形格式:ffmpeg -i yourfile.mp3 -acodec pcm_s16le -ac 1 -ar 16000 myfile.wav (3认同)
  • 任何在基于 Ubuntu 的机器上遇到与 Mike 相同的问题的人都应该尝试使用 apt install 安装 pocketsphinx-en-us 包。 (2认同)