Sam*_*amo 11 software-recommendation speech-recognition
我正在寻找从 mp3 到 txt 的简单转换器。我试过,但没有成功:julius,CMU Sphinx,......在过去的 4 个小时里,我没有找到如何使用它们(或正确安装它们)的方法。
我正在寻找的是这样的:
$ converterapp -infile myspeech.mp3 -outfile myspeech.txt
Run Code Online (Sandbox Code Playgroud)
我对 GUI 应用程序也很好,因为我只有几个文件要转换并且可以点击。
编辑:借助此答案将 MP3 转换为文本的语音识别应用程序?我设法让它工作,但它没有产生任何输出。好吧,实际上它会产生几个空行(未检测到单词)...
Pocketsphinx 将从现有的音频文件中对文本进行语音转换。根据 mp3 的初始格式,您可能需要两个单独的命令。
首先将您现有的音频文件转换为强制输入格式:
ffmpeg -i file.mp3 -ar 16000 -ac 1 file.wav
Run Code Online (Sandbox Code Playgroud)
奔跑的口袋狮身人面像
pocketsphinx_continuous -infile file.wav 2> pocketsphinx.log > myspeech.txt
Run Code Online (Sandbox Code Playgroud)
创建的文件 myspeech.txt 将包含您要查找的内容。
如果您不熟悉 ubuntu,则需要使用以下命令安装上述程序:
sudo apt install pocketsphinx pocketsphinx-en-us ffmpeg
Run Code Online (Sandbox Code Playgroud)