如何在Ruby应用程序中使用CMU Sphinx语音识别?

Alv*_*lve 7 ruby ruby-on-rails cmusphinx

我正在寻找如何使用CMU Sphinx和Ruby(Rails)应用程序.我需要非常简单的任务 - 我有一个mp3文件,我想把它转录成文本.

我该如何实现这种最简单的方法?我不知道C/C++,我的任务不是那么大的学习C/C++ :)

感谢帮助!

Nik*_*rev 10

CMUSphinx提供了几个可用于利用语音识别功能的接口.其中一些可能更适合你,一些更少:

  1. 使用命令行工具并将其作为Rails应用程序的外部二进制文件执行,以获取所需的结果.要执行的工具是pocketsphinx_continuous.有关如何从Rails调用二进制文件的更多信息,请参阅以下问题: 如何在heroku上执行二进制文件?

  2. 您可以使用JVM从JRuby调用Sphinx4框架,例如,参见如何使用JRuby中的 Sphinx4 :http://cmusphinx.sourceforge.net/wiki/tutorialsphinx4#writing_scripts

  3. 您可以使用SWIG实现pocketsphinx绑定.简单的部分是Python的swig包装器已经作为pocketsphinx的一部分存在,你只需要使用SWIG来生成Ruby包装器:https://sourceforge.net/p/cmusphinx/code/11643/tree/trunk/ pocketsphinx /痛饮/

  4. 最后,您可以使用Java REST框架实现REST Web,以使用CMUSphinx工具将音频转换为文本,并从Ruby代码调用服务.有关更多信息,请参阅有关如何使用Rails中的REST的信息. 这样,您的系统可以实现可扩展性.