PocketSphinx python并设置声学模型?

use*_*844 5 python speech-recognition cmusphinx

我正在阅读这篇关于语音识别的指南,它提到我需要三个语音识别项目:声学模型,语言模型,语音词典.

我想开始玩这个python演示,它使用Gstreamer从麦克风捕获并重采样到8kHz,16位PCM音频.

我看到我可以指定语言模型和语音字典,我使用[由cmu提供]:

http://sourceforge.net/projects/cmusphinx/files/Acoustic%20and%20Language%20Models/US%20English%20HUB4%20Language%20Model/
Run Code Online (Sandbox Code Playgroud)

但我很困惑,我应该指定声学模型?gstreamer是否有我自己使用的声学模型?我希望使用这里提供的声学模型获得更好的结果:

 http://sourceforge.net/projects/cmusphinx/files/Acoustic%20and%20Language%20Models/US%20English%20HUB4%20Acoustic%20Model/
Run Code Online (Sandbox Code Playgroud)

(抱歉,超链接.我不能发布超过2个链接,代表少于10)

Nik*_*rev 3

但我很困惑应该在哪里指定声学模型?

您可以使用 gstreamer 元素的 hmm 属性指定模型。就像教程中介绍的那样

asr.set_property('lm', '/home/user/mylanguagemodel.lm')
Run Code Online (Sandbox Code Playgroud)

您可以使用

asr.set_property('hmm', '/home/user/acoustic_model_folder')
Run Code Online (Sandbox Code Playgroud)

gstreamer 是否有我隐式使用的自己的声学模型?

是的,默认情况下它使用发行版中的美国英语模型 hub4wsj_sc_8k