Dom*_*nic 6 audio speech-recognition pattern-matching voice-recognition cmusphinx
我正在寻找一种匹配已知数据集的方法,比方说一个MP3或wav文件列表,每个文件都是有人说话的样本.此时我知道文件ABC是人X讲的.
然后,我想采取另一个样本,并进行一些语音匹配,以显示这个语音最有可能的人,然后给出已知的数据集.
此外,我不一定关心这个人说了什么,只要我能找到一个匹配,即我不需要任何抄录或其他.
我知道CMU Sphinx不进行语音识别,它主要用于语音到文本,但我见过其他系统,例如:LIUM Speaker Diarization(http://cmusphinx.sourceforge.net/wiki/ speakerdiarization)或VoiceID项目(https://code.google.com/p/voiceid/),它使用CMU作为此类工作的基础.
如果我要使用CMU,我该如何进行语音匹配?
另外,如果CMU Sphinx不是最好的框架,那么还有一个替代的开源吗?
| 归档时间: |
|
| 查看次数: |
2702 次 |
| 最近记录: |