C/C++中的Mel频率倒谱系数(MFCC)

Ali*_*Ali 6 speech-recognition windowing mfcc

在C/C++中是否有任何MFCC实现?任何源代码或库?

我已经找到了http://code.google.com/p/libmfcc/,这似乎很好.

Eri*_*ton 6

2016年回顾:

  • libmfcc 很简单,MIT 许可证,自 2010 年以来不受支持。
  • YAAFE提供自 2011 年以来不受支持的 MFCC 和其他功能、LGPLv3。
  • Kaldi 有点矫枉过正,但它只能用于 MFCC。Apache License v2.0,仍受支持。
  • PocketSphinx是用于语音识别的 CMU 工具包,CMU 许可证(BSD 风格),并且仍然受支持。
  • SPTK是来自日本的研究工具包,经过修改的 BSD 许可,并且仍然受支持。
  • OpenSMILE有两个许可证:(1) 一个用于研究和个人使用的灵活许可证,以及 (2) 一个商业许可证。

注意我提到的是 PocketSphinx,而不是 Sphinx,因为后者是用 Java 编写的。


Pau*_*xon 1

您可以使用开源语音识别工具包(例如KaldiSphinx)中的前端。