用于音频处理的任何类似OpenCV的C/C++库?

ica*_*s74 50 c++ audio opencv speech-recognition open-source

还有什么更多的东西,在(精神上)类似于OpenCV,但是用于处理音频并从中获取一些智能?能力范围可以从: -

  1. 多平台音频捕获和音频播放
  2. DSP - 音频滤波器
  3. 音调检测
  4. 色调属性分析
  5. 音调合成(各种标准波形)
  6. 给予一些识别语料库和模型的识别(例如确定乐器,节拍,人类语音等) - 可能使用其他开源项目进行实际识别部分(狮身人面像)
  7. 语音/音乐合成 - 可以再次使用其他一些开源项目(节日)

如果库在原始音频格式/编码转换上工作则很好,这是由其他现有库(来自ffmpeg的sa)处理的外部问题.

我不是这个领域的专家,但是需要使用这样的API,并且想知道这些库是否存在,所以我选择用于确定功能的术语可能不是最好的,所以专家可能想编辑这个问题.

Jon*_*Lee 32

对于音频捕获和回放,我想到了portaudio.

对于音频处理,STK看起来很有前景.

看看这个相关的问题:有人能用C++推荐一个像样的DSP /语音库吗?

我推荐这三个库:

  1. 非常容易使用和友好的一般信号处理 Aquila-dsp

  2. 音频信号处理的强大功能虽然很难使用,但对于初学者来说却非常庞大和复杂:CLAM Project

  3. 另一个我没有经验,值得考虑.TSPL


小智 8

查看Essentia http://essentia.upf.edu/ Essentia是一个用于音频分析和基于音频的音乐信息的开源C++库...它包含大量可重用算法,可实现音频输入/输出功能,标准数字信号处理块,数据的统计表征,以及大量的频谱,时间,音调和高级音乐描述符.

还有一个openFrameworks分支,虽然你可能想要推迟到正式64位,C++ 11在几个月内. https://github.com/GiantSteps/Essentia-Libraries