语音/音乐分类

use*_*663 2 audio signal-processing speech

我想确定音频文件的哪个部分包含语音或音乐.

我希望有人有这样的东西,或者可以告诉我从哪里开始.你能否建议一些方法/教程来做同样的事情.

谢谢.

小智 5

查看pyAudioAnalysis python库.其中,它具有预训练的语音分类器和两种分段分类方法(一种基于固定大小的窗口,另一种基于HMM).

您可以非常轻松地提取录音的语音和音乐部分,例如:

from pyAudioAnalysis import audioSegmentation as aS [flagsInd, classesAll, acc] = aS.mtFileClassification("data/scottish.wav", "data/svmSM", "svm", True, 'data/scottish.segments')

结果为此图像中的结果