use*_*663 2 audio signal-processing speech
我想确定音频文件的哪个部分包含语音或音乐.
我希望有人有这样的东西,或者可以告诉我从哪里开始.你能否建议一些方法/教程来做同样的事情.
谢谢.
小智 5
查看pyAudioAnalysis python库.其中,它具有预训练的语音分类器和两种分段分类方法(一种基于固定大小的窗口,另一种基于HMM).
您可以非常轻松地提取录音的语音和音乐部分,例如:
from pyAudioAnalysis import audioSegmentation as aS
[flagsInd, classesAll, acc] = aS.mtFileClassification("data/scottish.wav", "data/svmSM", "svm", True, 'data/scottish.segments')
结果为此图像中的结果