python从音频文件中提取音频频谱

Question

python从音频文件中提取音频频谱

Mak*_*ich 5 python audio beat-detection

抱歉，如果我提交了副本，但是我想知道python中是否有任何lib使您能够从音频文件中提取声谱。我希望能够获取音频文件并编写算法，该算法将返回一组数据{TimeStampInFile; 频率幅度}。

我听说这通常称为节拍检测，但是据我所知，节拍检测不是一种精确的方法，它仅对可视化有用，而我想对提取的数据进行处理，然后将其转换回音频文件。我不需要实时执行此操作。

我将不胜感激任何建议。

Answer 1

Jos*_*ata 11

您可以使用 scipy 计算和可视化频谱和频谱图，对于这个测试，我使用了这个音频文件：vignesh.wav

from scipy.io import wavfile # scipy library to read wav files
import numpy as np

AudioName = "vignesh.wav" # Audio File
fs, Audiodata = wavfile.read(AudioName)

# Plot the audio signal in time
import matplotlib.pyplot as plt
plt.plot(Audiodata)
plt.title('Audio signal in time',size=16)

# spectrum
from scipy.fftpack import fft # fourier transform
n = len(Audiodata) 
AudioFreq = fft(Audiodata)
AudioFreq = AudioFreq[0:int(np.ceil((n+1)/2.0))] #Half of the spectrum
MagFreq = np.abs(AudioFreq) # Magnitude
MagFreq = MagFreq / float(n)
# power spectrum
MagFreq = MagFreq**2
if n % 2 > 0: # ffte odd 
    MagFreq[1:len(MagFreq)] = MagFreq[1:len(MagFreq)] * 2
else:# fft even
    MagFreq[1:len(MagFreq) -1] = MagFreq[1:len(MagFreq) - 1] * 2 

plt.figure()
freqAxis = np.arange(0,int(np.ceil((n+1)/2.0)), 1.0) * (fs / n);
plt.plot(freqAxis/1000.0, 10*np.log10(MagFreq)) #Power spectrum
plt.xlabel('Frequency (kHz)'); plt.ylabel('Power spectrum (dB)');


#Spectrogram
from scipy import signal
N = 512 #Number of point in the fft
f, t, Sxx = signal.spectrogram(Audiodata, fs,window = signal.blackman(N),nfft=N)
plt.figure()
plt.pcolormesh(t, f,10*np.log10(Sxx)) # dB spectrogram
#plt.pcolormesh(t, f,Sxx) # Lineal spectrogram
plt.ylabel('Frequency [Hz]')
plt.xlabel('Time [seg]')
plt.title('Spectrogram with scipy.signal',size=16);

plt.show()

Run Code Online (Sandbox Code Playgroud)

我测试了所有代码，它可以工作，你需要，numpy、matplotlib 和 scipy。

干杯

Answer 2

DrV*_*DrV 6

我认为您的问题分为三个部分：

如何将音频文件加载到python中？
如何在python中计算频谱？
如何处理频谱？

1.如何在python中加载音频文件？

使用可能是最好的选择scipy，因为它提供了许多信号处理功能。加载音频文件：

import scipy.io.wavfile

samplerate, data = scipy.io.wavfile.read("mywav.wav")

Run Code Online (Sandbox Code Playgroud)

现在，你必须在采样率（样本/秒）samplerate和数据作为numpy.array在data。您可能需要根据应用程序将数据转换为浮点数。

还有一个wave用于加载wav文件的标准python模块，但是numpy/ scipy提供了更简单的界面和更多信号处理选项。

2.如何计算频谱

简要答案：使用FFT。有关更多智慧的话，请参阅：

使用快速傅立叶变换分析音频

更长的答案是很长的。窗口化非常重要，否则您将拥有奇怪的光谱。

3.如何处理频谱

这有点困难。对于较长的信号，滤波通常在时域中执行。也许如果您告诉我们您想要完成什么，那么您会收到一个很好的答案。计算频谱是一回事，在信号处理中获得有意义的结果要复杂得多。

（我知道您没有问过这个问题，但是我看到它的概率为>>0。当然，可能是您对音频信号处理有很好的了解，在这种情况下这是无关紧要的。）

归档时间：	11 年，5 月前
查看次数：	13749 次
最近记录：	6 年，1 月前