Python:对音乐文件执行FFT

Ger*_*rry 5 python signal-processing numpy fft scipy

我试图对我创建的一首歌曲(wav格式的音频文件,大约3分钟)执行FFT,以防万一它是相关的。

ffmpeg -i "$1" -vn -ab 128k -ar 44100 -y -ac 1 "${1%.webm}.wav"
Run Code Online (Sandbox Code Playgroud)

$1webm文件的名称在哪里。

这是应该显示给定文件的FFT的代码:

import numpy as np
import matplotlib.pyplot as plt

# presume file already converted to wav.
file = os.path.join(temp_folder, file_name)

rate, aud_data = scipy.io.wavfile.read(file)

# wav file is mono.
channel_1 = aud_data[:]

fourier = np.fft.fft(channel_1)

plt.figure(1)
plt.plot(fourier)
plt.xlabel('n')
plt.ylabel('amplitude')
plt.show()
Run Code Online (Sandbox Code Playgroud)

问题是,它永远存在。花费了这么长时间,我什至无法显示输出,因为我有足够的时间来研究和撰写这篇文章,但仍然没有完成。

我认为文件太长,因为

print (aud_data.shape)
Run Code Online (Sandbox Code Playgroud)

输出(9218368,),但这看起来像一个现实世界的问题,所以我希望有一种方法可以某种方式获得音频文件的FFT。

我究竟做错了什么?谢谢。

编辑

这个问题的一个更好的表述是:音乐处理中的FFT是否有用?例如2件相似。

正如评论中指出的那样,我的简单方法太慢了。

谢谢。

Pau*_*aul 5

为了显着加快fft分析的速度,您可以将数据补零到 2 的幂:

import numpy as np
import matplotlib.pyplot as plt

# rate, aud_data = scipy.io.wavfile.read(file)
rate, aud_data = 44000, np.random.random((9218368,))

len_data = len(aud_data)

channel_1 = np.zeros(2**(int(np.ceil(np.log2(len_data)))))
channel_1[0:len_data] = aud_data

fourier = np.fft.fft(channel_1)
Run Code Online (Sandbox Code Playgroud)

以下是使用上述方法绘制几个正弦波的傅立叶变换的实部分量的示例:

import numpy as np
import matplotlib.pyplot as plt

# rate, aud_data = scipy.io.wavfile.read(file)
rate = 44000
ii = np.arange(0, 9218368)
t = ii / rate
aud_data = np.zeros(len(t))
for w in [1000, 5000, 10000, 15000]:
    aud_data += np.cos(2 * np.pi * w * t)

# From here down, everything else can be the same
len_data = len(aud_data)

channel_1 = np.zeros(2**(int(np.ceil(np.log2(len_data)))))
channel_1[0:len_data] = aud_data

fourier = np.fft.fft(channel_1)
w = np.linspace(0, 44000, len(fourier))

# First half is the real component, second half is imaginary
fourier_to_plot = fourier[0:len(fourier)//2]
w = w[0:len(fourier)//2]

plt.figure(1)

plt.plot(w, fourier_to_plot)
plt.xlabel('frequency')
plt.ylabel('amplitude')
plt.show()
Run Code Online (Sandbox Code Playgroud)