Python 中的快速傅立叶变换

ror*_*ory 7 python numpy fft

我是傅立叶理论的新手,我看过关于如何将 fft 应用于信号并绘制它以查看它包含的频率的非常好的教程。不知何故,他们所有人都创建了混合正弦作为他们的数据,我无法将其适应我的真正问题。

我每天有 242 次每小时观察,这意味着我的周期是 24。所以我希望在我的 fft 图中有一个大约 24 的峰值。

我的 data.csv 示例在这里:https ://pastebin.com/1srKFpJQ

绘制的数据:

该系列

我的代码:

data = pd.read_csv('data.csv',index_col=0)
data.index = pd.to_datetime(data.index)
data = data['max_open_files'].astype(float).values

N = data.shape[0] #number of elements
t = np.linspace(0, N * 3600, N) #converting hours to seconds
s = data

fft = np.fft.fft(s)
T = t[1] - t[0]

f = np.linspace(0, 1 / T, N)
plt.ylabel("Amplitude")
plt.xlabel("Frequency [Hz]")
plt.bar(f[:N // 2], np.abs(fft)[:N // 2] * 1 / N, width=1.5)  # 1 / N is a normalization factor
plt.show()

Run Code Online (Sandbox Code Playgroud)

这输出了一个非常奇怪的结果,似乎我对每个频率都得到了相同的值。

结果

我想问题出在 N、t 和 T 的定义上,但我在网上找不到任何可以帮助我清楚地理解这一点的内容。请帮忙 :)

编辑1:

使用查尔斯回答提供的代码,我在 0 附近有一个尖峰,这看起来很奇怪。我已经使用rfftrfftfreq来避免频率过多。

频率

我读过这可能是因为该系列的直流分量,所以在减去平均值后我得到:

减去直流分量频率

我无法解释这一点,尖峰似乎周期性地发生,但以 Hz 为单位的值不允许我获得我的 24 值(总频率)。有谁知道如何解释这个?我错过了什么?

cha*_*id1 7

您看到的问题是因为条形太宽了,而您只能看到一个条形。您必须将条形的宽度更改为 0.00001 或更小才能看到它们。

不要使用条形图,而是使用 x 轴fftfreq = np.fft.fftfreq(len(s)),然后使用 plot 函数plt.plot(fftfreq, fft)

import matplotlib.pyplot as plt
import pandas as pd
import numpy as np

data = pd.read_csv('data.csv',index_col=0)
data.index = pd.to_datetime(data.index)
data = data['max_open_files'].astype(float).values

N = data.shape[0] #number of elements
t = np.linspace(0, N * 3600, N) #converting hours to seconds
s = data

fft = np.fft.fft(s)
fftfreq = np.fft.fftfreq(len(s))

T = t[1] - t[0]

f = np.linspace(0, 1 / T, N)
plt.ylabel("Amplitude")
plt.xlabel("Frequency [Hz]")
plt.plot(fftfreq,fft)
plt.show()
Run Code Online (Sandbox Code Playgroud)