我有两个数据点列表:
list_x = [-10, -9, -8, -7, -6, -5, -4, -3, -2, -1, 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49]
list_y = [1, 1, 1, 2, 2, 2, 2, 3, 3, 3, 4, 4, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 4, 4, 4, 4, 3, 3, 3, 3, 3, 3, 2, 2, 2, 2, 2, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1]
Run Code Online (Sandbox Code Playgroud)
当我绘制它们时,图形将如下所示:
import matplotlib.pyplot as plt
plt.plot(list_x, list_y)
plt.show()
Run Code Online (Sandbox Code Playgroud)
基于这些数据点,是否有一种方法可以使图看起来像下面的图并获得其图方程?
================================================== =========
我从这里尝试过使用解决方案,它会产生不平滑的图形。
from scipy.interpolate import spline
import numpy as np
list_x_new = np.linspace(min(list_x), max(list_x), 1000)
list_y_smooth = spline(list_x, list_y, list_x_new)
plt.plot(list_x_new, list_y_smooth)
plt.show()
Run Code Online (Sandbox Code Playgroud)
这里还有 3 个曲线平滑选项:
但首先,重新创建原始情节:
import matplotlib.pyplot as plt
list_x = [-10, -9, -8, -7, -6, -5, -4, -3, -2, -1, 0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49]
list_y = [1, 1, 1, 2, 2, 2, 2, 3, 3, 3, 4, 4, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 5, 4, 4, 4, 4, 3, 3, 3, 3, 3, 3, 2, 2, 2, 2, 2, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1]
plt.plot(list_x, list_y)
plt.show()
Run Code Online (Sandbox Code Playgroud)
Savitzky -Golay技术使用最小二乘法将相邻点的子集(窗口)拟合为低阶多项式。
如何应用 Savitzky-Golay 过滤器:
from scipy.signal import savgol_filter
window = 21
order = 2
y_sf = savgol_filter(list_y, window, order)
plt.plot(list_x, y_sf)
plt.show()
Run Code Online (Sandbox Code Playgroud)
window和参数order意味着该过滤器具有很强的适应性。
在scipy 文档中阅读有关使用此过滤器的更多信息。
LOWESS(局部加权散点图平滑)是一种局部回归方法。根据我的经验,它调整起来很简单,而且通常会产生很好的结果。
如何使用 LOWESS 平滑剂:
import statsmodels.api as sm
y_lowess = sm.nonparametric.lowess(list_y, list_x, frac = 0.30) # 30 % lowess smoothing
plt.plot(y_lowess[:, 0], y_lowess[:, 1])
plt.show()
Run Code Online (Sandbox Code Playgroud)
可以通过改变参数来改进近似值frac,该参数是估计每个 y 值时使用的数据的分数。增加该frac值可增加平滑量。该frac值必须介于 0 和 1 之间。
有关statsmodels lowess 用法的更多详细信息。
应用 lfilter 后:
from scipy.signal import lfilter
n = 15 # larger n gives smoother curves
b = [1.0 / n] * n # numerator coefficients
a = 1 # denominator coefficient
y_lf = lfilter(b, a, list_y)
plt.plot(list_x, y_lf)
plt.show()
Run Code Online (Sandbox Code Playgroud)
检查scipy lfilter 文档,了解有关如何在差分方程中使用分子和分母系数的实现细节。
scipy.signal 包中还有其他过滤器。
必须小心避免所有这些方法过度平滑。
此外,其中一些方法可能会产生意想不到的边缘效应。
与戴维斯·赫林(Davis Herring)的建议相呼应的一个简单选择是对数据使用多项式逼近
import numpy as np
import matplotlib.pyplot as plt
plt.figure()
poly = np.polyfit(list_x,list_y,5)
poly_y = np.poly1d(poly)(list_x)
plt.plot(list_x,poly_y)
plt.plot(list_x,list_y)
plt.show()
Run Code Online (Sandbox Code Playgroud)
您会注意到图的右端的振荡没有出现在原始数据中,这是多项式逼近的产物。
戴维斯上面建议的样条插值是另一个不错的选择。s更改平滑度参数,可以在平滑度和到原始数据的距离之间实现不同的平衡。
from scipy.interpolate import splrep, splev
plt.figure()
bspl = splrep(list_x,list_y,s=5)
bspl_y = splev(list_x,bspl)
plt.plot(list_x,list_y)
plt.plot(list_x,bspl_y)
plt.show()
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
7774 次 |
| 最近记录: |