python中的最小二乘法？

Question

python中的最小二乘法？

Phi*_*ipp 4 python least-squares data-fitting

我有这些价值观：

T_values = (222, 284, 308.5, 333, 358, 411, 477, 518, 880, 1080, 1259) (x values)

Run Code Online (Sandbox Code Playgroud)

C/(3Nk)_values = (0.1282, 0.2308, 0.2650, 0.3120 , 0.3547, 0.4530, 0.5556, 0.6154, 0.8932, 0.9103, 0.9316) (y values)

Run Code Online (Sandbox Code Playgroud)

我知道他们遵循模型：

C/(3Nk)=(h*w/(k*T))**2*(exp(h*w/(k*T)))/(exp(h*w/(k*T)-1))**2

Run Code Online (Sandbox Code Playgroud)

我也知道k=1.38*10**(-23)和h=6.626*10**(-34)。我必须找到最能描述测量数据的w。我想在python中使用最小二乘法来解决这个问题，但是我真的不太了解它是如何工作的。谁能帮我？

Answer 1

pyl*_*ang 7

该答案提供了使用Python确定一般指数模式的拟合参数的演练。

数据清理

首先，让我们将采样数据输入并组织为numpy数组，这将有助于以后的计算和清晰度。

import matplotlib.pyplot as plt
import scipy.optimize as opt
import numpy as np

#% matplotlib inline

# DATA ------------------------------------------------------------------------
T_values = np.array([222, 284, 308.5, 333, 358, 411, 477, 518, 880, 1080, 1259])
C_values = np.array([0.1282, 0.2308, 0.2650, 0.3120 , 0.3547, 0.4530, 0.5556, 0.6154, 0.8932, 0.9103, 0.9316])

x_samp = T_values
y_samp = C_values

Run Code Online (Sandbox Code Playgroud)

scipy和numpy中有许多曲线拟合函数，并且每个函数的用法不同，例如scipy.optimize.leastsq和scipy.optimize.least_squares。为简单起见，我们将使用scipy.optimize.curve_fit，但是如果不选择合理的起始参数很难找到优化的回归曲线。稍后将在选择启动参数时演示一种简单的技术。

选择初始参数

利用后一种趋势，让我们接下来看一下数据，并尝试通过调整这些参数来模拟曲线。为了演示，我们针对我们的数据绘制了几个试验方程式：

# SURVEY ----------------------------------------------------------------------
# Plotting Sampling Data
plt.plot(x_samp, y_samp, "ko", label="Data")

x_lin = np.linspace(0, x_samp.max(), 50)                   # a number line, 50 evenly spaced digits between 0 and max

# Trials
A, c, d = -1, -1e-2, 1
y_trial1 = func(x_lin,  A,     c, d)
y_trial2 = func(x_lin, -1, -1e-3, 1)
y_trial3 = func(x_lin, -1, -3e-3, 1)

plt.plot(x_lin, y_trial1, "--", label="Trial 1")
plt.plot(x_lin, y_trial2, "--", label="Trial 2")
plt.plot(x_lin, y_trial3, "--", label="Trial 3")
plt.legend()

Run Code Online (Sandbox Code Playgroud)

通过简单的反复试验，我们可以更好地近似曲线的形状，幅度，位置和方向。例如，我们知道前两个参数（A和c）必须为负。我们还对的数量级有一个合理的猜测c。

计算估计参数

现在，我们将使用最佳试验的参数进行初步猜测：

# REGRESSION ------------------------------------------------------------------
p0 = [-1, -3e-3, 1]                                        # guessed params
w, _ = opt.curve_fit(func, x_samp, y_samp, p0=p0)     
print("Estimated Parameters", w)  

# Model
y_model = func(x_lin, *w)

# PLOT ------------------------------------------------------------------------
# Visualize data and fitted curves
plt.plot(x_samp, y_samp, "ko", label="Data")
plt.plot(x_lin, y_model, "k--", label="Fit")
plt.title("Least squares regression")
plt.legend(loc="upper left")

# Estimated Parameters [-1.66301087 -0.0026884   1.00995394]

Run Code Online (Sandbox Code Playgroud)

这是如何运作的？

curve_fit是scipy提供的许多优化功能之一。在给定初始值的情况下，对所得的估计参数进行迭代优化，以使所得的曲线最大程度地减少残留误差或拟合线与采样数据之间的差异。更好的猜测减少了迭代次数并加快了结果。利用这些拟合曲线的估计参数，现在可以计算特定方程式的特定系数（OP的最后一项练习）。

归档时间：	9 年，1 月前
查看次数：	15220 次
最近记录：	6 年，10 月前

python中的最小二乘法？

数据清理

评论

选择初始参数

计算估计参数

这是如何运作的？