numpy.polyfit的错误是什么?

var*_*tir 26 python numpy curve-fitting

我想numpy.polyfit用于物理计算,因此我需要误差的大小.

Jai*_*ime 28

如果您full=True在通话中指定polyfit,它将包含额外信息:

>>> x = np.arange(100)
>>> y = x**2 + 3*x + 5 + np.random.rand(100)
>>> np.polyfit(x, y, 2)
array([ 0.99995888,  3.00221219,  5.56776641])
>>> np.polyfit(x, y, 2, full=True)
(array([ 0.99995888,  3.00221219,  5.56776641]), # coefficients
 array([ 7.19260721]), # residuals
 3, # rank
 array([ 11.87708199,   3.5299267 ,   0.52876389]), # singular values
 2.2204460492503131e-14) # conditioning threshold
Run Code Online (Sandbox Code Playgroud)

返回的剩余值是拟合误差的平方和,不确定这是否是您所追求的:

>>> np.sum((np.polyval(np.polyfit(x, y, 2), x) - y)**2)
7.1926072073491056
Run Code Online (Sandbox Code Playgroud)

在版本1.7中,还有一个cov关键字将返回系数的协方差矩阵,您可以使用它来计算拟合系数本身的不确定性.

  • 你知道吗?np.polyfit是否使用TLS(最小二乘法也称为正交最小二乘法)或OLS(普通最小二乘法)来找到最合适的? (3认同)

ask*_*han 21

正如您在文档中看到的那样:

Returns
-------
p : ndarray, shape (M,) or (M, K)
    Polynomial coefficients, highest power first.
    If `y` was 2-D, the coefficients for `k`-th data set are in ``p[:,k]``.

residuals, rank, singular_values, rcond : present only if `full` = True
    Residuals of the least-squares fit, the effective rank of the scaled
    Vandermonde coefficient matrix, its singular values, and the specified
    value of `rcond`. For more details, see `linalg.lstsq`.
Run Code Online (Sandbox Code Playgroud)

这意味着如果你可以做一个拟合并得到残差:

 import numpy as np
 x = np.arange(10)
 y = x**2 -3*x + np.random.random(10)

 p, res, _, _, _ = numpy.polyfit(x, y, deg, full=True)
Run Code Online (Sandbox Code Playgroud)

然后,这p是你的拟合参数,并且res将是残差,如上所述.这_是因为你不需要保存最后三个参数,所以你可以将它们保存在_你不会使用的变量中.这是一种惯例,不是必需的.


@ Jaime的答案解释了剩余意味着什么.你可以做的另一件事是将那些平方偏差看作一个函数(其总和是res).这对于看到不适合的趋势特别有用. res由于统计噪声或可能系统性差拟合,可能很大,例如:

x = np.arange(100)
y = 1000*np.sqrt(x) + x**2 - 10*x + 500*np.random.random(100) - 250

p = np.polyfit(x,y,2) # insufficient degree to include sqrt

yfit = np.polyval(p,x)

figure()
plot(x,y, label='data')
plot(x,yfit, label='fit')
plot(x,yfit-y, label='var')
Run Code Online (Sandbox Code Playgroud)

所以在图中,请注意附近的不合适x = 0:
polyfit