scipy.stats.linregress 中标准误差的定义

Gab*_*iel 8 python scipy

我正在使用scipy.stats.linregress函数对一些二维数据进行简单的线性回归,例如:

from scipy import stats
x = [5.05, 6.75, 3.21, 2.66]
y = [1.65, 26.5, -5.93, 7.96]
gradient, intercept, r_value, p_value, std_err = stats.linregress(x,y)
Run Code Online (Sandbox Code Playgroud)

该函数的文档指出std_err

估计的标准误差

我不确定这意味着什么。这个旧答案说它代表“梯度线的标准误差”,但这“并不总是这个库的行为”。

我能得到这个参数究竟代表什么的精确定义吗?

spa*_*per 5

截至 2016 年 12 月,我认为它仍然显示 OLS 回归线斜率的标准误差。我使用正交距离回归作为 scipy 包的一部分计算了一些数据集的回归,并且输出 sd_beta[1](代表回归线斜率的标准误差)与scipy.stats.linregressstd_err计算的非常相似。


Jam*_*gle 3

这是统计学中的标准度量。有关如何计算它的描述,请参阅维基百科。不幸的是,stackoverflow 似乎没有 LaTeX 支持,所以在这里写出并解释方程没有意义。

本质上,std_err应该为梯度中表示的每个系数给出一个值。简而言之,std_err告诉您梯度对于数据的拟合程度如何(值越高意味着精度越低)。

stats.stackexchange 网站上的其他有用答案位于此处此处