statsmodels的数学背景wls_prediction_std

Luk*_*kas 4 python statsmodels

wls_prediction_std返回我拟合模型数据的标准偏差和置信区间.我需要知道从协方差矩阵计算置信区间的方式.(我已经尝试通过查看源代码来解决这个问题,但却无法做到)我希望你们中的一些人可以通过写出wls_prediction_std背后的数学表达来帮助我.

Jos*_*sef 7

任何教科书都应该有一个变化,没有权重.

对于OLS,Greene(我使用的第5版)有

se = s^2 (1 + x (X'X)^{-1} x')

其中s ^ 2是残差方差的估计,x是我们想要预测的向量或解释变量,是X估计中使用的解释变量.

这是观察的标准误差,仅第二部分是预测平均值的标准误差y_predicted = x beta_estimated.

wls_prediction_std 直接使用参数估计的方差.

假设x是固定的,那么y_predicted只是随机变量的线性变换beta_estimated,所以方差y_predicted就是

x Cov(beta_estimated) x'

为此,我们仍然需要添加误差方差的估计值.

据我记忆,估计有更好的小样本属性.

我添加了权重,但从未设法验证它们,因此该功能已保留在沙箱中多年.(Stata不会返回带权重的预测误差.)

在旁边:

如果我们使用夹心鲁棒协方差估计器,则使用参数估计的协方差也应该是正确的,而上面的Greene公式只有在我们没有任何错误指定的异方差性时才是正确的.

什么wls_prediction_std也没有考虑到的是,如果我们有异方差模型,则误差方差也依赖于解释变量,即x上.