多元回归系数的标准误差

Car*_*a_G 6 python linear-regression scikit-learn

我使用sklearn.linear_model.LinearRegression进行了多元回归并获得了回归系数:

    import numpy as np
    from sklearn import linear_model
    clf = linear_model.LinearRegression()
    TST = np.vstack([x1,x2,x3,x4])
    TST = TST.transpose()
    clf.fit (TST,y)
    clf.coef_
Run Code Online (Sandbox Code Playgroud)

现在,我需要这些相同系数的标准误差.我怎样才能做到这一点?非常感谢.

Kyl*_*own 5

基于这个统计问题维基百科,我最好的猜测是:

MSE = np.mean((y - clf.predict(TST).T)**2)
var_est = MSE * np.diag(np.linalg.pinv(np.dot(TST.T,TST)))
SE_est = np.sqrt(var_est)
Run Code Online (Sandbox Code Playgroud)

然而,我的线性代数和统计数据都很差,所以我可能会遗漏一些重要的东西。另一种选择可能是引导方差估计。