sklearn LinearRegression 中的 coef_ 到底是什么？以及如何解释其中的公式

Question

sklearn LinearRegression 中的 coef_ 到底是什么？以及如何解释其中的公式

lmb*_*loo 4 python machine-learning scikit-learn

当我在 sklearn 中使用 LinearRegression 时，我会这样做

m = 100
X = 6*np.random.rand(m,1)-3
y = 0.5*X**2 + X+2 + np.random.randn(m,1)
lin_reg = LinearRegression()
lin_reg.fit(X,y)
y_pred_1 = lin_reg.predict(X)
y_pred_1 = [_[0] for _ in y_pred_1]

Run Code Online (Sandbox Code Playgroud)

当我绘制 (X,y) 和 (X, y_pred_1) 时，它似乎是正确的。

我想通过以下方式创建最佳拟合线的公式：

y= (lin_reg.coef_)x + lin_reg.intercept_

我手动将值插入到使用 coef_、intercept_ 得到的公式中，并将其与 lin_reg.predict(value) 的预测值进行比较，它们是相同的，因此 lin_reg.predict 实际上使用了我上面使用 coef 制作的公式，截距。

我的问题是如何创建简单多项式回归的公式？

我会做

poly_features = PolynomialFeatures(degree=2, include_bias=False)
X_poly_2 = poly_features.fit_transform(X)

poly_reg_2 = LinearRegression()
poly_reg_2.fit(X_poly_2, y)

Run Code Online (Sandbox Code Playgroud)

然后poly_reg_2.coef_给我array([[0.93189329, 0.43283304]])和poly_reg_2.intercept_ = array([2.20637695])。

由于它是“简单”多项式回归，它应该看起来像

y = x^2 + x + b 其中 x 是相同的变量。

哪poly_reg_2.coef_一个是 x^2 哪一个不是？

Answer 1

lmb*_*loo 5

感谢https://www.youtube.com/watch?v=Hwj_9wMXDVo我获得了见解并找到了如何解释多项式回归的公式。

所以poly_reg_2.coef_ = array([[0.93189329, 0.43283304]])

你知道简单的线性回归看起来像
y = b + m1x

那么 2 次多项式回归看起来像
y = b + m1x + m2(x^2)

和 3 度：
y = b + m1x + m2(x^2) + m3(x^3)

依此类推...所以对于我的情况，两个系数只是按顺序排列的 m1 和 m2 。

所以最后我的公式变成：

y = b + 0.93189329x + 0.43283304(x^2)。

归档时间：	5 年，11 月前
查看次数：	3312 次
最近记录：	5 年，11 月前