均方误差 (MSE) 均方根误差 (RMSE)

Mar*_*iro 1 scikit-learn

我正在进行一个研究项目,我使用mean_square_errorfromskelarn来获得我的 MSE 和 RMSE。

我无法理解这些信息的含义。

我正在使用有关房屋销售的数据集,并且我想使用线性回归预测房屋的价格。当我把我的预测价格和实际价格放在一起时,我得到了结果:

MSE:1114197668.6920328 RMSE:33379.59958855158

这些信息究竟意味着什么?我的预测在价格上会有平均差异33379.60吗?

            MSE = mean_squared_error(predict,testSalePrice)
            RMSE = np.sqrt(MSE) 
Run Code Online (Sandbox Code Playgroud)

PV8*_*PV8 5

均方误差

在统计学中,估计器(用于估计未观察量的程序)的均方误差 (MSE) 或均方偏差 (MSD) 测量误差平方的平均值。

例如,让我们假设您有三个数据点:

Price Predicted
1900  2000
2000  2000
2100  2000
Run Code Online (Sandbox Code Playgroud)

那么 MSE 是: 1/3 * ((-100)*(-100)+ (0)*(0) + (100)*(100)) = 1/3 * (20000) = 6000

完美的一个应该是 0,但这你可能达不到。您必须与实际值范围进行比较来解释它。

在这种情况下,RMSE 将是: SQRT(6000) = 77,..

这更难以解释,这意味着您与预测的平均距离为 77,如果您看到三个结果,这是有道理的