2 python statistics regression scikit-learn
我正在使用 scikit learn 创建回归模型。现在我想知道如何评估均方误差是否合理或不好?
例如,当我进行交叉验证时,训练数据模型的测试数据的 MSE 为 0.70。分数合理还是不好?
另外,计算模型的整个数据的 MSE 并进行比较并查看分数是否相似是否有意义?
这不是编程问题,但我想知道如何评估价值。我不确定我的方法是否正确。
您应该使用 MSE 或其他回归性能指标(链接)的方式是比较不同的模型(或具有不同超参数的相同模型)。如果你保持数据集不变,那么它会让你了解哪些模型表现更好,哪些模型表现更差。
我建议使用 2 个基准回归模型来始终与您的复杂模型进行比较。如果你无法在测试 MSE(或其他)方面击败这些,那么你就做错了