GridSearchCV 最终模型

Joh*_*. M 3 python machine-learning scikit-learn

如果我GridSearchCV在 scikit-learn 库中使用找到最佳模型,它返回的最终模型是什么?也就是说,对于每组超参数,我们训练 CV(例如 3 个)模型的数量。这样,函数是否会返回这 3 个模型中最好的模型以进行最佳参数设置?

Yil*_*ang 6

GridSearchCV会返回一个对象,具有相当多的信息。它确实返回在遗漏数据上表现最好的模型:

best_estimator_ : 估算器或字典

通过搜索选择的估计量,即对遗漏数据给出最高分(或最小损失,如果指定)的估计量。如果 refit=False,则不可用。

请注意,这不是在整个数据上训练的模型。这意味着,一旦您确信这是您想要的模型,您就需要自己在整个数据上重新训练模型。

参考:http : //scikit-learn.org/stable/modules/generated/sklearn.model_selection.GridSearchCV.html

  • 仅供参考,假设您没有设置`refit=False`,则不必重新训练模型。GridSearchCV 会为你完成这一步,并通过`.predict` 和`.score` 正常公开最终的训练模型。见 https://datascience.stackexchange.com/questions/45810/what-is-gridsearchcv-doing-after-it-finishes-evaluating-the-performance-of-param/45817 (2认同)