如何在没有交叉验证的情况下运行GridSearchCV?

sel*_*yth 7 scikit-learn

我想运行常规的“不带CV的网格搜索”,即我不想交叉验证,但是cv=1不允许设置。

我之所以这样做,是因为我使用分类器来绘制决策边界并可视化/理解我的数据,而不是预测标签,并且不关心泛化错误。我想尽量减少训练错误。

编辑:我想我真的在问两个问题

  1. 如何破解cv=1GridSearchCV?由以下ogrisel回答
  2. 进行网格搜索以最大程度地减少训练错误而不是泛化错误是否有意义?如果是,我该怎么做?我怀疑这涉及为?中的scoring参数插入我自己的评分函数GridSearchCV

ogr*_*sel 7

您可以传递一个实例ShuffleSplit(test_size=0.20, n_splits=1, random_state=0)作为cv参数。

这将对每个参数组合(sklearn.model_selection.ShuffleSplit)进行单个CV拆分。