GridSearchCV,数据框各部分中每个类的表示

Aha*_*mad 1 python grid-search

我必须做一个多类分类(3)。我使用搜索最佳分类器参数GridSearchCV

但是我有一个不平衡x_train(和x_test):0代表3079个实例,1代表12个实例,3代表121个实例。

我有这个错误:

目标是多类的average='binary'。请选择其他平均设置。

我认为此错误来自拆分,当拆分时,x_train我们没有每个部分的每个类。您是否有针对每个部分中代表的每个类的解决方案?谢谢。

Viv*_*mar 5

不,这来自传递给的评分函数GridSearchCV(....., scoring=SOME_METRIC... )。请显示那部分。

如果它是其中之一,并且分类任务是多类,则它们将无法工作:

  • 'f1'
  • '召回'
  • '精确'

然后,您需要提供average参数。

因此,如果您当前正在使用以下得分:

GridSearchCV(....., scoring='f1'... )
Run Code Online (Sandbox Code Playgroud)

然后,您需要像这样附加“微”,“宏”或“加权”之一:

GridSearchCV(....., scoring='f1_micro'... )
Run Code Online (Sandbox Code Playgroud)

相同于precisionrecall

有关更多详细信息,请参见此页面:http : //scikit-learn.org/stable/modules/model_evaluation.html#the-scoring-parameter-defining-model-evaluation-rules

如果您使用其他工具,请显示代码。