如何使用 sklearn 的 GridSearchCV 设置自己的评分以进行回归？

Question

如何使用 sklearn 的 GridSearchCV 设置自己的评分以进行回归？

wil*_*ark 4 python regression scoring scikit-learn gridsearchcv

我曾经使用 GridSearchCV(...scoring="accuracy"...) 进行分类模型。现在我将使用 GridSearchCV 作为回归模型并使用自己的误差函数设置评分。

示例代码：

def rmse(predict, actual):
    predict = np.array(predict)
    actual = np.array(actual)

    distance = predict - actual

    square_distance = distance ** 2

    mean_square_distance = square_distance.mean()

    score = np.sqrt(mean_square_distance)

    return score

rmse_score = make_scorer(rmse)

gsSVR = GridSearchCV(...scoring=rmse_score...)
gsSVR.fit(X_train,Y_train)
SVR_best = gsSVR.best_estimator_
print(gsSVR.best_score_)

Run Code Online (Sandbox Code Playgroud)

但是，我发现这种方式在错误分数最高时返回参数集。结果，我得到了最差的参数集和分数。在这种情况下，我怎样才能得到最好的估计器和分数？

概括：

分类 -> GridSearchCV(scoring="accuracy") -> best_estimaor...best

回归 -> GridSearchCV(scroing=rmse_score) -> best_estimator...worst

Answer 1

Viv*_*mar 7

从技术上讲，这是一个损失越低越好。您可以打开该选项make_scorer：

Greater_is_better : boolean, default=True score_func 是得分函数（默认），表示高是好的，还是损失函数，表示低是好的。在后一种情况下，scorer 对象将对 score_func 的结果进行符号翻转。

您还需要将输入的顺序从更改为rmse(predict, actual)，rmse(actual, predict)因为这是 GridSearchCV 传递它们的顺序。所以最终的得分手将是这样的：

def rmse(actual, predict):

    ...
    ...
    return score

rmse_score = make_scorer(rmse, greater_is_better = False)

Run Code Online (Sandbox Code Playgroud)

@willPark 是的。只需反转该符号即可获得实际损失值。没有什么不同。它只是以这种方式设计，以便单个逻辑可以处理两种类型的值（分数和损失）。 (2认同)

归档时间：	7 年，2 月前
查看次数：	3750 次
最近记录：	7 年，1 月前