在 scikit learn 中实现自定义损失函数

Moo*_*sha 9 python machine-learning scikit-learn data-science gridsearchcv

我想在 scikit learn 中实现自定义损失函数。我使用以下代码片段:

def my_custom_loss_func(y_true,y_pred):
   diff3=max((abs(y_true-y_pred))*y_true)
   return diff3

score=make_scorer(my_custom_loss_func,greater_ is_better=False)
clf=RandomForestRegressor()
mnn= GridSearchCV(clf,score)
knn = mnn.fit(feam,labm) 
Run Code Online (Sandbox Code Playgroud)

传入的参数应该是什么my_custom_loss_func?我的标签矩阵称为labm. 我想计算实际输出和预测输出(通过模型)乘以真实输出之间的差异。如果我用labm代替y_true,我应该用什么代替y_pred

bir*_*dmw 17

好的,这里发生了 3 件事:

1) 训练时有一个损失函数用于调整模型参数

2)有一个评分函数用于判断你的模型的质量

3) 有超参数调整,它使用评分函数来优化您的超参数。

所以......如果你试图调整超参数,那么你就在为此目的定义“损失 fxn”的正确轨道上。但是,如果您试图调整整个模型以在召回测试中表现良好,那么您需要召回优化器作为训练过程的一部分。这很棘手,但你可以做到......

1)打开你的分类器。例如,让我们使用 RFC:https : //scikit-learn.org/stable/modules/generated/sklearn.ensemble.RandomForestClassifier.html

2)点击【来源】

3) 看看它是如何从 ForestClassifier 继承的?就在类定义中。单击该词可跳转到其父定义。

4) 看看这个新对象是如何从 ClassifierMixin 继承的?单击那个。

5) 看看 ClassifierMixin 类的底部是怎么说的?

from .metrics import accuracy_score
return accuracy_score(y, self.predict(X), sample_weight=sample_weight)
Run Code Online (Sandbox Code Playgroud)

那是您的模型正在接受准确性培训。如果要将模型训练为“召回模型”或“精确模型”或任何模型,则此时需要注入。这个准确度指标被烘焙到 SKlearn 中。有一天,一个比我更好的人会把它作为模型接受的参数,但与此同时,你必须进入你的 sklearn 安装,并调整这个accuracy_score 为你想要的任何东西。

祝你好运!

  • 今天仍然如此吗? (4认同)

小智 4

make_scorer 的文档如下:

sklearn.metrics.make_scorer(score_func, greater_is_better=True, needs_proba=False, 
needs_threshold=False, **kwargs)
Run Code Online (Sandbox Code Playgroud)

因此,它不需要您在调用函数时传递参数。这是你问的吗?