二进制向量作为roc_curve的y_score参数

Chr*_*ski 5 roc scikit-learn

sklearn roc_curve docstring声明:

"y_score:array,shape = [n_samples]目标分数,可以是正类的概率估计,置信度值或二元决策."

在什么情况下将y_score设置为二进制向量("二元决策")是有意义的?这不会导致一个ROC曲线上有一个点,哪一种无视这一点?

mba*_*rov 4

如果您使用的分类器不输出概率分数(例如svm.SVC,没有显式probability=True),则无法计算 ROC 曲线。作为一名 API 设计者,您有两种选择:引发异常并向用户提供任何有用信息,或者使用一个数据点绘制一条简并曲线。我认为后者更有用。

  • 实际上,我们有一个学生生成了那些退化的 ROC 曲线,计算了 AUC,并认为一切都很好。我倾向于提出例外。 (2认同)