Sri*_*riK 3 statistics machine-learning false-positive roc
ROC 曲线绘制了 TPR 与 FPR 的关系,并根据训练集概率的排列顺序改变阈值。选择的阈值是与左上角最左上角的点相关的概率。这基本上最大化了 TPR 并最小化了误报率。
但是,可以说我的应用程序谈到了最小化假阴性率吗?那么这条曲线会如何变化呢?两者之间的平衡如何?
小智 6
在我看来,您有点误解什么是 ROC 曲线。
ROC 曲线绘制了随阈值变化的 TPR 与 FPR。因此,ROC 曲线实际上是 3 维图,绘制了 3 个变量之间的关系:FPR、TPR 和阈值。图表上的每个点都反映了特定阈值的实际 TPR 和 FPR。图形的左下角始终反映阈值 1,而右上角反映阈值 0。
ROC 曲线有两个常用用途:比较两个独立于阈值的不同模型,以及帮助选择合适的阈值。预测分析应用程序的“适当阈值”将根据您正在攻击的特定问题而有很大差异,但通常,您可以使用 ROC 曲线为您的特定应用程序选择一个具有可接受的 TPR/FPR 折衷的阈值. 简单地选择最靠近左上角的点的阈值很少会给出理想的结果。
一旦您从 ROC 曲线中选择了一个看起来很理想的阈值,您就可以调查混淆矩阵和其他评估指标(精度、召回率、准确率、F1 等)以进一步评估阈值。
要回答您的直接问题,ROC 曲线不直接显示 FNR 是正确的。在这种情况下,您可能需要使用灵敏度/特异性图,该图以类似于 ROC 曲线的方式绘制 TPR 与 TNR。我知道没有标准的评估方法可以直接查看 FNR。相反,我通常只是在我的数据中切换“正”和“负”标签并重新绘制 ROC 曲线。这给出(有效)TNR 与 FNR。