我知道Precision的概念以及Recall的概念.但我发现很难理解"阈值"的概念,它可以使任何PR曲线成为可能.
想象一下,我有一个模型可以预测患者在相关特征上使用一些不错的分类算法来重现(是或否)癌症.我将数据拆分用于培训和测试.假设我使用列车数据训练模型,并使用测试数据获得我的精确度和召回度量.
但我现在如何绘制PR曲线?在什么基础上?我只有两个值,一个精度和一个召回.我读到它的"阈值",它允许你获得几个精确回忆对.但那个门槛是多少?我还是初学者,我无法理解门槛的概念.
我在如此多的分类模型比较中看到,如下所示.但他们如何得到那么多对呢?
classification machine-learning auc precision-recall model-comparison