良好的ROC曲线但精确回忆曲线较差

Kub*_*888 9 machine-learning performance-testing roc scikit-learn precision-recall

我有一些我不太了解的机器学习结果.我正在使用python sciki-learn,拥有大约14个功能的200多万个数据.对于精确回忆曲线,'ab'的分类看起来非常差,但是Ab的ROC看起来和大多数其他群体的分类一样好.有什么可以解释的?

在此输入图像描述

在此输入图像描述

Cal*_*imo 13

阶级不平衡.

与ROC曲线不同,PR曲线对不平衡非常敏感.如果针对不平衡数据优化分类器以获得良好的AUC,则可能会获得较差的精确回忆结果.