这是我的问题的简要描述:
我绘制了几个分类器的ROC图,并且都表现出很好的AUC,这意味着分类很好.但是,当我测试分类器并计算f-measure时,我得到一个非常低的值.我知道这个问题是由数据集的类偏度引起的,到现在为止,我发现了两个处理它的选项:
我选择了第一个选项,解决了我的问题(f-measure令人满意).但是,现在,我的问题是:哪种方法更可取?有什么区别?
PS:我正在使用Python和scikit-learn库.
python r classification machine-learning
classification ×1
machine-learning ×1
python ×1
r ×1