计算分类准确度的最佳方法是什么?

Sim*_*ful 3 math statistics machine-learning probability neural-network

我知道计算分类精度的一个公式是X = t/n*100(其中t是正确分类的数量,n是样本的总数.)

但是,假设我们共有100个样本,A类80个,B类10个,C类10个.

情景1:所有100个样本都被分配到A类,通过使用公式,我们得到的准确度等于80%.

场景2:属于B的10个样本被正确地分配给B类;属于C的10个样本也被正确地分配给C类; 30个样本属于A,正确分配给A类; 其余50个属于A的样本被错误地分配给C.使用该公式,我们得到50%的准确度.

我的问题是:

1:我们可以说场景1的准确率高于场景2吗?

2:有没有办法计算分类问题的准确率?

非常感谢!

Kev*_*ham 12

分类准确度定义为"正确预测的百分比".无论课程数量多少都是如此.因此,场景1具有比场景2更高的分类准确度.

然而,听起来你真正要求的是另一种评估指标或流程"奖励"方案2,仅用于制造某些类型的错误.我有两个建议:

  1. 创建一个混淆矩阵:它描述了分类器的性能,以便您可以看到分类器正在进行哪些类型的错误.
  2. 计算每个班级的精确度,召回率和F1分数.F1平均分数可能是您要查找的单数字指标.

即使您不是scikit-learn用户,scikit-learn文档的Classification metrics部分也有很多关于分类器评估的好信息.