Wek*_*ver 5 weka confusion-matrix
在 weka 中,我分别看到了“是”类和“否”类的 F 度量。但是使用加权平均 F 度量来比较模型的性能有什么好处呢?请帮我找到答案:)
让我们从一个聪明的例子开始,使用机器学习对文本中的蛋白质相互作用进行分类,其中我们的分类器尝试将句子分为两类:(1)正类(2)负类。正类包含描述蛋白质相互作用的句子,负类包含不描述蛋白质相互作用的句子。作为一名研究人员,我的重点将是我的分类器的积极类别的 F 分数。为什么?因为我有兴趣了解我的分类器对包含蛋白质相互作用的句子进行分类的性能,并且我不关心它对否定句子进行分类的能力。因此,我只会考虑正类的 F 分数。
然而,对于垃圾邮件分类等另一个经典问题,我们的分类器将电子邮件分为两类:(1)火腿邮件和(2)垃圾邮件,情况有点不同。作为一名研究人员,我想知道我的分类器对火腿邮件和垃圾邮件进行分类的能力。那时,我可以独立地或以汇总的方式检查每个班级的 F 分数。火腿邮件和垃圾邮件类别的 F 分数的加权平均值是检查我们的分类器对于这两个类别(在本例中是两个类别,对于多类问题,请阅读全部)的性能的一种方法。因为加权 F 测量只是所有 F 测量的总和,每个 F 测量根据具有特定类标签的实例数量以及两个类进行加权,计算如下:
Weighted F-Measure=((F-Measure for n class X number of instances from n class)+(F-Measure for y class X number of instances from y class))/total instances in dataset.
Run Code Online (Sandbox Code Playgroud)
因此,底线是 - 如果分类对所有类别都很敏感,则使用所有类别的 F 分数的加权平均值。