Mar*_*ace 5 performance classification machine-learning
因此,为了评估多标签分类算法(每个实例与多个标签相关联),我同时查看了准确性和F1-Measure。具有:
Accuracy = #Intersection(suggestions,correct_labels) / #Union(suggestions,correct_labels)
F1 Measure = 2 * (P * R) / (P + R)
Run Code Online (Sandbox Code Playgroud)
哪种方法更好,为什么?在什么情况下我应该优先选择另一个?
通常,准确性更容易解释。但F1的信息更丰富。
这在很大程度上取决于您要解决的问题类型以及不同类别的相对重要性。
例如。在 MNIST 数字分类的情况下,您可能期望类别是平衡的(每个类别的示例数量相等),准确度指标非常能代表性能。
但在另一种情况下,例如癌症测试,您可能会发现
在这种情况下,依靠 F1 分数并尝试平衡精确度和召回率比仅关注准确度更有意义。
因此,这实际上取决于每个标签的相对重要性以及您想要优先考虑的内容。如果不考虑问题的实际范围,就什么也说不出来。
归档时间: |
|
查看次数: |
451 次 |
最近记录: |