机器学习中的“平均”f1 分数是什么?

Ash*_*y K 1 performance classification machine-learning kaggle

我知道使用精度和召回率的 f1 分数。但是,平均 f1 分数中的“平均”是什么?我们何时使用它以及如何计算“平均值”?

编辑以明确解释我的问题:我知道 f1 分数是精度和召回率的调和平均值。而在计算 f1 score 时,需要多个分类结果来计算精度和召回率。

例如,如果我们有一个由 1000 个实例组成的数据集,我们可以得到 1000 个分类结果。然后我们把它放到列联表中,这样我们就可以计算出 f1 分数。

现在这就是我对“平均”f1 分数感到困惑的一点。我们从列联表计算 f1 分数,但什么是“均值”?只有我可以计算的是 f1 分数,那么什么是“均值”以及如何计算“均值”f1 分数?

ITi*_*ger 5

F1 分数是衡量二元分类任务测试准确率的指标。在多标签分类任务中,每个文档都有一个 F1 分数。因此,平均 F1 分数为:

其中 N 是训练集的行大小