小编Ash*_*y K的帖子

机器学习中的“平均”f1 分数是什么?

我知道使用精度和召回率的 f1 分数。但是,平均 f1 分数中的“平均”是什么?我们何时使用它以及如何计算“平均值”?

编辑以明确解释我的问题:我知道 f1 分数是精度和召回率的调和平均值。而在计算 f1 score 时,需要多个分类结果来计算精度和召回率。

例如,如果我们有一个由 1000 个实例组成的数据集,我们可以得到 1000 个分类结果。然后我们把它放到列联表中,这样我们就可以计算出 f1 分数。

现在这就是我对“平均”f1 分数感到困惑的一点。我们从列联表计算 f1 分数,但什么是“均值”?只有我可以计算的是 f1 分数,那么什么是“均值”以及如何计算“均值”f1 分数?

performance classification machine-learning kaggle

1
推荐指数
1
解决办法
1486
查看次数

为什么我们使用相关系数进行特征选择?

我正在学习特征选择。我发现了这一点,并看到许多内核检查相关系数矩阵。(在上面的链接中,他们介绍了 3 种特征选择方法,首先是过滤方法,包括相关系数和卡方检验。)

为什么我们可以使用相关系数进行特征选择?

我认为它只能表示 2 个变量之间的线性关系,因此它不能表示 2 个或多个变量的组合或非线性关系的影响。

所以我想知道相关系数是否适用于特征选择。为什么以及如何将其用于特征选择?

machine-learning feature-selection

1
推荐指数
1
解决办法
1527
查看次数