如何使用 F-score 作为误差函数来训练神经网络？

Question

如何使用 F-score 作为误差函数来训练神经网络？

Ari*_*dam 5 python precision-recall tensorflow loss-function

我对神经网络很陌生。我正在 tensorflow 中训练一个网络，但是在我的数据集（它是一个医学数据集）中，正例的数量远远少于负例。所以，我知道根据精度和召回率计算的 F 分数是衡量模型训练效果的一个很好的衡量标准。我之前使用过交叉熵损失或 MSE 之类的误差函数，但它们都是基于准确度计算的（如果我没记错的话）。但是我如何使用这个 F-score 作为误差函数呢？是否有 tensorflow 函数？或者我必须创建一个新的？

提前致谢。

Answer 1

Jin*_*ing 6

似乎已经设计并成功使用了直接针对这些类型的指标进行优化的方法，从而提高了评分和/或训练时间：

https://www.kaggle.com/c/human-protein-atlas-image-classification/discussion/77289

https://www.kaggle.com/c/human-protein-atlas-image-classification/discussion/70328

https://www.kaggle.com/rejpalcz/best-loss-function-for-f1-score-metric

一种这样的方法涉及使用概率的总和来代替计数，用于真阳性、假阳性和假阴性度量的集合。例如，F-beta 损失（F1 的泛化）可以用 Python 中的 Torch 计算如下：

def forward(self, y_logits, y_true):
    y_pred = self.sigmoid(y_logits)
    TP = (y_pred * y_true).sum(dim=1)
    FP = ((1 - y_pred) * y_true).sum(dim=1)
    FN = (y_pred * (1 - y_true)).sum(dim=1)
    fbeta = (1 + self.beta**2) * TP / ((1 + self.beta**2) * TP + (self.beta**2) * FN + FP + self.epsilon)
    fbeta = fbeta.clamp(min=self.epsilon, max=1 - self.epsilon)
    return 1 - fbeta.mean()

Run Code Online (Sandbox Code Playgroud)

本文描述了另一种方法：

https://arxiv.org/abs/1608.04802

所采用的方法优化了统计的下限。还讨论了其他指标，例如 AUROC 和 AUCPR。可以在此处找到这种方法的 TF 实现：

https://github.com/tensorflow/models/tree/master/research/global_objectives