ArcFace 严格来说是损失函数还是激活函数？

Question

ArcFace 严格来说是损失函数还是激活函数？

M.B*_*221 2 classification computer-vision deep-learning keras tensorflow

标题中问题的答案可能非常明显，因为它通常被称为“ArcFace Loss”。

然而，有一部分让我感到困惑：

我正在阅读 Arcface 损失的以下 Keras 实现：

https://github.com/4uiiurz1/keras-arcface

在其中，请注意该model.compile行仍然指定loss='categorical_crossentropy'

此外，我看到很多来源将 Softmax 称为损失函数，我之前理解它是许多分类神经网络的输出层的激活函数。

基于这两点混淆，我目前的理解是损失函数，即网络如何实际计算代表给定示例的“错误程度”的数字，无论如何都是交叉熵。而 ArcFace 和 Softmax 一样，是输出层的激活函数。

这是正确的吗？如果是这样，为什么 Arcface 和 Softmax 被称为损失函数？如果没有，我的困惑可能来自哪里？

Answer 1

小智 5

根据我的理解。您感到困惑的两件事如下-

ArcFace 是损失函数还是激活函数？
softmax 是损失函数还是激活函数？

ArcFace 是损失函数还是激活函数

您认为 ArcFace 是激活函数的假设是不正确的。ArcFace 确实是一个损失函数。如果你翻阅研究论文，作者提到他们使用传统的 softmax 函数作为最后一层的激活函数。（您可以检查调用函数是metrics.py文件。最后一行是 out = tf.nn.softmax(logits)）。这意味着在应用了附加角余量惩罚后，他们仅将 logits 传递给了 softmax 函数。ArcFace 本身就是一个损失函数，这听起来可能很混乱，那为什么它使用 softmax？答案很简单，只是为了获得类的概率。