标题中问题的答案可能非常明显,因为它通常被称为“ArcFace Loss”。
然而,有一部分让我感到困惑:
我正在阅读 Arcface 损失的以下 Keras 实现:
https://github.com/4uiiurz1/keras-arcface
在其中,请注意该model.compile行仍然指定loss='categorical_crossentropy'
此外,我看到很多来源将 Softmax 称为损失函数,我之前理解它是许多分类神经网络的输出层的激活函数。
基于这两点混淆,我目前的理解是损失函数,即网络如何实际计算代表给定示例的“错误程度”的数字,无论如何都是交叉熵。而 ArcFace 和 Softmax 一样,是输出层的激活函数。
这是正确的吗?如果是这样,为什么 Arcface 和 Softmax 被称为损失函数?如果没有,我的困惑可能来自哪里?
classification computer-vision deep-learning keras tensorflow