使用Keras categorical_crossentropy损失时,是否应该在最后一层使用softmax?

meg*_*ger 0 classification neural-network keras tensorflow softmax

我见过的大多数示例都在最后一层实现softmax。但是我读到categorical_crossentropyKeras在最后一层之后自动应用softmax,因此这样做是多余的,并导致性能降低。谁是对的?

rvi*_*nas 5

默认情况下,Keras categorical_crossentropy不会将softmax应用于输出(请参阅categorical_crossentropy实现Tensorflow后端调用)。但是,如果直接使用后端功能,则可以选择设置from_logits=True