Tensorflow，在 Tensorflow 的 sparse_categorical_crossentropy 中 from_logits = True 或 False 是什么意思？

Question

Tensorflow，在 Tensorflow 的 sparse_categorical_crossentropy 中 from_logits = True 或 False 是什么意思？

Won*_*Son 12 tensorflow cross-entropy loss-function

在 Tensorflow 2.0 中，有一个损失函数叫做

tf.keras.losses.sparse_categorical_crossentropy(labels, targets, from_logits = False)

Run Code Online (Sandbox Code Playgroud)

我可以问你设置 from_logits = True 或 False 之间有什么区别吗？我的猜测是，当传入值是 logits 时，您设置 from_logits = True，如果传入值是概率（由 softmax 等输出），那么您只需设置 from_logits = False（这是默认设置）。

但为什么？损失只是一些计算。为什么它的传入值需要不同？我还在谷歌的 tensorflow 教程https://www.tensorflow.org/alpha/tutorials/sequences/text_generation 中看到，即使最后一层的传入值是 logits，它也不会设置 from_logits = True。这是代码

@tf.function
def train_step(inp, target):
  with tf.GradientTape() as tape:
    predictions = model(inp)
    loss = tf.reduce_mean(
        tf.keras.losses.sparse_categorical_crossentropy(target, predictions))
  grads = tape.gradient(loss, model.trainable_variables)
  optimizer.apply_gradients(zip(grads, model.trainable_variables))

  return loss

Run Code Online (Sandbox Code Playgroud)

模型在哪里

 model = tf.keras.Sequential([
    tf.keras.layers.Embedding(vocab_size, embedding_dim, 
                              batch_input_shape=[batch_size, None]),
    tf.keras.layers.LSTM(rnn_units, 
                        return_sequences=True, 
                        stateful=True, 
                        recurrent_initializer='glorot_uniform'),
    tf.keras.layers.Dense(vocab_size)
  ])

Run Code Online (Sandbox Code Playgroud)

没有最后一层softmax。（另外，在教程的另一部分，它设置了 from_logits = True）

那么，我是否将其设置为 True 无关紧要吗？

Answer 1

use*_*731 7

迪帕克提到的帖子有一些数学背景。

但为简单起见，from_logits=True 表示 crossEntropy 层的输入是正常的张量/logits，而如果 from_logits=False，则表示输入是一个概率，通常你应该在最后一层有一些 softmax 激活。

归档时间：	6 年，10 月前
查看次数：	4121 次
最近记录：	5 年，6 月前