TensorFlow交叉熵教程

Gab*_*man 4 tensorflow

我刚刚完成了TensorFlow教程(https://www.tensorflow.org/versions/r0.8/tutorials/mnist/pros/index.html#deep-mnist-for-experts).

我有两个问题:

它为什么用cost function with y_ * log(y)？不应该y_ * log(y) + (1-y_) * log(1-y)吗？
如何TensorFlow知道如何计算gradient的的cost function我用？难道我们不应该在某处告诉TensorFlow如何计算gradient？

谢谢!

当y = 1或0时,您可以使用y_*log(y)+(1-y_)*log(1-y),但当y是一热编码时,y = [0 1]或[1 0] ,我们使用y_*log(y).实际上,它们是一样的.
一切都是TensorFlow中的图表,包括您的成本函数.

因此每个节点都知道它们的操作和局部梯度.Tensorflow使用反向传播(链规则)使用图形计算梯度.

归档时间：	9 年，10 月前
查看次数：	1170 次
最近记录：	9 年，10 月前

Tensorflow NaN bug？ 58

无法打开tensorboard 0.0.0.0:6006或localhost:6006 17

如何为 Tensorflow 服务添加基本身份验证 7

tf-nightly-gpu 和 tensorflow-gpu 有什么区别 7

如何在tensorflow 2.0中使用层列表？ 7

如何让TensorFlow XLA知道CUDA路径 6

如何合并数值和嵌入顺序模型以处理RNN中的类别 5

如何为作为分类值列表的列创建嵌入 5

Tensorflow: Neural Network does not converge 1

tf.image.resize_images() 产生随机图像（充满噪音）。这是怎么回事？ 0

基于表单的网站身份验证的权威指南 5311

关闭/隐藏Android软键盘 3641

AngularJS:服务与提供商vs工厂 3296

在Bash中提取文件名和扩展名 1969

<button>与<input type ="button"/>.哪个用？ 1588

表命名困境:奇异与多个名称 1404

你怎么能加速Eclipse？ 1258

如何删除文本/输入框周围的边框(轮廓)？(铬) 1208

如何使用INER JOIN与SQL Server删除？ 1181

Python类继承对象 1095