在识别手写数字时,为什么我们应该在输出层使用10个神经元而不是4个神经元呢？

Question

我已经读过神经网络和深度学习中的第一章,部分是"一个简单的手写数字分类网络"(你可以用ctrl-f搜索),我发现一个很好的问题:"为什么我们应该在输出层使用10个神经元,而不是4个神经元？"

有4个神经元,每个神经元的值为0或1,然后代表2 ^ 4 = 16> 10.那么,为什么我们不在输出层使用4个神经元？

Answer 1

每个输出神经元负责单个数字.输出神经元i(总共10个神经元)将返回[0,1)输入数字的概率i.这样,当您将它们用作位时,您就知道每个数字的概率分布而不仅仅是单个输出(如您的示例中的2 ^ 4).