神经网络具有正态分布的数据重要吗？

Question

因此，与数据相关的标准操作之一是对其进行归一化并将其标准化，以使其具有均值0且标准偏差为1的正态分布数据，对吗？但是，如果数据不是正态分布的怎么办？

另外，所需的输出是否也必须正态分布？如果我希望前馈网络在两个类别（-1和1）之间进行分类，那将不可能标准化为均值0和std为1的正态分布吗？

前馈网是非参数的吧？因此，如果确实如此，对数据进行标准化处理是否仍然很重要？为何人们对此予以认同呢？

Answer 1

对功能进行标准化并不是要使数据适合于正态分布，而是要将特征值放在已知范围内，从而使算法更容易从数据中学习。这是因为大多数算法不是缩放/移位不变的。例如，决策树既是尺度不变的，又是移位不变的，因此进行归一化不会影响决策树的性能。

另外，所需的输出是否也必须正态分布？

不，那不是事输出就是输出。您必须确保网络最后一层的激活功能可以做出所需的预测（即：Sigmoid激活不能输出负值或值> 1）。

前馈网是非参数的吧？

不，它们通常被认为是参数化的。参数/非参数实际上没有硬性定义。人们在谈论这一点时可能会表示不同的意思。

因此，如果是这样，标准化数据是否仍然很重要？

这些事情根本没有关系。

人们为什么要对其进行标准化？

这是我提到的第一件事，它使学习变得容易/可能。