Lui*_*ruz 2 statistics normal-distribution machine-learning normalization neural-network
因此,与数据相关的标准操作之一是对其进行归一化并将其标准化,以使其具有均值0且标准偏差为1的正态分布数据,对吗?但是,如果数据不是正态分布的怎么办?
另外,所需的输出是否也必须正态分布?如果我希望前馈网络在两个类别(-1和1)之间进行分类,那将不可能标准化为均值0和std为1的正态分布吗?
前馈网是非参数的吧?因此,如果确实如此,对数据进行标准化处理是否仍然很重要?为何人们对此予以认同呢?
对功能进行标准化并不是要使数据适合于正态分布,而是要将特征值放在已知范围内,从而使算法更容易从数据中学习。这是因为大多数算法不是缩放/移位不变的。例如,决策树既是尺度不变的,又是移位不变的,因此进行归一化不会影响决策树的性能。
另外,所需的输出是否也必须正态分布?
不,那不是事 输出就是输出。您必须确保网络最后一层的激活功能可以做出所需的预测(即:Sigmoid激活不能输出负值或值> 1)。
前馈网是非参数的吧?
不,它们通常被认为是参数化的。参数/非参数实际上没有硬性定义。人们在谈论这一点时可能会表示不同的意思。
因此,如果是这样,标准化数据是否仍然很重要?
这些事情根本没有关系。
人们为什么要对其进行标准化?
这是我提到的第一件事,它使学习变得容易/可能。
| 归档时间: |
|
| 查看次数: |
3532 次 |
| 最近记录: |