最近,许多深层架构使用"批量标准化"进行培训.
什么是"批量标准化"?它在数学上做了什么?它以什么方式帮助培训过程?
如何在培训期间使用批量标准化?它是插入模型的特殊层吗?我需要在每一层之前标准化,还是只需要一次?
假设我使用批量标准化进行训练.这会影响我的测试时间模型吗?我应该用"部署"网络中的其他/等效层/操作替换批量规范化吗?
这个问题有关批标准化只涉及这个问题的一部分,我的目标,并希望更详细的解答.更具体地说,我想知道批量标准化的培训如何影响测试时间预测,即"部署"网络和网络的TEST阶段.
machine-learning normalization neural-network deep-learning caffe