Batch Norm是否需要恒定的批量大小?

Mag*_*eek 5 deep-learning

批量标准化使用小批量均值和方差来标准化层输出.如果我训练一个具有批量大小的网络,比如100,但是然后想要在单次预测(批量大小为1)上使用经过训练的网络,我是否应该遇到问题?我应该在学习期间惩罚批量规范层以收敛身份转换以避免这种情况吗?

Mat*_*gro 4

不,这样做没有问题,在测试时,批量归一化层只是缩放和移动输入,并在训练时学习到因素。