在Keras,weight_regularizer和activity_ regularizer之间有什么区别

sim*_*mon 4 regularized keras

我理解正则化通常会将k*w ^ 2添加到损失以惩罚大权重.但在Keras中有两个正则化参数 - weight_regularizer和activity_ regularizer.有什么不同?

Ser*_*ych 6

区别在于activity_regularizer应用于中间层的输出,它会损害大层输出.