Xavier和he_normal初始化的区别

AKS*_*HAN 7 initialization machine-learning neural-network deep-learning keras

在keras中,He normal和Xavier普通初始化器之间有什么区别?两者似乎都基于输入数据的方差来初始化权重.对两者之间的区别有任何直观的解释吗?

Max*_*xim 13

请参阅有关Stats.SE的讨论:

总之,机器学习从业者的主要区别如下:

  • 对于具有ReLu激活的图层,他的初始化效果更好.
  • Xavier初始化对于具有sigmoid激活的层更好.