AKS*_*HAN 7 initialization machine-learning neural-network deep-learning keras
在keras中,He normal和Xavier普通初始化器之间有什么区别?两者似乎都基于输入数据的方差来初始化权重.对两者之间的区别有任何直观的解释吗?
Max*_*xim 13
请参阅有关Stats.SE的讨论:
总之,机器学习从业者的主要区别如下:
- 对于具有ReLu激活的图层,他的初始化效果更好.
- Xavier初始化对于具有sigmoid激活的层更好.
归档时间: |
|
查看次数: |
5488 次 |
最近记录: |