Joh*_*ohn 3 machine-learning neural-network deep-learning
我假设不知何故每层的梯度将为 0.1。一个层可以通过累积梯度来计算的绘制/堆栈网络的梯度
在 ResNet 中,梯度通过跳过连接传播。那么,我怎样才能达到x
上图的梯度呢?是0.1x0.1+0.1
还是0.1
?
在上图中添加了梯度计算。梯度delta_x
是传入梯度delta_y
与梯度和 的乘积之delta_y
和delta_F
。
所以在你的例子中,它应该是 0.1x0.1x0.1+0.1。
但请注意,在实际计算中delta_F
,delta_y
将乘以weight_1
和passed/blocked
取决于是否ReLu
处于活动状态,然后乘以weights_2
。