相关疑难解决方法(0)

为什么我们需要显式调用zero_grad()？

为什么我们需要在PyTorch中明确归零渐变？loss.backward()调用时为什么渐变不能归零？通过在图表上保持渐变并要求用户明确归零渐变来实现什么样的场景？

neural-network gradient-descent deep-learning pytorch

45
推荐指数

3
解决办法

1万
查看次数

为什么我们需要在PyTorch中调用zero_grad()？

zero_grad()需要在训练期间调用该方法.但文档不是很有帮助

|  zero_grad(self)
|      Sets gradients of all model parameters to zero.

Run Code Online (Sandbox Code Playgroud)

为什么我们需要调用这个方法？

python neural-network gradient-descent deep-learning pytorch

42
推荐指数

3
解决办法

2万
查看次数

标签统计

deep-learning ×2

gradient-descent ×2

neural-network ×2