PyTorch 梯度不同于手动计算的梯度

Question

PyTorch 梯度不同于手动计算的梯度

HOA*_*ANG 5 python gradient derivative pytorch

我试图在不使用 Pytorch 的 autograd 的情况下计算 1/x 的梯度。我使用公式 grad(1/x, x) = -1/x**2。当我将这个公式的结果与 Pytorch 的 autograd 给出的梯度进行比较时，它们是不同的。

这是我的代码：

a = torch.tensor(np.random.randn(), dtype=dtype, requires_grad=True)
loss = 1/a
loss.backward()
print(a.grad - (-1/(a**2)))

Run Code Online (Sandbox Code Playgroud)

输出是：

tensor(5.9605e-08, grad_fn=<ThAddBackward>)

Run Code Online (Sandbox Code Playgroud)

任何人都可以向我解释问题是什么？

Answer 1

blu*_*nox 6

所以我猜你期望结果为零。当你仔细观察时，你会发现它非常接近。在二进制系统（计算机）上划分数字时，您经常会遇到舍入错误。

让我们看一下您的示例，并添加了额外的打印语句：

a = torch.tensor(np.random.randn(), requires_grad=True)
loss = 1/a
loss.backward()
print(a.grad, (-1/(a**2)))
print(a.grad - (-1/(a**2)))

Run Code Online (Sandbox Code Playgroud)

因为您使用随机输入，所以输出当然也是随机的。
（所以你不会得到完全相同的数字，但只要重复这个实验，你就会有类似的例子）。

有时你会得到零作为结果。但是在您最初的示例中情况并非如此：

tensor(-0.9074) tensor(-0.9074, grad_fn=<MulBackward>)
tensor(5.9605e-08, grad_fn=<ThSubBackward>)

Run Code Online (Sandbox Code Playgroud)

您会看到，即使两者都显示为相同的数字，但它们的最后一位小数位有所不同。这就是为什么在减去两者时你会得到这个非常小的差异。

这个问题作为计算机的一个普遍问题，有些分数只是有一个大的或无限个小数位，但你的计算机的内存没有。所以他们在某个时候被切断了。

所以你在这里体验到的实际上是缺乏精确度。精度取决于您使用的数字数据类型（即torch.float32或torch.float64）。

您也可以在这里查看更多信息：https :
//en.wikipedia.org/wiki/Double-precision_floating-point_format

但这并不特定于 PyTorch 左右，这是一个 Python 示例：

print(29/100*100)

Run Code Online (Sandbox Code Playgroud)

结果是：

28.999999999999996

Run Code Online (Sandbox Code Playgroud)

编辑：

正如@HOANG GIANG 指出的那样，将方程更改为-(1/a)*(1/a)效果很好，结果为零。这可能是因为在这种情况下计算梯度的计算与-(1/a)*(1/a)非常相似（或相同）。因此它共享相同的舍入误差，因此差异为零。

那么这里是另一个比上面更合适的例子。尽管-(1/x)*(1/x)在数学上等同于-1/x^2但在计算机上计算时并不总是相同，具体取决于x的值：

import numpy as np
print('e1 == e2','x value', '\t'*2, 'round-off error', sep='\t')
print('='*70)
for i in range(10):
    x = np.random.randn()
    e1 = -(1/x)*(1/x)
    e2 = (-1/(x**2))
    print(e1 == e2, x, e1-e2, sep='\t\t')

Run Code Online (Sandbox Code Playgroud)

输出：

e1 == e2    x value                 round-off error
======================================================================
True        0.2934154339948173      0.0
True        -1.2881863891014191     0.0
True        1.0463038021843876      0.0
True        -0.3388766143622498     0.0
True        -0.6915415747192347     0.0
False       1.3299049850551317      1.1102230246251565e-16
True        -1.2392046539563553     0.0
False       -0.42534236747121645    8.881784197001252e-16
True        1.407198823994324       0.0
False       -0.21798652132356966    3.552713678800501e-15

Run Code Online (Sandbox Code Playgroud)

尽管舍入误差似乎少了一点（我尝试了不同的随机值，而且很少有十分之二的舍入误差），但在计算1/x时仍然存在很小的差异：

import numpy as np
print('e1 == e2','x value', '\t'*2, 'round-off error', sep='\t')
print('='*70)
for i in range(10):
    x = np.random.randn()
    # calculate 1/x
    result = 1/x
    # apply inverse function
    reconstructed_x = 1/result
    # mathematically this should be the same as x
    print(x == reconstructed_x, x, x-reconstructed_x, sep='\t\t')

Run Code Online (Sandbox Code Playgroud)

输出：

e1 == e2    x value             round-off error
======================================================================
False       0.9382823115235075      1.1102230246251565e-16
True        -0.5081217386356917     0.0
True        -0.04229436058156134    0.0
True        1.1121100294357302      0.0
False       0.4974618312372863      -5.551115123125783e-17
True        -0.20409933212316553    0.0
True        -0.6501652554924282     0.0
True        -3.048057937738731      0.0
True        1.6236075700470816      0.0
True        0.4936926651641918      0.0

Run Code Online (Sandbox Code Playgroud)

归档时间：	6 年，12 月前
查看次数：	926 次
最近记录：	4 年，7 月前