了解 Pytorch 网格示例

raa*_*aaj 6 python computer-vision pytorch

我有一个大小的输入张量 [1,32,296,400]

我有一个像素集 [1, 56000, 400, 2]

应用 grid_sample 后,mode=‘bilinear’我有[1, 32, 56000, 400]

我能知道这里到底发生了什么吗?我知道这grid_sample应该以可微分的方式有效地将像素转换到新位置,但是这些尺寸并没有说明发生了什么。

Sha*_*hai 7

请查看 的文档grid_sample

您的输入张量的 ashape为 1x32x296x400,也就是说,批次中有一个示例,它有 32 个通道,空间维度为 296x400 像素。
此外,您有一个大小为 1x56000x400x2 的“网格”,pytorch 将其解释为空间维度为 56000x400 的网格的新位置,其中每个新位置都有 x,y 坐标,从中可以对新网格值进行采样。因此,“网格”信息的形状为 1x56000x400x2。
正如预期的那样,输出是一个形状为 1x32x56000x400 的 2D 张量:批次和通道尺寸不变,但空间坐标与提供给 的“网格”信息一致grid_sample