pytorch affine_grid:theta 输入是什么?

Sim*_*mon 5 image-processing computer-vision pytorch

当尝试使用时,它需要一个根据文档torch.nn.functional.affine_grid大小的 theta 仿射矩阵。我认为一般的仿射矩阵是。pytorch中假设的仿射矩阵格式是什么?(N x 3 x 4)(N x 4 x 4)

3D 旋转仿射输入的示例是理想的。感谢你的帮助。

Sha*_*hai 3

您提到的尺寸适用于 3D 输入的情况,即您希望对形状xbx cx dx hx的输入张量应用 3D 几何变换w。在一般情况下,如您所述
,到 3D 中的点的变换(在齐次坐标(x, y, z, 1)中表示为 4 向量)应该是 4x4 矩阵。
然而,由于我们将自己限制为齐次坐标,即第四个坐标必须为 1,因此矩阵的第 4 行也必须为 1 (0, 0, 0, 1)(参见)。
因此,无需显式地对最后一行进行编码。

总而言之,由 3x3 旋转R和 3d 平移组成的 3D 变换t就是 3x4 矩阵:

theta = [R t]
Run Code Online (Sandbox Code Playgroud)