PyTorch 中的填充如何工作

Question

PyTorch 中的填充如何工作

通常，如果我很好地理解 Conv2D 层的 PyTorch 实现，则填充参数会将带有零的卷积图像的形状扩展到输入的所有四个边。因此，如果我们有形状为 (6,6) 的图像并设置padding = 2和strides = 2和kernel = (5,5)，则输出将是形状为 (1,1) 的图像。然后，padding = 2用零填充（上 2 个、下 2 个、左 2 个、右 2 个），得到形状为 (5,5) 的卷积图像

但是，当运行以下脚本时：

import torch
from torch import nn
x = torch.ones(1,1,6,6)
y = nn.Conv2d(in_channels= 1, out_channels=1, 
              kernel_size= 5, stride = 2, 
              padding = 2,)(x)

Run Code Online (Sandbox Code Playgroud)

我得到以下输出：

y.shape
==> torch.Size([1, 1, 3, 3]) ("So shape of convolved image = (3,3) instead of (5,5)")

y[0][0]
==> tensor([[0.1892, 0.1718, 0.2627, 0.2627, 0.4423, 0.2906],
    [0.4578, 0.6136, 0.7614, 0.7614, 0.9293, 0.6835],
    [0.2679, 0.5373, 0.6183, 0.6183, 0.7267, 0.5638],
    [0.2679, 0.5373, 0.6183, 0.6183, 0.7267, 0.5638],
    [0.2589, 0.5793, 0.5466, 0.5466, 0.4823, 0.4467],
    [0.0760, 0.2057, 0.1017, 0.1017, 0.0660, 0.0411]],
   grad_fn=<SelectBackward>)

Run Code Online (Sandbox Code Playgroud)

通常应该用零填充。我很困惑。有人可以帮忙吗？

Answer 1

Iva*_*van 5

输入被填充，而不是输出。在您的情况下， conv2d 层将在计算卷积运算之前在所有边上应用两个像素填充。

出于说明目的，

>>> weight = torch.rand(1, 1, 5, 5)

Run Code Online (Sandbox Code Playgroud)

这里我们应用一个卷积padding=2：

>>> x = torch.ones(1,1,6,6)
>>> F.conv2d(x, weight, stride=2, padding=2)
tensor([[[[ 5.9152,  8.8923,  6.0984],
          [ 8.9397, 14.7627, 10.8613],
          [ 7.2708, 12.0152,  9.0840]]]])

Run Code Online (Sandbox Code Playgroud)

我们不使用任何填充，而是自己将其应用于输入：

>>> x_padded = F.pad(x, (2,)*4)
tensor([[[[0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
          [0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
          [0., 0., 1., 1., 1., 1., 1., 1., 0., 0.],
          [0., 0., 1., 1., 1., 1., 1., 1., 0., 0.],
          [0., 0., 1., 1., 1., 1., 1., 1., 0., 0.],
          [0., 0., 1., 1., 1., 1., 1., 1., 0., 0.],
          [0., 0., 1., 1., 1., 1., 1., 1., 0., 0.],
          [0., 0., 1., 1., 1., 1., 1., 1., 0., 0.],
          [0., 0., 0., 0., 0., 0., 0., 0., 0., 0.],
          [0., 0., 0., 0., 0., 0., 0., 0., 0., 0.]]]])

>>> F.conv2d(x_padded, weight, stride=2)
tensor([[[[ 5.9152,  8.8923,  6.0984],
          [ 8.9397, 14.7627, 10.8613],
          [ 7.2708, 12.0152,  9.0840]]]])

Run Code Online (Sandbox Code Playgroud)

归档时间：	4 年，1 月前
查看次数：	7907 次
最近记录：	3 年，7 月前