如何获取CNN的输入和输出通道？

Question

如何获取CNN的输入和输出通道？

ce1*_*ce1 3 image-processing filter deep-learning conv-neural-network pytorch

我专门研究了这里的 AlexNet 架构： https://github.com/pytorch/vision/blob/master/torchvision/models/alexnet.py

我对他们如何获取输入和输出通道感到困惑。根据我对 AlexNet 的阅读，我无法弄清楚他们从哪里获得outputchannels = 64（作为函数的第二个参数Conv2d）。即使256分布在 2 个 GPU 上，也应该得到128而不是64。根据我的假设，输入通道 3 最初代表颜色通道。然而，其他输入和输出通道对我来说也没有意义。

谁能解释一下输入和输出通道是什么？

class AlexNet(nn.Module):

    def __init__(self, num_classes=1000):
        super(AlexNet, self).__init__()
        self.features = nn.Sequential(
            nn.Conv2d(3, 64, kernel_size=11, stride=4, padding=2), #why 64?
            nn.ReLU(inplace=True),
            nn.MaxPool2d(kernel_size=3, stride=2),
            nn.Conv2d(64, 192, kernel_size=5, padding=2),
            nn.ReLU(inplace=True),
            nn.MaxPool2d(kernel_size=3, stride=2),
            nn.Conv2d(192, 384, kernel_size=3, padding=1),
            nn.ReLU(inplace=True),
            nn.Conv2d(384, 256, kernel_size=3, padding=1),
            nn.ReLU(inplace=True),
            nn.Conv2d(256, 256, kernel_size=3, padding=1),
            nn.ReLU(inplace=True),
            nn.MaxPool2d(kernel_size=3, stride=2),
        )

Run Code Online (Sandbox Code Playgroud)

Answer 1

kma*_*o23 5

是3输入通道的数量 ( R, G, B)。即第一个卷积运算的输出中的64通道数（即特征图）。因此，第一个卷积层采用彩色 (RGB) 图像作为输入，应用11x11步幅为 4 的内核，并输出64特征图。

96我同意这与（原始 AlexNet 实现的）架构图中的通道数（每个 GPU 为 48）不同。

然而，PyTorch 并没有实现原始的 Alexnet 架构。相反，它实现了论文中描述的 AlexNet 实现的变体：One weird trick for parallelizing convolutional neural networks。

另外，请参阅cs231n - 卷积网络，了解有关输入、过滤器、步幅和填充如何等同于卷积操作后的输出的更多详细信息。

PS：参见pytorch/vision/issues/185

归档时间：	7 年，6 月前
查看次数：	10011 次
最近记录：	4 年，6 月前