CNN:输入步幅与输出步幅

hyp*_*ons 4 convolution conv-neural-network deconvolution

在论文《用于语义分割的全卷积网络》中,作者在反卷积的背景下区分了输入步幅和输出步幅。这些术语有何不同?

Sha*_*ana 7

输入步幅是过滤器的步幅。您在输出中移动了多少滤波器。

输出步幅实际上是一个标称值。经过多次卷积和最大池化操作后,我们在CNN中获得了特征图。假设我们的输入图像为224 * 224 ,最终特征图为7 * 7

然后我们说我们的输出跨度为:224/7 = 32(向下采样后图像发生的大致变化。)

这个tensorflow 脚本描述了什么是输出步幅,以及在密集预测的情况下如何在FCN中使用。

人们使用的空间尺寸是32加1的倍数的输入,例如[321、321]。在这种情况下,ResNet输出处的要素贴图将具有空间形状[(height-1)/ output_stride +1,(width-1)/ output_stride +1],并且角点与输入图像的角点完全对齐,这大大方便了对齐图像的特征。使用[225,225]图像作为输入,将在最后一个ResNet块的输出处生成[8,8]特征图。