卷积中2D步幅的含义是什么?

Ken*_*tov 4 machine-learning convolution stride deep-learning conv-neural-network

我知道stride只是一个整数时的含义是什么(通过哪个步骤应该将滤镜应用于图像).但是,(1, 1)甚至更多的立体步幅呢?

Max*_*xim 6

步幅限定过滤如何沿着输入图像(张量)移动.没有什么可以阻止你以不同的方式跨越不同的轴,例如,stride=[1, 2]意味着沿着0轴一次移动1px,沿着1轴一次移动2px.这种特殊组合并不常见,但可能.

Tensorflow API更进一步,允许自定义跨越4D输入张量的所有轴(请参阅参考资料tf.nn.conv2d).使用这个API,设置并不罕见strides=[1, 2, 2, 1],这很有意义:它应该处理每个图像(第一个1)和每个输入通道(最后一个1),但应用2x2跨越空间维度.就卷积而言,该操作适用于任何strides数组,但是值不是同样有用的.

强烈推荐这个CS231n教程以获取更多详细信息.