wln*_*ana 7 machine-learning convolution computer-vision
动画来自这里.我想知道为什么要求扩张卷积保持分辨率.显然,蓝色输入为7x7,绿色输出为3x3.
编辑:
解决分辨率损失的一种方法是将输入填充大约当前感受区域大小的一半,但是
这确实是一个带有5x5滤波器的扩张卷积.如果您将动画的蓝色部分想象为填充为0的3x3图像,则会保留分辨率.
关于你的编辑,重点在于你链接的帖子中的这个陈述:扩张的卷积支持感受野的指数扩展而不会损失分辨率或覆盖范围
填充是为了保持分辨率.那是正确的.
我们真正想要的是扩大感受野的大小.在您链接的帖子中,3个3x3扩张的卷曲在不断增加的扩张中,我们已经在特征图中实现了15x15的感知域.
为了达到相当于3x3卷积并且没有覆盖范围丢失且没有损失分辨率,我们可以以3的步幅(4会导致覆盖范围丢失)和非常重的填充(在某种程度上,就像你所说的那样) ,主要是填充零的卷积).但是,我们需要4个3x3卷积,步幅3而不是3个,以实现15x15的感知范围.
最重要的是,与扩张的卷积情况相比,正常的卷积会有更多无法解决的卷积.