为什么扩张的卷积可以保持分辨率?

wln*_*ana 7 machine-learning convolution computer-vision

在此输入图像描述

动画来自这里.我想知道为什么要求扩张卷积保持分辨率.显然,蓝色输入为7x7,绿色输出为3x3.

编辑:

解决分辨率损失的一种方法是将输入填充大约当前感受区域大小的一半,但是

  1. 这基本上破坏了扩张卷积不会失去分辨率的说法,因为它是保留决议的填充物.为了使输入具有相同的输出大小,传统的卷积需要更少的填充.
  2. 由于填充以指数方式增长,相对不小的膨胀因子将导致严重填充的输入图像.想象一下1024x1024输入,10倍扩张,它将变成大约2048x2048(如果我错了,请告诉我).这是原始尺寸的4倍,这意味着大多数卷积都是在填充区域而不是实际输入上完成的.就个人而言,这对我来说似乎是违反直觉的.

jks*_*hin 9

这确实是一个带有5x5滤波器的扩张卷积.如果您将动画的蓝色部分想象为填充为0的3x3图像,则会保留分辨率.

关于你的编辑,重点在于你链接的帖子中的这个陈述:扩张的卷积支持感受野的指数扩展而不会损失分辨率或覆盖范围

填充是为了保持分辨率.那是正确的.

我们真正想要的是扩大感受野的大小.在您链接的帖子中,3个3x3扩张的卷曲在不断增加的扩张中,我们已经在特征图中实现了15x15的感知域.

为了达到相当于3x3卷积并且没有覆盖范围丢失没有损失分辨率,我们可以以3的步幅(4会导致覆盖范围丢失)和非常重的填充(在某种程度上,就像你所说的那样) ,主要是填充零的卷积).但是,我们需要4个3x3卷积,步幅3而不是3个,以实现15x15的感知范围.

最重要的是,与扩张的卷积情况相比,正常的卷积会有更多无法解决的卷积.