如何计算感受野大小？

mrg*_*oom 15 computer-vision deep-learning

我正在阅读有关使用CNN(卷积神经网络)进行物体检测的论文.

丰富的要素层次结构,用于准确的对象检测和语义分割

以下是关于接受领域的引用:

The pool5 feature map is 6x6x256 = 9216 dimensional. Ignoring boundary effects, each pool5 unit has a receptive field of 195x195 pixels in the original 227x227 pixel input. A central pool5 unit has a nearly global view,
while one near the edge has a smaller, clipped support.

Run Code Online (Sandbox Code Playgroud)

我的问题是:

接受场的定义是什么？
他们如何计算感受野的大小和位置？
我们如何使用caffe/pycaffe计算感受野的边界矩形？

1)像素区域的大小影响最后一个卷积的输出.

2)对于每个卷积和池化操作,计算输出的大小.现在找到导致输出大小为1x1的输入大小.这是感受野的大小

3)您不需要使用库来执行此操作.对于每个2x2池,每个维度的输出大小减少一半.对于跨步卷积,您还可以按步幅划分每个维度的大小.您可能需要削减一些尺寸,具体取决于您是否使用填充进行卷积.最简单的情况是使用padding = floor(内核大小/ 2),因此卷积不会对输出大小产生任何额外的变化.

这是另一种直接计算感受野的方法.Stackoverflow不支持数学公式,对于更易读的版本,请参阅计算CNN的接收域

层$ k $的感受野(RF)$ l_k $是:

$$ l_k = l_ {k-1} +((f_k - 1)*\prod_ {i = 1} ^ {k-1} s_i)$$

其中$ l_ {k-1} $是图层$ k-1 $的接收字段,$ f_k $是过滤器大小(高度或宽度,但假设它们在这里相同),$ s_i $是大步layer $ i $.

上面的公式从下到上(从第1层)计算感受野.直观地说,$ k $层中的RF相对于$ k-1 $层覆盖$(f_k - 1)*s_ {k-1} $个像素.但是,增量需要转换为第一层,因此增量是一个因子 - 层中的步幅$ k-1 $在较低层中呈指数级增长.

希望这是有帮助的.

Tensorflow现在仅需使用即可支持接收场计算 tf.contrib.receptive_field

有关详细信息，请参见https://github.com/tensorflow/tensorflow/tree/master/tensorflow/contrib/receptive_field。

归档时间：	10 年前
查看次数：	12256 次
最近记录：	6 年，8 月前

minicom 抛出错误 minicom: 无法打开 /dev/modem: 没有这样的文件或目录 11

如何用Python检测图像中的矩形项 7

关于图像裁剪算法的困境 - 有可能吗？ 6

Python Keras LSTM学习在高损耗时收敛得太快 6

使用手动单应性对齐两个图像 6

为什么 PyTorch 中的嵌入实现为稀疏层？ 5

警告：tensorflow:Layer my_model 正在将输入张量从 dtype float64 转换为 float32 层的 dtype，这是 TensorFlow 2 中的新行为 5

在TensorFlow中,丢失层是在密集层之前还是之后？ 3

如何使用 OpenCV 检测文本 2

RetinaNet的焦损 1

如何从当前的Git工作树中删除本地(未跟踪)文件？ 6561

如何确定数组是否包含Java中的特定值？ 2194

如何显示已上演的更改？ 2034

如何确定变量是"未定义"还是"空"？ 2000

JavaScript切断/切片/修剪字符串中的最后一个字符 1840

在SQL表中查找重复值 1789

使用jQuery中止Ajax请求 1775

你如何改变用matplotlib绘制的数字的大小？ 1726

哪个MySQL数据类型用于存储布尔值 1168

有效地使用Git和Dropbox？ 1117