如何计算配置文件中卷积层后的输出大小?

jg9*_*925 2 object-detection pytorch

我是卷积神经网络的新手,想知道如何计算或找出模型各层之间的输出大小,给定一个类似于此链接中的以下说明的 pytorch 配置文件。

我已经看过的大部分内容都不是很清楚和简洁。我应该如何计算每一层的尺寸?下面是将被解析的配置文件的片段。

# (3, 640, 640)
[convolutional]
batch_normalize=1
filters=16
size=3
stride=1
pad=1
activation=leaky

[maxpool]
size=2
stride=2

# (16, 320, 320)
Run Code Online (Sandbox Code Playgroud)

trs*_*chn 6

总之,输出dims计算有一个通用的公式:

公式

您可以在A guide to receptive field algorithm for Convolutional Neural Networks 中找到解释。

另外,我想推荐一篇很棒的文章深度学习卷积算法指南

这个 repo conv_arithmetic带有卷积动画。