Kev*_*n91 10 machine-learning image-processing deep-learning caffe conv-neural-network
我最近在caffe的Pooling层中找到了"global_pooling"标志,但是在这里的文档(Layer Catalog) 或者这里(Pooling doxygen doc)中无法找到它.
与普通的Pool-Layer行为相比,是否有一个简单的前向解释?
Tho*_*etz 12
使用全局池将维度从3D降低到1D.因此,全局池为每个要素图输出1个响应.这可以是您使用的最大值或平均值或任何其他池操作.
它通常在卷积神经网络的后端结束时使用,以获得与密集层一起工作的形状.因此,不必应用展平.
卷积可以适用于任何图像输入尺寸(足够大)。但是,如果最后有一个全连接层,则该层需要固定的输入大小。因此,完整的网络需要固定的图像输入大小。
但是,您可以删除全连接层并仅使用卷积层。您可以在最后创建一个卷积层,其过滤器数量与类的数量相同。但是您希望每个类别都有一个值来指示该类别的概率。因此,您可以在完整的剩余特征图上应用池化过滤器。因此,这种池化是“全局的”,因为它总是根据需要而定。相反,通常的池化层具有固定大小(例如 2x2 或 3x3)。
这是一个一般概念。您还可以在其他库中找到全局池化,例如Lasagne。如果您想要很好的文献参考,我建议您阅读Network In Network。