如何保证Caffe分割网络输出大小与输入相同？

Question

我正在使用 U-net 架构训练分割模型。输入图像尺寸为250x250。

目前，我已经手动调整了一些卷积层的填充，以确保模型输出具有相同的大小，即 250x250。

但是，当我输入不同尺寸的图像（例如 500x500 的图像）时，输出尺寸为 506x506。

如何确保所有尺寸的输出尺寸与输入尺寸保持相同？

Answer 1

您可以使用"Crop"图层强制输出形状相同。
对于 U-net，我建议在每次上采样之后（而不仅仅是在最后）使用裁剪层，以避免累积填充错误。

关于“填充错误”：
假设您有一个形状为 100x100 的输入，您将其向下采样 3 倍，系数为 2，最终将得到 13x13 的特征图。
现在，如果您每次上采样 3 倍 x2

13x13 --> 26x26 --> 52x52 --> 104x104

由于填充/舍入，您添加了“额外”4 个像素（在您的问题中您有 6 个像素）。
但是，如果您"Crop"在每次上采样之后

13x13 --> 26x26 \crop 25x25 --> 50x50 --> 100x100

您会看到，只有在第一次上采样之后，才会出现不平凡的裁剪，并且该级别只有 1 个像素误差，而不是 4 个。