shu*_*l27 2 machine-learning computer-vision image-segmentation deep-learning caffe
我正在使用 U-net 架构训练分割模型。输入图像尺寸为250x250。
目前,我已经手动调整了一些卷积层的填充,以确保模型输出具有相同的大小,即 250x250。
但是,当我输入不同尺寸的图像(例如 500x500 的图像)时,输出尺寸为 506x506。
如何确保所有尺寸的输出尺寸与输入尺寸保持相同?
您可以使用"Crop"图层强制输出形状相同。
对于 U-net,我建议在每次上采样之后(而不仅仅是在最后)使用裁剪层,以避免累积填充错误。
关于“填充错误”:
假设您有一个形状为 100x100 的输入,您将其向下采样 3 倍,系数为 2,最终将得到 13x13 的特征图。
现在,如果您每次上采样 3 倍 x2
13x13 --> 26x26 --> 52x52 --> 104x104
Run Code Online (Sandbox Code Playgroud)
由于填充/舍入,您添加了“额外”4 个像素(在您的问题中您有 6 个像素)。
但是,如果您"Crop"在每次上采样之后
13x13 --> 26x26 \crop 25x25 --> 50x50 --> 100x100
Run Code Online (Sandbox Code Playgroud)
您会看到,只有在第一次上采样之后,才会出现不平凡的裁剪,并且该级别只有 1 个像素误差,而不是 4 个。
| 归档时间: |
|
| 查看次数: |
499 次 |
| 最近记录: |