U-net与FCN背后的直觉用于语义分割

Jon*_*han 7 artificial-intelligence neural-network image-segmentation semantic-segmentation convolutional-neural-network

我不太了解以下内容:

Shelhamer等人提出的用于语义分割的FCN中,他们提出了像素到像素的预测以构造图像中对象的蒙版/精确位置。

在用于生物医学图像分割的FCN的略微修改版本中,U-net的主要区别似乎是“与从收缩路径中相应裁剪的特征图的串联”。

现在,为什么此功能特别是在生物医学细分方面有所作为?我可以指出的是,生物医学图像与其他数据集的主要区别在于,在生物医学图像中,定义对象的特征集不如每天常见的对象丰富。数据集的大小也受到限制。但是,此额外功能是否受这两个事实或其他原因的启发?

sha*_*sai 11

FCN与U-Net:

FCN

  1. 它仅上采样一次。即它在解码器中只有一层
  2. 最初的实现github repo使用双线性插值对经过卷积的图像进行升采样。那这里没有可学习的过滤器
  3. FCN- [FCN 16s和FCN 8s]的变体添加了来自较低层的跳过连接,以使输出对于缩放变化具有鲁棒性

网络

  1. 多个上采样层
  2. 使用跳过连接并连接而不是加总
  3. 使用可学习的权重过滤器代替固定插值技术