您的位置：首页 > 理论基础 > 计算机网络

From FCN to U-Net：经典分割网络的前世今生

2018-03-07 15:37 232 查看

关于Fully Convolution Network的一些细节介绍可以参考博主的另一篇文章：http://blog.csdn.net/jyzhang_cvml/article/details/79451749. 随着FCN提出，在2015年医学图像处理顶会MICCAI上，Olaf Ronneberger 设计了名为 U-Net 的医学图像分割网络。作者在文章中表示该网络具有两大优势：（1）在较少的医学图像数据中训练模型，并能够得到很好地分割结果。（2）采用了有效的 data argumentation 方法充分利用图像信息。其实在充分理解 FCN 的基础上再看 U-Net，其实也是换汤不换药而已。

分割算法面临的挑战

该部分是博主的个人理解，但是我认为对于理解类似FCN的U-Net具有很大帮助。谈到分割就不得不弄清楚 what 和 where 的问题。

– what 的问题

即分割目标的语义信息，来决定感受野中的这个目标到底是什么。通常来说，更大的感受野能够捕获越丰富的globa
4000
l图像信息，从而通过设计完备的卷积神经网络结构进行语义信息的提取，进而更准确的解释对应输出单元感受野之内的目标到底是什么。

– where 的问题

即分割目标的位置信息，来决定感兴趣目标的位置。通常来说，感受野越大，导致目标位置信息的损失越严重，进而定位信息不准确。

通常来说，分割任务需要准确的分辨出感兴趣区域，因此需要一个较大的感受野。那么如何获得较大的感受野？FCN和U-Net采用通过不断max-pooling的操作对得到的feature map进行降采样，从而让最后输出单元可以对应较大的感受野区域。然而这样的操作带来的副作用就是造成分割图像的分辨率降低，损失了有益的位置信息。

所以，如何补全降采样时丧失的分辨率信息是FCN和U-Net的重中之重：采用 deconvolution 反卷积的方法，通过学习得到的卷积核进行上采样，恢复出原先的分辨率。

网络构架

可以看到这样的网络构建呈现 U 字型。左边从上到下的网络构架通过4次max_pooling操作将分辨率变成原先的1/16，但是能够得到较大的感受野区域，这样的过程在文章中被称为“Contracting Path”。而右边的构架是通过反卷积4次，将原先的低分辨率的feature map 还原成原始图像大小尺度，这样的过程被称为“Upsampled output”。在这两条路径之间还存在着“Feature Channels”进一步补全Contracting Path中损失的空间信息。

创新性

– data argument

根据处理细胞分割的问题，采用一种图像扭曲形变的argument方法

– 加权损失函数

通过这样的加权函数的设置，使得分割算法对于特定的boundry部分有一个很好的响应。

总结

其实在理解了FCN的基础上，再看U-Net无非就是有了一种更加具体特定的网络构架。依旧是通过反卷积+feature channal 的策略，解决感受野大小和图像分辨率的trade-off问题。

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航