您的位置：首页 > 理论基础 > 计算机网络

【那些年我们一起看过的论文】之《Fully Convolutional Networks for Semantic Segmentation》

2017-03-28 00:18 609 查看

/*

FCN算是开创性的一篇卷积神经网络的论文了，引用量不计其数。核心在于把原来CNN的全连接层变成卷积层，就全卷积每一层画风一致了。其他的残余网络、带洞的网络什么的略有耳闻，后补。因为经典，所以多码点字，火钳刘明。

*/

FCN可以基于若干种种结构(VGGNet, AlexNet, SIFT-Flow)，基于VGGNet的FCN-32/16/8s效果最好。

参考代码：https://github.com/shelhamer/fcn.berkeleyvision.org

卷积网络是产生特征层次结构的强大视觉模型

FCN可以接受任意尺寸的输入图像，采用反卷积层对最后一个卷积层的feature map进行上采样, 使它恢复到输入图像相同的尺寸，从而可以对每个像素都产生了一个预测, 同时保留了原始输入图像中的空间信息, 最后在上采样的特征图上进行逐像素分类。

FCN与CNN的区域在把于CNN最后的全连接层换成卷积层，输出的是一张已经Label好的图片。从图像级别的分类延伸到像素级别的分类。

传统的子采样会缩小图片尺寸，但是这样就达不到像素级别的分类与预测了，所以可以将CNN后面的三个全连接层转换成卷积层。

————————–图1————————–

Q：为什么全卷积网络可以输入任意size的图片？

A：因为卷积层可以通过划窗卷积得到特征地图，而全连接层权值数固定决定了输出与输入size固定。

通过卷积->反卷积（插值法）可以得到像素级别的预测，（每个像素都得到分类结果）似乎完成了目标。但是实验表明分割效果比较粗糙，一定是中间层的信息在传递中丢失了。因此考虑fusion prediction，就是将中间的层与最后对应的输出结果做融合，见图2.

————————图2————————-

参考博客：

http://www.cnblogs.com/gujianhan/p/6030639.html

http://blog.csdn.net/xg123321123/article/details/53092154

参考博客的参考链接：

https://zhuanlan.zhihu.com/p/22976342

代码实践将会参考：

http://blog.csdn.net/gavin__zhou/article/details/52142696

Semantic segmentation faces an inherent tension between semantics and location: global information resolves what while local information resolves where.图2也是体现了局部信息与全局信息结合，补充与优化粗糙的分割结果。文中也提到了另外两种fine-turning的方法，但是不如这个融合layer的方法好。

后文描述的主要是算法在不同的测试集上的对比与展示，各个参数上state-of-art的可视化结果，不再累述。

只言片语随手摘录

以上。

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签： FCN 神经网络 cnn

相关文章推荐

新的分享

章节导航