您的位置:首页 > 其它

图像分割“Fully Convolutional Instance-aware Semantic Segmentation”

2017-05-24 11:42 615 查看
论文链接:https://arxiv.org/pdf/1611.07709v1.pdf

代码:https://github.com/daijifeng001/TA-FCN

相关方法

FCN用于语义分割的流程,输入任意尺寸的图像,经过一系列的卷积层,输出每个像素所有语义类别的似然得分,如下图所示:



但FCN不是instance-aware的,instance-aware需要检测和分割目标。卷积是平移不变的,同一个像素的响应相同,与上下文位置无关。instance-aware的语义分割是在区域级上操作的,统一像素在不同的区域有不同的语义,如图2所示:



主流的instance-aware语义分割方法是用子网络解决问题,分三步:

1. FCN对整图操作,生成中间及共享特征图;

2. 共享特征图的RoI warp到固定尺寸的 per-ROI特征图;

3. 全连接层将per_ROI特征图转为per-ROI 掩码

以上方法存在的缺点:

1. RoI池化损失了空间细节信息

2. fc层对任务过参数化了

3. per-ROI网络计算在ROIs之间不共享,且速度慢,如MNC,花费了80%的时间在最后per-ROI上

参考文献[5]中提出instance mask proposal generation,是平移可变的,它使用k2个位置敏感的特征图对应k×k个目标的cell,每个得分代表像素在某位置时属于某目标的概率,集成k×k个cell的得分图得到最终的像素级前景图。方法存在一些缺点,如无语义信息,需要一个检测网络,检测分割任务分离,且方案不是端到端的,输入图像尺寸固定,且图像金字塔扫描耗时,如下图所示:



FCIS

基于[5],论文提出了FCIS,通常的实例级语义分割方法,如

SDS,Hypercolumn,MNC,CFM,MultiPathNet有一个共同的结构,即两个网络用于检测和分割子任务。两个网络的结构,参数,执行顺序随机。作者认为分离的网络没有真正挖掘到两个任务的联系。提出了下图的方法:



对于ROI的每个像素,执行两个任务:

1. 检测,判断该像素在某相对位置是否属于目标bbox

2. 分割,判断该像素是否在目标边界内

两个得分inside,outside,三种情况:

1. inside高,outside低,detection+,segmentation+

2. inside低,outside高,detection+,segmentation-

3. 都低,detection-,segmentation-

检测得分之后由整个ROI所有像素似然估计平均池化得到,前景掩码是每个像素分割得分的union。这种方法不包含特征warp,resize,特征及得分图与原始图像保持相同长宽比。

端到端的解决方案如下图所示:



使用ResNet模型,去除最后一层全连接层,仅训练卷积层,使用RPN生成ROIs,从conv5层,生成2k2×(C+1)个得分图,计算分割概率图和分类得分。

实验结果

与MNC在COCO上的比较:

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: 
相关文章推荐