您的位置:首页 > 理论基础 > 计算机网络

一种平衡准确性以及高效性的显著性目标检测深度卷积网络模型简要分析

2020-07-19 04:53 260 查看

一种平衡准确性以及高效性的显著性目标检测深度卷积网络模型分析

链接:一种平衡准确性以及高效性的显著性目标检测深度卷积网络模型

1.部分概念

(1)超像素

超像素最直观的解释,便是把一些具有相似特性的像素“聚合”起来,形成一个更具有代表性的大“元素”,而这个新的元素,将作为其他图像处理算法的基本单位,优点在于
1.大大降低了维度;
2.可以剔除一些异常像素点。

(2)之前提出的一些深度显著性检测模型(不做具体分析)

1.利用卷积神经网络(Convolutional Neural Networks,CNN)提取特征或上下文信息来预测超像素等图像片段的显著性分数。
2.利用卷积神经网络将局部超像素估计和全局建议搜索结合起来进行显著目标检测。
3.提取每个超像素的上下文信息,并利用CNN特征来计算超像素的显著性值。
4.利用全卷积网络(Fully Convolutional Networks, FCN)的像素级显著性预测。
5.将底层的空间特征与CNN特征相结合来进行显著性预测。
6.两级深层次显著性检测网络,通过从浅层恢复细节来细化粗预测图。
7.使用底层线索生成显著先验图,并利用该先验图以递归方式指导显著性目标预测。
8.空间卷积显著性检测框架网络,将空间注意机制引入到CNN图层,提取每个图像样本的全局和局部特征。
9.无监督检测方法,网络结构由一个潜在显著性预测模块和一个协同工作并共同优化的噪声建模模块组成。
10.利用人为选定的若干特征图构造一个具有3个卷积层的CNN架构,学习它们的深度对比度信息,最终得到改进后的显著性图。
11.多尺度对抗性特征学习模型用于图像显著性检测。
12.弱监督框架,用于训练具有多种监督源的显著性检测模型。

(3)无监督,有监督,弱监督学习等等

机器学习主要是为了实现分类,可以通过各式各样的监督学习完成,简单来说就是找出标签与特征之间的联系。
无监督学习:如果数据没有标签,显然就是无监督学习(unsupervised learning)了,也即聚类(clustering),需要机器自己实现对数据的标记并按照特征进行分类。
有监督学习:如果所有训练数据都有标签,则为有监督学习(supervised learning)。
弱监督学习:相对于强监督而言,数据的标签可能不完整或者不准确,通常分为不完全监督、不确切监督、不准确监督。

(4)上采样

上采样(upsampling),又称为放大图像或图像插值(interpolating),主要目的是放大原图像,从而可以显示在更高分辨率的显示设备上。

(5)鲁棒性

控制系统在一定(结构,大小)的参数摄动下,维持其它某些性能的特性。简单来说,就是系统能够在各种异常或者危险情况下保持稳定并能正常工作,而不会陷入死机崩溃的状况。

2.显著性检测存在的问题

当前的显著性目标检测算法在准确性和高效性两方面不能实现良好的平衡。
1.基于FCN的显著目标检测模型按顺序进行叠加、卷积、池化等操作,由于接受字段有限,信息不丰富导致完整性存在欠缺。
2.为了提升模型检测精度,采用了复杂、深层的网络体系,模型的检测效率大幅下降。

3.基本思路

1.卷积核的分解
3x3的2维卷积分解成1x3和3x1两个1维卷积以提高网络的检测效率。
2.跨连接及多尺度融合
跨连接:参考了稠密网络中的跨层结构,使得所设计的网络可以充分利用上下文信息,解决由于特征信息不充足造成非显著性目标误检为显著性目标的问题(由于跨连接的存在导致融合操作后的输入通道数量较大,每层连接中加入空洞卷积进行降维)。
多尺度融合:采用了4次多尺度融合操作,其中前3次是两个尺度相融合,最后一次融合为将所有尺度特征输出进行融合。

4.整体网络架构

以VGG-16为参考网络,网络框架主要由卷积分解模块、跨尺度连接模块和多尺度融合模块等部分组成。
链接:VGG-16笔记

设计中去掉了VGG-16中的全连接层、保留卷积层以提高计算效率,并且得到5种不同尺度的特征信息,利用跨层连接结构和多尺度融合模块及上采样技术,得到最终的显著性目标预测图。

5.实验结果

相比于其他的显著性目标检测模型,本文提出的平衡准确性以及高效性的显著性目标检测深度卷积网络模型主要注重检测效率与精度,并取得了不错的效果,但是还有很大的提升空间(比如跨连接层的改进,系统鲁棒性的增强等等)。

内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: 
相关文章推荐