您的位置:首页 > 移动开发 > Objective-C

【深度学习论文笔记:Recognition】:Deep Neural Networks for Object Detection

2017-03-12 21:14 751 查看

本文为论文“Deep Neural Networks for Object Detection”阅读笔记,欢迎交流学习。

论文原文:http://papers.nips.cc/paper/5207-deep-neural-networks-for-object-detection.pdf

本文解决的问题:使用DNN,检测一幅图片里大量拥有不同尺度的不同物体(detect a potentially large number object instances with varying sizes in the same image)。

本文核心思想:

DNN-based regression,识别+定位。作者将识别看作回归(regression)问题,DNN不但学习到物体的特征,还捕获了物体的几何信息,避免使用滑动窗口(速度问题)。基于DNN的对象掩模的回归,如图1所示。 基于此回归模型,可以为完整对象以及部分对象生成掩码。 单个DNN回归可以为我们提供图像中多个对象的掩码。 为了进一步提高定位的精度,将DNN定位器应用于一小组大子窗口上。全流程如图2所示。

注意:文章中提到的masks,即掩码。掩码简单的说,就是设置一些区域,使其不参加处理。图像的掩码操作是指通过掩码核算子重新计算图像中各个像素的值,掩码核算子刻画领域像素点对新像素值得影响程度,同时根据掩码算子中权重因子对像素点进行加权平均。图像掩码操作常用于图像平滑、边缘检测、特征分析等区域。

方法:

首先,将普通的分类网络(Classification Network)最后一层替换为regression layer,用来定位物体位置;然后,使用一个多尺度的扫描框(a multi-scale box inference)来提高定位的精确度(即比较不同扫描框中物体的位置,从而更精确定位物体在整个图片的位置)。



References

[1]1983的专栏 http://blog.csdn.net/chenriwei2/article/details/38110541

[2]spw_1201 http://blog.csdn.net/spw_1201/article/details/53557982
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  深度学习 dnn
相关文章推荐