您的位置：首页 > 移动开发 > Objective-C

【深度学习论文笔记:Recognition】:Deep Neural Networks for Object Detection

2017-03-12 21:14 751 查看

本文为论文“Deep Neural Networks for Object Detection”阅读笔记，欢迎交流学习。

论文原文：http://papers.nips.cc/paper/5207-deep-neural-networks-for-object-detection.pdf

本文解决的问题：使用DNN，检测一幅图片里大量拥有不同尺度的不同物体（detect a potentially large number object instances with varying sizes in the same image）。

本文核心思想：

DNN-based regression，识别+定位。作者将识别看作回归（regression）问题，DNN不但学习到物体的特征，还捕获了物体的几何信息，避免使用滑动窗口（速度问题）。基于DNN的对象掩模的回归，如图1所示。基于此回归模型，可以为完整对象以及部分对象生成掩码。单个DNN回归可以为我们提供图像中多个对象的掩码。为了进一步提高定位的精度，将DNN定位器应用于一小组大子窗口上。全流程如图2所示。

注意：文章中提到的masks，即掩码。掩码简单的说，就是设置一些区域，使其不参加处理。图像的掩码操作是指通过掩码核算子重新计算图像中各个像素的值，掩码核算子刻画领域像素点对新像素值得影响程度，同时根据掩码算子中权重因子对像素点进行加权平均。图像掩码操作常用于图像平滑、边缘检测、特征分析等区域。

方法：

首先，将普通的分类网络（Classification Network）最后一层替换为regression layer，用来定位物体位置；然后，使用一个多尺度的扫描框（a multi-scale box inference）来提高定位的精确度（即比较不同扫描框中物体的位置，从而更精确定位物体在整个图片的位置）。

References

[1]1983的专栏 http://blog.csdn.net/chenriwei2/article/details/38110541

[2]spw_1201 http://blog.csdn.net/spw_1201/article/details/53557982

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签： 深度学习 dnn

相关文章推荐

新的分享

章节导航