【深度学习论文笔记:Recognition】:Deep Neural Networks for Object Detection
2017-03-12 21:14
751 查看
本文为论文“Deep Neural Networks for Object Detection”阅读笔记,欢迎交流学习。
论文原文:http://papers.nips.cc/paper/5207-deep-neural-networks-for-object-detection.pdf本文解决的问题:使用DNN,检测一幅图片里大量拥有不同尺度的不同物体(detect a potentially large number object instances with varying sizes in the same image)。
本文核心思想:
DNN-based regression,识别+定位。作者将识别看作回归(regression)问题,DNN不但学习到物体的特征,还捕获了物体的几何信息,避免使用滑动窗口(速度问题)。基于DNN的对象掩模的回归,如图1所示。 基于此回归模型,可以为完整对象以及部分对象生成掩码。 单个DNN回归可以为我们提供图像中多个对象的掩码。 为了进一步提高定位的精度,将DNN定位器应用于一小组大子窗口上。全流程如图2所示。注意:文章中提到的masks,即掩码。掩码简单的说,就是设置一些区域,使其不参加处理。图像的掩码操作是指通过掩码核算子重新计算图像中各个像素的值,掩码核算子刻画领域像素点对新像素值得影响程度,同时根据掩码算子中权重因子对像素点进行加权平均。图像掩码操作常用于图像平滑、边缘检测、特征分析等区域。
方法:
首先,将普通的分类网络(Classification Network)最后一层替换为regression layer,用来定位物体位置;然后,使用一个多尺度的扫描框(a multi-scale box inference)来提高定位的精确度(即比较不同扫描框中物体的位置,从而更精确定位物体在整个图片的位置)。References
[1]1983的专栏 http://blog.csdn.net/chenriwei2/article/details/38110541[2]spw_1201 http://blog.csdn.net/spw_1201/article/details/53557982
相关文章推荐
- 论文笔记 《Deep Neural Networks for Object Detection》
- 【论文笔记】Deep Neural Networks for Object Detection
- 深度学习论文笔记:Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition
- 深度学习论文笔记-Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition
- 多尺度R-CNN论文笔记(4): PVANET: Deep but Lightweight Neural Networks for Real-time Object Detection
- 论文笔记:PVANET: Deep but Lightweight Neural Networks for Real-time Object Detection
- 论文阅读--PVANET: Deep but Lightweight Neural Networks for Real-time Object Detection
- 深度学习笔记空间金字塔池化阅读笔记Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition
- [深度学习论文笔记][Video Classification] Long-term Recurrent Convolutional Networks for Visual Recognition a
- Joint Deep Learning For Pedestrian Detection(论文笔记-深度学习:行人检测)
- 深度学习笔记(一)空间金字塔池化阅读笔记Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition
- [深度学习论文笔记][Video Classification] Beyond Short Snippets: Deep Networks for Video Classification
- [深度学习论文笔记][Image Classification] ImageNet Classification with Deep Convolutional Neural Networks
- [深度学习论文笔记][Object Detection] Rich feature hierarchies for accurate object detection and semantic seg
- 深度学习论文笔记 [图像处理] Deep Residual Learning for Image Recognition
- [深度学习论文笔记][Scene Classification] Learning Deep Features for Scene Recognition using Places Database
- 【论文笔记】Scalable Object Detection using Deep Neural Networks
- 深度学习论文随记(二)---VGGNet模型解读-2014年(Very Deep Convolutional Networks for Large-Scale Image Recognition)
- 多尺度R-CNN论文笔记(5): A Unified Multi-scale Deep Convolutional Neural Network for Fast Object Detection
- 深度学习论文笔记:Rich feature hierarchies for accurate object detection and semantic segmentation