您的位置:首页 > 其它

目标检测方法系列——R-CNN, SPP, Fast R-CNN, Faster R-CNN, YOLO, SSD

2016-12-25 16:19 721 查看


目录

相关背景

从传统方法到R-CNN

从R-CNN到SPP

Fast R-CNN

Faster R-CNN

YOLO

SSD

总结

参考文献

推荐链接

 

 

相关背景

14年以来的目标检测方法(以R-CNN框架为基础或对其改进)



 

各方法性能对比



分类,定位,检测三种视觉任务的简单对比



一般的目标检测方法



从传统方法到R-CNN

R-CNN的三大步骤:得到候选区域,用cnn提取特征,训练分类器(后两步放在一个网络中,用softmax做分类器也可以)



从R-CNN到SPP

R-CNN必须限制输入图像大小(全连接层要求)



SPP的两大优势:可变输入大小 + 各patch块之间卷积计算是共享的



SPP的缺陷:multi-stage,训练和测试都比较慢



Fast R-CNN

Fast R-CNN通过ROI pooling(一层的SPP),multi-task等改进大大提高速度



Fast R-CNN的优势与弱势



Faster R-CNN

Faster R-CNN对于Fast R-CNN的改进在于把region proposal的步骤换成一个CNN网络(RPN)



Faster R-CNN的两个base model: ZF,VGG16 (base model的中间conv输出即为要输入到RPN的那个feature map)





Faster R-CNN的锚点anchor box



Faster R-CNN的损失函数





Faster R-CNN的四步训练



YOLO

从Faster R-CNN到YOLO



YOLO的pipeline



YOLO的网络结构



YOLO的模型(最右图为网络输出的tensor)



YOLO的损失函数



YOLO的优势和劣势



SSD

SSD的pipeline和关键技术



SSD的网络结构



SSD的多尺度特征图



SSD的default box



SSD的default box与faster r-cnn的anchor box的对比



SSD的训练样本与groundTruth的匹配策略 + 损失函数



SSD的default box和尺度选择



总结

从R-CNN → SPP → Fast R-CNN → Faster R-CNN → YOLO → SSD整体在准确率和速度上都在提高



 

参考文献

R-CNN

Girshick, R., Donahue, J., Darrell, T., Malik, J.: Rich feature hierarchies for accurate object detection and semantic segmentation. In: CVPR. (2014)

SPP

He, K., Zhang, X., Ren, S., Sun, J.: Spatial pyramid pooling in deep convolutional networks for visual recognition. In: ECCV. (2014)

Fast R-CNN

Girshick, R.: Fast R-CNN. In: ICCV. (2015)

Faster R-CNN

Ren, S., He, K., Girshick, R., Sun, J.: Faster R-CNN: Towards real-time object detection with region proposal networks. In: NIPS. (2015)

YOLO

Redmon, J., Divvala, S., Girshick, R., Farhadi, A.: You only look once: Unified, real-time object detection. In: CVPR. (2016)

SSD

W. Liu, D. Anguelov, D. Erhan, C. Szegedy, and S. Reed. SSD: Single shot multibox detector. arXiv:1512.02325v2, 2015

 

 

推荐链接

Object detection methods (codes)

https://handong1587.github.io/deep_learning/2015/10/09/object-detection.html#r-cnn

所有目标检测方法的中文总结(博客)

http://46aae4d1e2371e4aa769798941cef698.devproxy.yunshipei.com/cosmosshadow/article/details/50244715 http://www.cnblogs.com/venus024/p/5717766.html

Faster RCNN的论文阅读

http://www.voidcn.com/blog/sloanqin/article/p-5994844.html

YOLO的论文阅读

http://blog.csdn.net/tangwei2014/article/details/50915317 http://blog.csdn.net/cv_family_z/article/details/46803421

R-FCN的论文阅读

http://blog.csdn.net/u011534057/article/details/52733823

SSD的论文阅读

http://www.aichengxu.com/view/24600342 http://m.2cto.com/kf/201609/549802.html http://www.itdadao.com/articles/c15a476096p0.html http://blog.csdn.net/u011534057/article/details/52733686
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  deep learning YOLO
相关文章推荐