目标检测--Feature Pyramid Networks for Object Detection
2017-03-24 14:30
573 查看
CVPR2017
Feature Pyramid Networks for Object Detection
https://arxiv.org/abs/1612.03144
Code will be made publicly available
本文是对 Faster R-CNN 在目标检测问题上的进一步完善。Faster R-CNN 有两个步骤, Region Proposal Network, RPN以及 Fast R-CNN,在这两个步骤我们都利用更多的卷积特征图信息来提升RPN和 Fast R-CNN的效果。具体是怎么利用的了?主要是参考 Fully Convolutional Networks for Semantic Segmentation 的思想,对 coarse outputs 进行放大,分别用对应尺寸的卷积特征图对 outputs 进行微调,得到更好的结果。
上图主要对比了一下针对多尺度问题各种解决思路。
(a)有图像金字塔生产对应的特征图,在这些特征图上处理预测
(b)对单尺度图像使用 ConvNets 计算卷积特征,最后在最后一层卷积特征图上进行预测,该特征具有一定的 scale invariance, 但是如果有其他不同尺寸的卷积特征图效果会更好。
(c)使用多个卷积特征图进行预测,Single Shot Detector (SSD) 就是这么干的。但是SSD 使用的卷积特征图只是自己后来加入的网络层,前面的卷积特征图没有使用,而这些卷积特征图对于检测小目标至关重要。
(d) 我们提出的 Feature Pyramid Network (FPN) 很好的利用了各个卷积特征图,逐步微调。
通过skip connections 利用各个卷积特征图的思想以前就有了,那么我们和前人有什么不同了? 那就是我们在output 以及后续放大的 output 上独立检测目标。 predictions made independently at all levels
我们是怎么将不同卷积特征图联系起来的?
对于一个 coarser-resolution 特征图,我们通过 upsampling 放大两倍,然后将它与对应尺寸的卷积特征图通过 element-wise addition 得到新的特征图。注意这里的对应尺寸的卷积特征图是通过 1×1 convolutional layer 来降低channel dimensions 得到的。因为每个尺寸有很多个 channel 的 卷积特征图。
本文主体思路基本就这样了。剩下就是一些实验细节对比
和其他模型在目标检测上的对比
Instance segmentation proposals
Feature Pyramid Networks for Object Detection
https://arxiv.org/abs/1612.03144
Code will be made publicly available
本文是对 Faster R-CNN 在目标检测问题上的进一步完善。Faster R-CNN 有两个步骤, Region Proposal Network, RPN以及 Fast R-CNN,在这两个步骤我们都利用更多的卷积特征图信息来提升RPN和 Fast R-CNN的效果。具体是怎么利用的了?主要是参考 Fully Convolutional Networks for Semantic Segmentation 的思想,对 coarse outputs 进行放大,分别用对应尺寸的卷积特征图对 outputs 进行微调,得到更好的结果。
上图主要对比了一下针对多尺度问题各种解决思路。
(a)有图像金字塔生产对应的特征图,在这些特征图上处理预测
(b)对单尺度图像使用 ConvNets 计算卷积特征,最后在最后一层卷积特征图上进行预测,该特征具有一定的 scale invariance, 但是如果有其他不同尺寸的卷积特征图效果会更好。
(c)使用多个卷积特征图进行预测,Single Shot Detector (SSD) 就是这么干的。但是SSD 使用的卷积特征图只是自己后来加入的网络层,前面的卷积特征图没有使用,而这些卷积特征图对于检测小目标至关重要。
(d) 我们提出的 Feature Pyramid Network (FPN) 很好的利用了各个卷积特征图,逐步微调。
通过skip connections 利用各个卷积特征图的思想以前就有了,那么我们和前人有什么不同了? 那就是我们在output 以及后续放大的 output 上独立检测目标。 predictions made independently at all levels
我们是怎么将不同卷积特征图联系起来的?
对于一个 coarser-resolution 特征图,我们通过 upsampling 放大两倍,然后将它与对应尺寸的卷积特征图通过 element-wise addition 得到新的特征图。注意这里的对应尺寸的卷积特征图是通过 1×1 convolutional layer 来降低channel dimensions 得到的。因为每个尺寸有很多个 channel 的 卷积特征图。
本文主体思路基本就这样了。剩下就是一些实验细节对比
和其他模型在目标检测上的对比
Instance segmentation proposals
相关文章推荐
- 特征金字塔特征用于目标检测:Feature Pyramid Networks for Object Detection
- 目标检测 Feature Pyramid Networks for Object Detection(FPN)论文笔记
- 目标检测“Feature Pyramid Networks for Object Detection”
- [目标检测] RON-Reverse Connection with Objectness Prior Networks for Object Detection
- 目标检测“Perceptual Generative Adversarial Networks for Small Object Detection”
- 经典文章系列:Feature Pyramid Networks for Object Detection(FPN)论文阅读
- FPN(Feature Pyramid Networks for Object Detection)安装与训练
- READING NOTE: Feature Pyramid Networks for Object Detection
- 视频目标检测--Flow-Guided Feature Aggregation for Video Object Detection
- 多尺度R-CNN论文笔记(6): Feature Pyramid Networks for Object Detection
- 行人检测论文笔记:Fast Feature Pyramids for Object Detection?
- 目标检测--Wide-Residual-Inception Networks for Real-time Object Detection
- Feature Pyramid Networks for Object Detection (FPN) 阅读笔记
- 目标检测“Perceptual Generative Adversarial Networks for Small Object Detection”
- 目标检测--PVANET: Deep but Lightweight Neural Networks for Real-time Object Detection
- 目标检测“Perceptual Generative Adversarial Networks for Small Object Detection”
- Feature Pyramid Networks for Object Detection
- Feature Pyramid Networks for Object Detection 总结
- 论文解读之Feature Pyramid Networks for Object Detection
- 论文笔记:Feature Pyramid Networks for Object Detection