DeepID-Net:multi-stage and deformable deep convolutional neural network for object detection
2014-12-14 20:19
976 查看
这篇论文的工作在ImageNet 的detection task 中rank2,但是组合了一大堆东西,非常麻烦。
这篇论文的框架是基于RCNN的,使用了selective search来寻找bounding box,然后还用了RCNN作一个简单的过滤,将SVM score太低的box reject掉了。
然后用作者训练的10个不同的DeepID-Net来detection,将结果average之后,再继续regerssion,这样就得到了最后的结果,貌似据作者说有45%。
其中DeepID-Net听麻烦的,它首先用的net是2013年的冠军clarifai的结构,然后先做pretrain,再finetune。除此之外,他还使用了好几个技巧。
首先是mulit-stage,它主要是用了好几层的全链接层,然后每次只训练一层。
然后是结合了dpm这个经典的方法,将convlution之后的结果通过def-layer来做过滤,对bjbect的不同part形成一个限制。
还有sub-box feature,就是将一个box的4个小box的feature抽取出来做max,average之后结合box的feature组成一个更大的feature vector,再用svm分类。
最后一个技巧是结合contextual的信息,将box丢进1000个类的clarifai的net中,将得到的长度为1000的vector结合DeepID-Net产生的长度200的vector,再用svm训练。
对于以上几个技巧,适当组合得到10个model,再针对每一类适当调整weight,就可以得到最终45%的map。
这篇论文的框架是基于RCNN的,使用了selective search来寻找bounding box,然后还用了RCNN作一个简单的过滤,将SVM score太低的box reject掉了。
然后用作者训练的10个不同的DeepID-Net来detection,将结果average之后,再继续regerssion,这样就得到了最后的结果,貌似据作者说有45%。
其中DeepID-Net听麻烦的,它首先用的net是2013年的冠军clarifai的结构,然后先做pretrain,再finetune。除此之外,他还使用了好几个技巧。
首先是mulit-stage,它主要是用了好几层的全链接层,然后每次只训练一层。
然后是结合了dpm这个经典的方法,将convlution之后的结果通过def-layer来做过滤,对bjbect的不同part形成一个限制。
还有sub-box feature,就是将一个box的4个小box的feature抽取出来做max,average之后结合box的feature组成一个更大的feature vector,再用svm分类。
最后一个技巧是结合contextual的信息,将box丢进1000个类的clarifai的net中,将得到的长度为1000的vector结合DeepID-Net产生的长度200的vector,再用svm训练。
对于以上几个技巧,适当组合得到10个model,再针对每一类适当调整weight,就可以得到最终45%的map。
相关文章推荐
- DeepID-Net:multi-stage and deformable deep CNNs for object detection
- 极简笔记 DeepID-Net: Object Detection with Deformable Part Based Convolutional Neural Networks
- End-to-End Learning of Deformable Mixture of Parts and Deep Convolutional Neural Networks for Human
- 论文阅读-《Deformable Part-based Fully Convolutional Network for Object Detection》
- 论文阅读:End-to-End Learning of Deformable Mixture of Parts and Deep Convolutional Neural Networks for H
- [论文解读] MSCNN: A Unified Multi-scale Deep Convolutional Neural Network for Fast Object Detection
- 【Paper】DeepSaliency: Multi-Task Deep NeuralNetwork Model for Salient Object Detection
- Deep Saliency:Multi_Task Deep Neural Network Model for Salient object detection
- MSCNN 论文解析(A Unified Multi-scale Deep Convolutional Neural Network for Fast Object Detection
- MSCNN 论文解析(A Unified Multi-scale Deep Convolutional Neural Network for Fast Object Detection
- 论文笔记 MSCNN:A Unified Multi-scale Deep Convolutional Neural Network for Fast Object Detection
- 多尺度R-CNN论文笔记(5): A Unified Multi-scale Deep Convolutional Neural Network for Fast Object Detection
- Reading Note: Deformable Part-based Fully Convolutional Network for Object Detection
- 目标检测--A Unified Multi-scale Deep Convolutional Neural Network for Fast Object Detection
- READING NOTE: SuperCNN: A Superpixelwise Convolutional Neural Network for Salient Object Detection
- A Deep Convolutional Neural Network for segmenting and classifying epithelial and stromal regions
- Deep Convolutional Network Cascade for Facial Point Detection
- [文献阅读]A Convolutional Neural Network Cascade for Face Detection
- Deep Convolutional Network Cascade for Facial Point Detection阅读笔记
- Region-based Convolutional Networks for Accurate Object Detection and Segmentation----R-CNN论文笔记