您的位置:首页 > 移动开发 > Objective-C

DeepID-Net:multi-stage and deformable deep convolutional neural network for object detection

2014-12-14 20:19 976 查看
这篇论文的工作在ImageNet 的detection task 中rank2,但是组合了一大堆东西,非常麻烦。

这篇论文的框架是基于RCNN的,使用了selective search来寻找bounding box,然后还用了RCNN作一个简单的过滤,将SVM score太低的box reject掉了。



然后用作者训练的10个不同的DeepID-Net来detection,将结果average之后,再继续regerssion,这样就得到了最后的结果,貌似据作者说有45%。

其中DeepID-Net听麻烦的,它首先用的net是2013年的冠军clarifai的结构,然后先做pretrain,再finetune。除此之外,他还使用了好几个技巧。

首先是mulit-stage,它主要是用了好几层的全链接层,然后每次只训练一层。



然后是结合了dpm这个经典的方法,将convlution之后的结果通过def-layer来做过滤,对bjbect的不同part形成一个限制。



还有sub-box feature,就是将一个box的4个小box的feature抽取出来做max,average之后结合box的feature组成一个更大的feature vector,再用svm分类。

最后一个技巧是结合contextual的信息,将box丢进1000个类的clarifai的net中,将得到的长度为1000的vector结合DeepID-Net产生的长度200的vector,再用svm训练。

对于以上几个技巧,适当组合得到10个model,再针对每一类适当调整weight,就可以得到最终45%的map。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: 
相关文章推荐