您的位置：首页 > 移动开发 > Objective-C

DeepID-Net:multi-stage and deformable deep convolutional neural network for object detection

2014-12-14 20:19 976 查看

这篇论文的工作在ImageNet 的detection task 中rank2,但是组合了一大堆东西，非常麻烦。

这篇论文的框架是基于RCNN的，使用了selective search来寻找bounding box，然后还用了RCNN作一个简单的过滤，将SVM score太低的box reject掉了。

然后用作者训练的10个不同的DeepID-Net来detection，将结果average之后，再继续regerssion，这样就得到了最后的结果，貌似据作者说有45%。

其中DeepID-Net听麻烦的，它首先用的net是2013年的冠军clarifai的结构，然后先做pretrain，再finetune。除此之外，他还使用了好几个技巧。

首先是mulit-stage，它主要是用了好几层的全链接层，然后每次只训练一层。

然后是结合了dpm这个经典的方法，将convlution之后的结果通过def-layer来做过滤，对bjbect的不同part形成一个限制。

还有sub-box feature,就是将一个box的4个小box的feature抽取出来做max，average之后结合box的feature组成一个更大的feature vector，再用svm分类。

最后一个技巧是结合contextual的信息，将box丢进1000个类的clarifai的net中，将得到的长度为1000的vector结合DeepID-Net产生的长度200的vector，再用svm训练。

对于以上几个技巧，适当组合得到10个model，再针对每一类适当调整weight，就可以得到最终45%的map。

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航