您的位置：首页 > 移动开发 > Objective-C

论文 Rich feature hierachies for accurate object detection and semantic segmentation(R-CNN)

2017-03-22 15:32 656 查看

1 Introduction

人类视觉区的处理过程是有阶梯的，自下而上的过程。而cnn网络也具有这种特点。为之提供了数学模型。这篇论文介绍了cnn在目标检测的表现。这里我们需要解决两个问题，一个是目标定位，另一个是使用很少的已标记检测数据来训练一个高性能的网络。和图片分类不同，检测需要定位物体，我们使用‘recongnition using region’，在每个image中产生2000个region proposals，将之修改成固定大小，以作cnn的输入，使用cnn进行训练吗，每一个proposal产生固定长度的特征向量，之后使用svm进行分类

2 Object detection with R-cnn

我们一共包括三个模型，第一个就是产生region proposals，第二个就是cnn从每一个region提取特征向量，第三个就是svm。

2.1 Region proposals:使用selective search

Feature extraction:从每一个region中提取一个4096维的特征向量，使用ImageNet里面的那个网络，包括五层卷积层和两个全连接层。在输入cnn之前，我们必须把每一个region都改成cnn输入的样式（227*227），我们选择最简单的，不管形状是啥，都直接warp到固定size。

2.2 Test time detection

特征提取之后，在每一个类中，使用为这个类训练好的svm对特征进行打分。

Run time analysis:一个image中，特征矩阵是2000*4096，svm权重矩阵是4096*N,N是类的数目。

2.3 Training

Supersived pre_training:在ILSVRC 2012上预训练cnn

Domain_specific fine_tuning: 为了是网络适应新的任务，使用新任务继续训练cnn，只需要改变最后一层softmax层，从1000类修改成21类（20类和一个背景），这一层参数初始化，其它层的参数不变，每一个image只有一个标签，所以我们要对每一个region proposal进行标注，使用IOU进行标注，如果使用selective resarch挑选出来的候选框和人工标注的重叠区域IOU大于0.5，就认为这个是正样本，将之标注成物体类别，否则当做负样本，视之为背景。

Object category classifiers:使用IOU来解决部分包括的问题。overlap threshold选择0.3。

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签： 论文

相关文章推荐

新的分享

章节导航