您的位置:首页 > 移动开发 > Objective-C

Rich feature hierarchies for accurate object detection and semantic segmentation

2015-09-28 08:00 411 查看
《Rich feature hierarchies for accurate object detection and semantic segmentation》文章总结

一、文章的整体框架如下:






二、 文章的亮点:

1)使用了CNN来获取自下而上的region特征,以此来定位和分割目标。

2)由于带标签数据比较少,文章使用了带监督的pre-training(此处采用的是ImageNet2012来进行网络预训练或者是直接利用文章中的参数来初始化自己的网络),随后又使用domain-specific fine-tuning来进行针对性的训练,取得了一定的效果提升。

三、 提取区域proposals

文中使用的方式是,采用随机采样的方法:即每幅图像随机采取2000个大小不一的regions,来作为训练样本。其中正负样本的定义是根据regions和ground truth之间的IoU的大小,采取一个阈值来区分的。

四、 区域size转化

得到了regions之后,要把regions转化为ImageNet CNN 所需要的size,文中提供了几种方法,具体参见论文。

五、 CNN特征提取

文中使用了NIPs2012文章中的网络来获取特征,网络包含5个卷积层,两个全连接层。

使用了supervised pre-training来获取网络的初始参数;使用domain-specific fine-tuning 来获取更加适合特定问题的网络参数,并且以此来获得region的特征。

六、 目标定位与检测

文章使用的是Linear SVM进行最后的分类或者说是目标检测,为什么不适用softmax呢?文章中说softmax效果没有linear SVM好,所以就是用linear SVM!

文章最后使用了非最大值抑制方法来获取最后的目标检测结果。同时文章中还引入了bounding box regression 来获取位置和大小更加合适的objectness,可以借鉴。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: