您的位置:首页 > 其它

Fast-RCNN-阅读理解-笔记

2017-12-08 10:50 281 查看
论文:Fast R-CNN

翻译:http://blog.csdn.net/qq_14839543/article/details/54425051 (这个翻译不是很好呢)

理解参考:http://blog.csdn.net/shenxiaolu1984/article/details/51036677

http://blog.csdn.net/u011534057/article/details/51241831

https://www.cnblogs.com/skyfsm/p/6806246.html

创新点,核心技术:

相比与原本的RCNN中的

1.在图像中确定一定数量的候选框

2.使用深度网络提取每一个候选框的特征

3.使用分类器判断提取出的特征所属的类

4.使用回归器调整正确分类的框的位置.

的方法来说fast-rcnn 将一整张图像送入深度网络中,然后送入候选区域,从特征图像上直接提取对应的候选区域的特征向量.大大减少了训练以及测试的时间消耗.

POI Pooling

近似于单层SPPNet的网络层,这个层可以把不同大小的输入映射到一个固定尺寸的特征向量,再送入分类器进行分类.



使用softmax进行分类操作,该操作直接在网络中完成,使用GPU显存,不需要再在硬盘中存储特征向量,减少了存储空间的开销.

joint training:

重要贡献:同样使用最大规模的网络,Fast RCNN和RCNN相比,训练时间从84小时减少为9.5小时,测试时间从47秒减少为0.32秒。在PASCAL VOC 2007上的准确率相差无几,约在66%-67%之间.
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签:  阅读 fast-r-cnn