Faster RCNN 源码解读(3.1) -- RPN源码结构介绍
2017-09-15 21:55
344 查看
RPN 总体介绍
这里主要介绍了rpn的模型,其中,包含的主要文件如下:generate_anchors.py: 生成多尺度和多比例的锚点。这里由generate_anthors函数主要完成,可以看到,使用了 3 个尺度( 128, 256, and 512)以及 3 个比例(1:1,1:2,2:1)。一个锚点由w, h, x_ctr, y_ctr固定,也就是宽、高、x center和y center固定。
proposal_layer.py:这个函数是用来将RPN的输出转变为object proposals的。作者新增了ProposalLayer类,这个类中,重新了set_up和forward函数,其中forward实现了:生成锚点box、对于每个锚点提供box的参数细节、将预测框切成图像、删除宽、高小于阈值的框、将所有的(proposal, score) 对排序、获取 pre_nms_topN proposals、获取NMS 、获取 after_nms_topN proposals。
anchor_target_layer.py:生成每个锚点的训练目标和标签,将其分类为1 (object), 0 (not object) , -1 (ignore).当label>0,也就是有object时,将会进行box的回归。其中,forward函数功能:在每一个cell中,生成9个锚点,提供这9个锚点的细节信息,过滤掉超过图像的锚点,测量同GT的overlap。
proposal_target_layer.py:对于每一个object proposal 生成训练的目标和标签,分类标签从0-k,对于标签>0的box进行回归。(注意,同anchor_target_layer.py不同,两者一个是生成anchor,一个是生成proposal)。
generate.py:使用一个rpn生成object proposals。
相关文章推荐
- Faster RCNN 源码解读(1) -- 文件结构分析
- faster rcnn 源码学习-------数据读入及RoIDataLayer相关模块解读 + Train的流程
- faster rcnn 源码解读(二)
- faster rcnn源码解读(四)之数据类型imdb.py和pascal_voc.py(主要是imdb和roidb数据类型的解说)
- faster rcnn源码理解(二)之AnchorTargetLayer(网络中的rpn_data)
- faster rcnn源码解读(三)train_faster_rcnn_alt_opt.py
- 【深度学习:目标检测】 faster rcnn RPN之anchor(generate_anchors)源码解析
- faster rcnn源码解读(四)之数据类型imdb.py和pascal_voc.py(主要是imdb和roidb数据类型的解说)
- Faster RCNN 源码解读(2) -- NMS(非极大抑制)
- faster rcnn源码解读(四)之数据类型imdb.py和pascal_voc.py(主要是imdb和roidb数据类型的解说)
- faster rcnn源码解读(五)之layer(网络里的input-data)
- py-faster-rcnn源码解读系列(五)——stage1_rpn_train.pt
- 卷积神经网络CNN介绍:结构框架,源码理解
- faster rcnn 源码解读
- faster rcnn源码解读(五)之layer(网络里的input-data)
- CTP源码分析7 CTP路由引擎结构及源码分析(一)----TreeRoute.h头文件解读和概要介绍
- faster rcnn 源码解读1
- faster rcnn源码解读(六)之minibatch
- Faster R-CNN论文及源码解读
- faster rcnn RPN之anchor(generate_anchors)源码解析