Rethinking Training from Scratch for Object Detection
2021-06-16 14:29
1286 查看
Rethinking Training from Scratch for Object Detection
一. 概述
正常训练目标检测的流程分为以下几种:
- 在imagenet上进行预训练,然后在特定数据集进行tune
- 直接在数据集上进行从头训练
两种方式各有千秋,前者可以很快收敛(在特定数据集收敛快),但是训练复杂(预训练实际长)。后者直接训练较为容易(尤其在修改模型结构时),但是训练周期较长(比tune阶段长很多)。这篇文章就是解决从头训练的时长问题,从而达到集成两者的优点(夸大其词的说法)。
二. 流程
论文比较简单,这里进行总结如下:
- 精度和 batchsize 有关,且在一定范围内,越大越好。
- 精度和图像的分辨率(大小)有关,且图像越大分辨率越好,图像过小对精度影响较小。
- 精度和缩放有关,按照分类的缩放进行,不仅提高速度,且精度也比正常缩放效果好。
- 精度和BN层有关,正相关。
按照上述的总结,论文进行改进的训练如下:
使用BN层(当前网络基础结构)
Pretrained先用小尺度图像进行训练,$batchsize$设置较大
数据处理部分-->先将图像缩放到 (H,W)\times(1.0,1.2) ,随机RandomCrop-->(H,W),最后进行Padding到 (h,W)
Finetune阶段按照正常训练即可
三. 总结
- 有一定使用意义,对于大数据集,直接使用此方法较好。
- 对于小的数据集,还是重新训练imagenet比较好
- VOC的数据集太小,而且分布较为散乱,这里对比意义不大。
- 笔者会在实际数据集上尝试之后进行补充(TODO)
相关文章推荐
- 论文阅读:Softer-NMS: Rethinking Bounding Box Regression for Accurate Object Detection
- 《Frustum PointNets for 3D Object Detection from RGB-D Data》论文及代码学习(二)——代码部分
- Training for Tensorflow object detection API
- Frustum PointNets for 3D Object Detection from RGB-D Data 原文 + 阅读笔记
- 目标检测优化技巧(Bag of Freebies for Training Object Detection Neural Networks)
- 《Frustum PointNets for 3D Object Detection from RGB-D Data》论文及代码学习(一)——论文部分
- 【视频变化检测】2017CVPR Spatio-Temporal Self-Organizing Map Deep Network for Dynamic Object Detection from
- 目标检测tricks:Bag of Freebies for Training Object Detection Neural Networks
- 论文笔记:Inception Single Shot MultiBox Detector for object detection
- DeepID-Net:multi-stage and deformable deep convolutional neural network for object detection
- Hibernate:deleted object would be re-saved by cascade (remove deleted object from associations): []
- FPN(Feature Pyramid Networks for Object Detection)安装与训练
- 目标检测“Feature Pyramid Networks for Object Detection”
- Rethinking the Inception Architecture for Computer Vision-Inception-V3
- mAP (mean Average Precision) for Object Detection
- Example rebuttal for "YOLO: Real-Time Object Detection"
- 【深度学习:目标检测】RCNN学习笔记(2):Rich feature hierarchies for accurate object detection and semantic segmentat
- IOS 封装上线 All object files and libraries for bitcode must be generated from.
- 图像检测1-R-CNN-Rich featurehierarchies for accurate object detection and semantic segmentation
- 论文研读--LocNet: Improving Localization Accuracy for Object Detection