您的位置:首页 > 移动开发 > Objective-C

阅读小结:A-Fast-RCNN: Hard Positive Generation via Adversary for Object Detection

2017-06-16 20:35 597 查看
arXiv: https://arxiv.org/pdf/1704.03414.pdf

What:

1. 目标是去增强  检测器对于遮挡和形变 的泛化能力 

2. 但是数据集中 遮挡和形变 的图像一般较少  

3. 所以作者提出了 adversary的方法去增加 训练难度

4. 整个网络是 基于 Fast-RCNN 而不是 Faster-RCNN



How:

1. 先pretrain Fast-RCNN网络

2. 通过sliding window (如果feature map的大小是6*6,这个window大小是2*2)找到遮住哪部分对网络影响最大,用这个使loss最大的mask来pretrain adverse的部分网络(ASDN)

3. pretrain ASDN使用的loss 是 mask上每个像素做二分类cross entropy loss(其实这里也可以直接regression吧?)

4. pretrain完了以后,实际在训练的时候,ASDN输出的不是二值,而是一个0~1之间的概率。所以可以设置一个阈值,来确定最后到底要dropout哪些。作者实际上是先找到top50% predict出来要dropout的点,然后在这50%的位置里再随机选一些点来drop。实际就是drop了 1/3的位置。

5. 现在都pretrain完了~可以连起来训练了 

6. 另外,4中使用了随机采样,是不可导的。所以作者说可以用rl的方法来处理这部分的回传bp,但没细说。

7. 类似的我们除了可以用dropout 来模拟遮挡,也可以用 stn来模拟 物体的旋转 形变。

8. STN这部分限制了旋转角度为 -10度到10度

9. A-dropout 和 A-stn可以串行
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: 
相关文章推荐