您的位置：首页 > 移动开发 > Objective-C

阅读小结：A-Fast-RCNN: Hard Positive Generation via Adversary for Object Detection

2017-06-16 20:35 597 查看

arXiv: https://arxiv.org/pdf/1704.03414.pdf

What:

1. 目标是去增强检测器对于遮挡和形变的泛化能力

2. 但是数据集中遮挡和形变的图像一般较少

3. 所以作者提出了 adversary的方法去增加训练难度

4. 整个网络是基于 Fast-RCNN 而不是 Faster-RCNN

How:

1. 先pretrain Fast-RCNN网络

2. 通过sliding window （如果feature map的大小是6*6，这个window大小是2*2）找到遮住哪部分对网络影响最大，用这个使loss最大的mask来pretrain adverse的部分网络（ASDN）

3. pretrain ASDN使用的loss 是 mask上每个像素做二分类cross entropy loss（其实这里也可以直接regression吧？）

4. pretrain完了以后，实际在训练的时候，ASDN输出的不是二值，而是一个0～1之间的概率。所以可以设置一个阈值，来确定最后到底要dropout哪些。作者实际上是先找到top50% predict出来要dropout的点，然后在这50%的位置里再随机选一些点来drop。实际就是drop了 1/3的位置。

5. 现在都pretrain完了～可以连起来训练了

6. 另外，4中使用了随机采样，是不可导的。所以作者说可以用rl的方法来处理这部分的回传bp，但没细说。

7. 类似的我们除了可以用dropout 来模拟遮挡，也可以用 stn来模拟物体的旋转形变。

8. STN这部分限制了旋转角度为 -10度到10度

9. A-dropout 和 A-stn可以串行

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航