您的位置：首页 > 其它

深度学习目标检测算法性能分析

2017-05-04 09:28 267 查看

参考如下论文2017年最新版：

Speed/accuracy trade-offs for modern convolutional object detectors

Background

本文的目的就是在给定设备与平台的前提下，帮助选择一个合适的检测框架，能够实现速度、准确度、内存的多方面平衡。

Google Research搭建了三种通用检测框架：Faster R-CNN, R-FCN and SSD，

近几年目标检测领域突飞猛进，Faster R-CNN, R-FCN, Multibox, SSD and YOLO等检测算法都足够好，可以放在实际应用中。

可是实践者还是很难决定到底在什么时候取用哪种框架比较合适。

mAP不能告诉你所有的事情。

Meta-architectures基础架构

受分类网络启发，从RCNN到Fast-RCNN，再到后来的Faster-RCNN。这里RCNN到Fast-RCNN都是在神经网络之外提取的候选区域，Faster-RCNN则是在神经网络内部提取的候选区域。

这些工作中比较典型的，就是图像上的一系列不同的空间位置、不同尺度、不同的长宽比例的盒子，来充当“anchor”、“default boxes”“priors”。

于是一个训练模型在一个锚点需要预测两种信息：

（1）为每一个锚点预测一个类别；

（2）为每一个锚点预测x与y方向的偏移量，来确定bounding box；

这个anchor策略使得目标检测的精度与计算量都得到了很大程度的优化。

例如在multibox中，这些anchors是通过对groundtruth中的bounding box聚类得到；

在这篇文章中，主要研究三种基础架构：Faster R-CNN, R-FCN and SSD

为了更科学地对比，将meta-architecture 从 feature extractor中剥离出来。

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航