您的位置：首页 > 移动开发 > Objective-C

《BING: Binarized Normed Gradients for Objectness Estimation at 300fps》读后感~

2015-03-24 22:58 190 查看

夜深人静了，就想写点什么，早在去年，BING刚一出现就对其进行了关注，CVPR2014的文章，作者提供了详细的源代码，得到了普遍的认可，本文谈谈对BING的一些个人理解，欢迎批评指正！

1. 算法思想

与之前介绍的edge boxes有异曲同工之妙，也是考虑了我们人类观察事物的习惯：先粗看，再细看。BING就是提供一种”粗略检测“的方法，先将目标大概的位置提取出来，主要目的是为了提速，与edge boxes不同，BING是基于学习的，换句话说，我们如果将检测人体，就可以用大量的人体样本训练BING，使得BING专注于人体的检测，这是BING的一大优势所在！下面我们的描述都是基于人体检测。

BING的算法共分为两个阶段，并且两个阶段都是基于SVM的，第一个阶段，用SVM进行二分类，一类是人体，一类是非人体。第二阶段，由于检测出来的BING框框的大小不一，有的大小，比如说高10个像素，宽200个像素，是人体的可能性明显较低，作者采用了对各个框框加权重的方式，对框框内包含人体的可能性进行了排序。两个阶段都基于SVM，干脆直接称呼为cascade SVM。

2. 算法流程

根据BING代码，给出训练阶段算法流程图，如下所示：

3. 结论

BING提供了一种基于学习的目标检测方法，准确率算好的了，进一步可以基于BING框（proposal）进行细致的目标检测，相比较于滑窗方式而言，速度成倍的提高（我采用了评分最高的100个），正检率比滑窗方式低了一些，误检率没有明显提高，速度提高了3倍左右，这种算法思想果断是目标检测以后的一大趋势了！

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航