您的位置:首页 > 移动开发 > Objective-C

《BING: Binarized Normed Gradients for Objectness Estimation at 300fps》读后感~

2015-03-24 22:58 190 查看
夜深人静了,就想写点什么,早在去年,BING刚一出现就对其进行了关注,CVPR2014的文章,作者提供了详细的源代码,得到了普遍的认可,本文谈谈对BING的一些个人理解,欢迎批评指正!

1. 算法思想

与之前介绍的edge boxes有异曲同工之妙,也是考虑了我们人类观察事物的习惯:先粗看,再细看。BING就是提供一种”粗略检测“的方法,先将目标大概的位置提取出来,主要目的是为了提速,与edge boxes不同,BING是基于学习的,换句话说,我们如果将检测人体,就可以用大量的人体样本训练BING,使得BING专注于人体的检测,这是BING的一大优势所在!下面我们的描述都是基于人体检测。

BING的算法共分为两个阶段,并且两个阶段都是基于SVM的,第一个阶段,用SVM进行二分类,一类是人体,一类是非人体。第二阶段,由于检测出来的BING框框的大小不一,有的大小,比如说高10个像素,宽200个像素,是人体的可能性明显较低,作者采用了对各个框框加权重的方式,对框框内包含人体的可能性进行了排序。两个阶段都基于SVM,干脆直接称呼为cascade SVM。

2. 算法流程

根据BING代码,给出训练阶段算法流程图,如下所示:



3. 结论

BING提供了一种基于学习的目标检测方法,准确率算好的了,进一步可以基于BING框(proposal)进行细致的目标检测,相比较于滑窗方式而言,速度成倍的提高(我采用了评分最高的100个),正检率比滑窗方式低了一些,误检率没有明显提高,速度提高了3倍左右,这种算法思想果断是目标检测以后的一大趋势了!
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: 
相关文章推荐