您的位置:首页 > 其它

方向梯度直方图(HOG)阅读笔记

2017-09-05 12:33 253 查看
在2005年的CVPR会议上,Dalal大牛首次提出了HOG这一概念,起初是用于行人检测(Pedestrian
Detection),现在已经被广泛用于各类图像识别算法中,一般模式是HOG提取特征+SVM分类。这里记录一下HOG的基本思想和概念。

首先来看一下摘自Dalal的HOG论文中的一句话:The basic idea is that local object
appearance and shape can often be characterized rather well by the
distribution of local intensity gradients or edge
directions. 这句话即很好地概括了HOG的中心思路:所检测的局部物体外形能够被光强梯度或边缘方向的分布所描述。

具体步骤可见论文,这里详细说一下较难理解的cell和block部分。

在对每个像素计算过梯度之后,就可以开始构建cell,一般对于行人检测算法而言,选取6*6个像素构成一个cell,假设我们采用9个bin的直方图来统计这6*6个像素的梯度信息。也就是将cell的梯度方向360度分成9个方向块,一个方向块对应的梯度范围有360/9=40度,比如一个像素的梯度方向是10度
,则对应到第一个方向块的值加x,x数值具体为几,取决于该梯度对应的投影权值大小。

然后是block,比如选取2*2个cell组成一个block。扫描整个图像时,是以block为单位对图像进行扫描,每次扫描步长为一个cell,如下图所示:




第一次扫描的是蓝色区域,第二次扫描前进一个cell的步长,因此到达红色区域,而红蓝交界的地方,即是论文中提到的overlapping,是否需要overlapping,可以根据情况不同而选择。比如对人物头像进行切割时,如果正好把眼睛从中间切割并且分到了两个block中,提取完HOG特征之后,这会影响接下来的分类效果,但是如果两个bloch之间overlap,那么至少在一个block中会有完整的眼睛。但很自然,这么做无疑也会增大计算量。

以上。
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息
标签: