人脸识别---排序测度特征(Ordinal Measures)
2015-10-14 16:40
302 查看
Abstract—本文主要讲解下排序测度在人脸识别中特征提取的过程。
下面来看一张图(图1)来描述排序测度特征.
图1 虹膜排序测度的提取,最后用了hamming距离来比对数据库的模板。这是提取虹膜特征的一个方法。
从图1可以看出,主流的提取特征的方法都是使用水平朝向的、中等尺度的、单峰形状为低通滤波器的算子来提取近邻图像区域之间的排序测度特征。但是这些方法忽略了虹膜图像中非近邻的排序测
度特征,而非近邻的OM 比相邻的OM 具有更好的分类能力和鲁棒性。基于非邻域比对编码的图像表达方法最先是由Balas 和Sinha 提出[1]。非邻域比对编码也非常适合于人脸。
为了提取多个图像区域之间的排序测度特征,可以用“多极子滤波器”(Dissociated Multi-Pole,DMP),它的定义如下:
f(x,y)=∑mi=1fi(x+xi,y+yi)−∑m+ni=m+1fi(x+xi,y+yi)
式中∑mi=1fi(x+xi,y+yi)(i=1,2,...,m+n)都是低通滤波器,例如Guassian 滤波器、
盒状滤波器等,每个∑mi=1fi(x+xi,y+yi) 称为一个“极”,(x_i,y_i) 表明这个低通滤波器在空间的位置。f(x,y)的系数和为零,确保 OM 完全随机,具有相等的概率
为0或1。例如基于Gaussian 函数的多极子滤波器的定义如下:
DMP=∑N+i=1Ci+2πδ+i√exp[−(X−u+i)22δ+2i]−∑N−j=1Cj−2πδ−j√exp[−(X−u−j)22δ−2j]
式中 μ+i 和δ+i分别表示正峰Gaussian滤波器的中值和标准差, N+ 代表正峰个数,μ−j 和δ−j分别表示负峰Gaussian 滤波器的中值和标准差,N− 代表负峰个数, C−j 和C−j分别代表滤波器中正峰和负峰的个数。为了让每个排序测度特征的信息熵极大化,需要满足:
∑N+i=1Ci+=∑N−j=1Cj−
和偶极子滤波器不同的是,多极子滤波器(见图2)可能由更多的峰组成,每个峰的形状可能不同,相互位置也可以根据识别的需求而定。
图2 各种类型的多极子滤波器
下面介绍下利用多极子滤波器提取人脸的OM特征的过程
提取OM之前先提取了Gabor特征,Gabor特征如上节所讲。图3是原图和某一尺度某一方向的Gabor特征图。
图3 原图和Gabor特征图
图4是多极子滤波器二维图
图4 多极子滤波器二维图
这8个极子对Gabor特征图进行滤波可以得到图5
图5 Gabor-OM特征
对于每一个极子,40个Gabor滤波器滤波结果如图6所示。
图6 每一个极子滤波40个Gabor得到的特征图。
在y方向对分别取块权重,Gabor一共有8个方向,从第一个方向到最后的方向权重分别为128,64,32,16,8,4,2,1相加得到最后的Gabor-OM特征。
得到特征图进行分块直方图统计,每一小块按照64bins进行统计。然后把8极子40个Gabor滤波器的直方图串联起来,假设一共有64小块。就有64个直方图。
图7 人脸图像Gabor-OM直方图特征
从特征的提取来看,Gabor-OM特征提取速度慢。通过与高维LBP的对比实验,Gabor-OM特征比高维LBP特性识别效果略差。
[1] B. Balas and P. Sinha, “Dissociated Dipoles: Image Representation via Non-local
Comparisons”, CBCL Paper #229/AI Memo #2003-018, Massachusetts Institute of
Technology, Cambridge, MA, 2003.
下面来看一张图(图1)来描述排序测度特征.
图1 虹膜排序测度的提取,最后用了hamming距离来比对数据库的模板。这是提取虹膜特征的一个方法。
从图1可以看出,主流的提取特征的方法都是使用水平朝向的、中等尺度的、单峰形状为低通滤波器的算子来提取近邻图像区域之间的排序测度特征。但是这些方法忽略了虹膜图像中非近邻的排序测
度特征,而非近邻的OM 比相邻的OM 具有更好的分类能力和鲁棒性。基于非邻域比对编码的图像表达方法最先是由Balas 和Sinha 提出[1]。非邻域比对编码也非常适合于人脸。
为了提取多个图像区域之间的排序测度特征,可以用“多极子滤波器”(Dissociated Multi-Pole,DMP),它的定义如下:
f(x,y)=∑mi=1fi(x+xi,y+yi)−∑m+ni=m+1fi(x+xi,y+yi)
式中∑mi=1fi(x+xi,y+yi)(i=1,2,...,m+n)都是低通滤波器,例如Guassian 滤波器、
盒状滤波器等,每个∑mi=1fi(x+xi,y+yi) 称为一个“极”,(x_i,y_i) 表明这个低通滤波器在空间的位置。f(x,y)的系数和为零,确保 OM 完全随机,具有相等的概率
为0或1。例如基于Gaussian 函数的多极子滤波器的定义如下:
DMP=∑N+i=1Ci+2πδ+i√exp[−(X−u+i)22δ+2i]−∑N−j=1Cj−2πδ−j√exp[−(X−u−j)22δ−2j]
式中 μ+i 和δ+i分别表示正峰Gaussian滤波器的中值和标准差, N+ 代表正峰个数,μ−j 和δ−j分别表示负峰Gaussian 滤波器的中值和标准差,N− 代表负峰个数, C−j 和C−j分别代表滤波器中正峰和负峰的个数。为了让每个排序测度特征的信息熵极大化,需要满足:
∑N+i=1Ci+=∑N−j=1Cj−
和偶极子滤波器不同的是,多极子滤波器(见图2)可能由更多的峰组成,每个峰的形状可能不同,相互位置也可以根据识别的需求而定。
图2 各种类型的多极子滤波器
下面介绍下利用多极子滤波器提取人脸的OM特征的过程
提取OM之前先提取了Gabor特征,Gabor特征如上节所讲。图3是原图和某一尺度某一方向的Gabor特征图。
图3 原图和Gabor特征图
图4是多极子滤波器二维图
图4 多极子滤波器二维图
这8个极子对Gabor特征图进行滤波可以得到图5
图5 Gabor-OM特征
对于每一个极子,40个Gabor滤波器滤波结果如图6所示。
图6 每一个极子滤波40个Gabor得到的特征图。
在y方向对分别取块权重,Gabor一共有8个方向,从第一个方向到最后的方向权重分别为128,64,32,16,8,4,2,1相加得到最后的Gabor-OM特征。
得到特征图进行分块直方图统计,每一小块按照64bins进行统计。然后把8极子40个Gabor滤波器的直方图串联起来,假设一共有64小块。就有64个直方图。
图7 人脸图像Gabor-OM直方图特征
从特征的提取来看,Gabor-OM特征提取速度慢。通过与高维LBP的对比实验,Gabor-OM特征比高维LBP特性识别效果略差。
[1] B. Balas and P. Sinha, “Dissociated Dipoles: Image Representation via Non-local
Comparisons”, CBCL Paper #229/AI Memo #2003-018, Massachusetts Institute of
Technology, Cambridge, MA, 2003.
相关文章推荐
- Python opencv2 人脸识别
- 基于OpenCV的简单的人脸检测
- 在Android中播放音频和视频--值得学习
- 人脸识别---LBP特征与高维LBP特征
- ios OpenCv的配置和人脸识别技术
- Facebook研究出接近人类水平的脸部识别技术
- 谁是真痛谁在装?计算机的识别能力已远超人类
- PAM脸部识别登录ubuntu
- OpenCV+Dlib进行实时脸部检测
- 7行Python代码的人脸识别
- Qt5.7+Opencv2.4.9人脸识别(一)项目介绍
- SeetaFaceEngine安装和测试
- Qt+Caffe+OpenCV——【一个基于VGG网络的人脸识别考勤系统】
- Opencv与dlib联合进行人脸关键点检测与识别
- 人脸识别总结
- python基于openCV3的人脸识别
- lbp算子实现
- 人脸检测(opencv)
- 人脸识别趟坑历程
- 人脸识别预研