您的位置：首页 > 运维架构

OpenCV学习记录（二）：自己训练haar特征的adaboost分类器进行人脸识别

2017-07-03 21:38 441 查看

上一篇文章中介绍了如何使用OpenCV自带的haar分类器进行人脸识别（点我打开）。

这次我试着自己去训练一个haar分类器，前后花了两天，最后总算是训练完了。不过效果并不是特别理想，由于我是在自己的笔记本上进行训练，为减少训练时间我的样本量不是很大，最后也只是勉强看看效果了。网上有关的资料和博客可以说很多了，只要耐心点总是能成功的。

采集样本：

首先要训练，就得有训练集。网上有很多国外高校开源的库可供下载：

1、卡耐基梅隆大学图像数据库（点我打开）

2、MIT人脸数据库（点我打开）

3、ORL人脸数据库（点我打开）

由于是国外的网站，可能需要翻墙，所以下载可能会有些麻烦。这里给出了我在网上收集的训练集，正样本为20*20的人脸图片，负样本为50*50的背景图片。样本集下载地址：http://download.csdn.net/detail/hongbin_xu/9887672。

准备工作：

在指定目录中放入以下所提到的文件夹及文件。

将正样本放在pos文件夹中，负样本放在neg文件夹中，xml文件夹存放后面训练过程中产生的数据模型，最后opencv会将其转换生成一个xml文件，也就是最终的分类器。

从OpenCv安装目录中查找出如下两个exe可执行文件。

opencv_createsamples.exe：用于创建样本描述文件，后缀名是.vec。专门为OpenCV训练准备，只有正样本需要，负样本不需要。

opencv_haartraining.exe：是OpenCV自带的一个工具，封装了haar特征提取以及adaboost分类器训练过程。

一般来说，正负样本数目比例在1：3的时候训练结果比较好，但是不是绝对。由于每个样本的差异性不同等因素，所以没有绝对的比例关系。但是负样本需要比正样本多，因为原则上说负样本的多样性越大越好，我们才能有效降低误检率，而不仅仅是通过正样本的训练让其能识别物体。为了节约时间，我选了1500个正样本和4500个负样本。

获取样本路径列表：

打开Windows下的命令行窗口，进入指定目录下。

1、建立正样本的描述文件：

首先进入pos文件夹中，输入：

dir /b > pos.txt

在当前pos目录下生成一个pos.txt记录所有图片的名称。

打开记事本，去除pos.txt最后一行的pos文件夹；

将所有

jpg

替换成

jpg 1 0 0 20 20

。这里1表示当前图片重复出现的次数是1， 0 0 20 20表示目标图片大小是矩形框从（0，0）到（20，20）。

2、建立负样本的描述文件：

接下来重新进入neg文件夹，输入：

dir /b > neg.txt

之后，生成neg.txt文件，这里负样本不做其他修改。

3、使用opencv_createsamples.exe建立训练需要的参数列表：

Windows控制台进入指定目录下，我们之前已经在目录下放了opencv_createsamples.exe文件，在控制台下输入opencv_createsamples.exe可以得到各参数信息：

在当前目录下输入如下指令：

opencv_createsamples.exe -vec pos.vec -info pos\pos.txt -bg neg\neg.txt -w 20 -h 20 -num 1500 ；

当前目录下，产生了pos.vec文件。

简要介绍指令：

-vec pos.vec：指定生成的文件，最终生成的就是pos.vec；

-info pos\pos.txt：目标图片描述文件，在pos\pos.txt；

-bg neg\neg.txt：背景图片描述文件，在neg\neg.txt；

-w 20：输出样本的宽度，20；

-h 20：输出样本的高度，20；

-num 1500：要产生的正样本数量，1500；

训练模型：

Windows控制台进入指定目录下，我们之前已经在目录下放了opencv_haartraining.exe文件，在控制台下输入opencv_haartraining.exe可以得到各参数信息：

输入如下指令进行训练：

opencv_haartraining.exe -vec pos.vec -bg neg\neg.txt -data xml -w 20 -h 20 -mem 1024 -npos 1000 -neg 3000 -nstages 2 -nsplits 5

简要介绍指令：

-vec pos.vec：正样本文件名；

-bg neg\neg.txt：背景描述文件；

-data xml：指定存放训练好的分类器的路径名，也就是前面建立的xml文件夹；

-w 20：样本图片宽度，20；

-h 20：样本图片高度，20；

-mem 1024：提供的以MB为单位的内存，很明显，这个值越大，提供的内存越多，运算也越快；

-npos 1000：取1000个正样本，小于总正样本数；

-neg 3000：取3000个负样本，小于总负样本数；

-nstages 2：指定训练层数，层数越高耗时越长；

-nsplits 5：分裂子节点数目, 默认值为2；

其他参数：

-minhitrate：最小命中率，即训练目标准确度；

-maxfalsealarm：最大虚警(误检率)，每一层训练到这个值小于0.5时训练结束，进入下一层训练；

-sym或者-nonsym：脸是否垂直对称，若是，则选前者，且可以加快训练速度。

输入指令之后就是等待了，最后可以看到结果如下：

这里我的层数太少了，导致训练结果不是很好，一般要增加到15~20层才能有较好的效果。

中间可能遇到的问题：

可能在训练的过程中，过了很长时间但是却一直停留在某一层不动，上网查找解决办法如下：增大负样本数目，增大负样本之间的变化! 增加负样本，然后重新接着训练，注意更改负样本的数目。

详细说明可以查看：http://blog.csdn.net/jimeshui/article/details/42039615

参考链接：

1.http://blog.csdn.net/yangleo1987/article/details/52883864

2.http://blog.csdn.net/u014365862/article/details/52997019

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航