OpenCV学习记录(二):自己训练haar特征的adaboost分类器进行人脸识别
2017-07-03 21:38
441 查看
上一篇文章中介绍了如何使用OpenCV自带的haar分类器进行人脸识别(点我打开)。
这次我试着自己去训练一个haar分类器,前后花了两天,最后总算是训练完了。不过效果并不是特别理想,由于我是在自己的笔记本上进行训练,为减少训练时间我的样本量不是很大,最后也只是勉强看看效果了。网上有关的资料和博客可以说很多了,只要耐心点总是能成功的。
1、卡耐基梅隆大学图像数据库(点我打开)
2、MIT人脸数据库(点我打开)
3、ORL人脸数据库(点我打开)
由于是国外的网站,可能需要翻墙,所以下载可能会有些麻烦。这里给出了我在网上收集的训练集,正样本为20*20的人脸图片,负样本为50*50的背景图片。样本集下载地址:http://download.csdn.net/detail/hongbin_xu/9887672。
将正样本放在pos文件夹中,负样本放在neg文件夹中,xml文件夹存放后面训练过程中产生的数据模型,最后opencv会将其转换生成一个xml文件,也就是最终的分类器。
从OpenCv安装目录中查找出如下两个exe可执行文件。
opencv_createsamples.exe:用于创建样本描述文件,后缀名是.vec。专门为OpenCV训练准备,只有正样本需要,负样本不需要。
opencv_haartraining.exe:是OpenCV自带的一个工具,封装了haar特征提取以及adaboost分类器训练过程。
一般来说,正负样本数目比例在1:3的时候训练结果比较好,但是不是绝对。由于每个样本的差异性不同等因素,所以没有绝对的比例关系。但是负样本需要比正样本多,因为原则上说负样本的多样性越大越好,我们才能有效降低误检率,而不仅仅是通过正样本的训练让其能识别物体。为了节约时间,我选了1500个正样本和4500个负样本。
1、建立正样本的描述文件:
首先进入pos文件夹中,输入:
在当前pos目录下生成一个pos.txt记录所有图片的名称。
打开记事本,去除pos.txt最后一行的pos文件夹;
将所有
2、建立负样本的描述文件:
接下来重新进入neg文件夹,输入:
之后,生成neg.txt文件,这里负样本不做其他修改。
3、使用opencv_createsamples.exe建立训练需要的参数列表:
Windows控制台进入指定目录下,我们之前已经在目录下放了opencv_createsamples.exe文件,在控制台下输入opencv_createsamples.exe可以得到各参数信息:
在当前目录下输入如下指令:
当前目录下,产生了pos.vec文件。
简要介绍指令:
-vec pos.vec:指定生成的文件,最终生成的就是pos.vec;
-info pos\pos.txt:目标图片描述文件,在pos\pos.txt;
-bg neg\neg.txt:背景图片描述文件,在neg\neg.txt;
-w 20:输出样本的宽度,20;
-h 20:输出样本的高度,20;
-num 1500:要产生的正样本数量,1500;
输入如下指令进行训练:
简要介绍指令:
-vec pos.vec:正样本文件名;
-bg neg\neg.txt:背景描述文件;
-data xml:指定存放训练好的分类器的路径名,也就是前面建立的xml文件夹;
-w 20:样本图片宽度,20;
-h 20:样本图片高度,20;
-mem 1024:提供的以MB为单位的内存,很明显,这个值越大,提供的内存越多,运算也越快;
-npos 1000:取1000个正样本,小于总正样本数;
-neg 3000:取3000个负样本,小于总负样本数;
-nstages 2:指定训练层数,层数越高耗时越长;
-nsplits 5:分裂子节点数目, 默认值 为2;
其他参数:
-minhitrate:最小命中率,即训练目标准确度;
-maxfalsealarm:最大虚警(误检率),每一层训练到这个值小于0.5时训练结束,进入下一层训练;
-sym或者-nonsym:脸是否垂直对称,若是,则选前者,且可以加快训练速度。
输入指令之后就是等待了,最后可以看到结果如下:
这里我的层数太少了,导致训练结果不是很好,一般要增加到15~20层才能有较好的效果。
详细说明可以查看:http://blog.csdn.net/jimeshui/article/details/42039615
参考链接:
1.http://blog.csdn.net/yangleo1987/article/details/52883864
2.http://blog.csdn.net/u014365862/article/details/52997019
这次我试着自己去训练一个haar分类器,前后花了两天,最后总算是训练完了。不过效果并不是特别理想,由于我是在自己的笔记本上进行训练,为减少训练时间我的样本量不是很大,最后也只是勉强看看效果了。网上有关的资料和博客可以说很多了,只要耐心点总是能成功的。
采集样本:
首先要训练,就得有训练集。网上有很多国外高校开源的库可供下载:1、卡耐基梅隆大学图像数据库(点我打开)
2、MIT人脸数据库(点我打开)
3、ORL人脸数据库(点我打开)
由于是国外的网站,可能需要翻墙,所以下载可能会有些麻烦。这里给出了我在网上收集的训练集,正样本为20*20的人脸图片,负样本为50*50的背景图片。样本集下载地址:http://download.csdn.net/detail/hongbin_xu/9887672。
准备工作:
在指定目录中放入以下所提到的文件夹及文件。将正样本放在pos文件夹中,负样本放在neg文件夹中,xml文件夹存放后面训练过程中产生的数据模型,最后opencv会将其转换生成一个xml文件,也就是最终的分类器。
从OpenCv安装目录中查找出如下两个exe可执行文件。
opencv_createsamples.exe:用于创建样本描述文件,后缀名是.vec。专门为OpenCV训练准备,只有正样本需要,负样本不需要。
opencv_haartraining.exe:是OpenCV自带的一个工具,封装了haar特征提取以及adaboost分类器训练过程。
一般来说,正负样本数目比例在1:3的时候训练结果比较好,但是不是绝对。由于每个样本的差异性不同等因素,所以没有绝对的比例关系。但是负样本需要比正样本多,因为原则上说负样本的多样性越大越好,我们才能有效降低误检率,而不仅仅是通过正样本的训练让其能识别物体。为了节约时间,我选了1500个正样本和4500个负样本。
获取样本路径列表:
打开Windows下的命令行窗口,进入指定目录下。1、建立正样本的描述文件:
首先进入pos文件夹中,输入:
dir /b > pos.txt
在当前pos目录下生成一个pos.txt记录所有图片的名称。
打开记事本,去除pos.txt最后一行的pos文件夹;
将所有
jpg替换成
jpg 1 0 0 20 20。这里1表示当前图片重复出现的次数是1, 0 0 20 20表示目标图片大小是矩形框从(0,0)到(20,20)。
2、建立负样本的描述文件:
接下来重新进入neg文件夹,输入:
dir /b > neg.txt
之后,生成neg.txt文件,这里负样本不做其他修改。
3、使用opencv_createsamples.exe建立训练需要的参数列表:
Windows控制台进入指定目录下,我们之前已经在目录下放了opencv_createsamples.exe文件,在控制台下输入opencv_createsamples.exe可以得到各参数信息:
在当前目录下输入如下指令:
opencv_createsamples.exe -vec pos.vec -info pos\pos.txt -bg neg\neg.txt -w 20 -h 20 -num 1500 ;
当前目录下,产生了pos.vec文件。
简要介绍指令:
-vec pos.vec:指定生成的文件,最终生成的就是pos.vec;
-info pos\pos.txt:目标图片描述文件,在pos\pos.txt;
-bg neg\neg.txt:背景图片描述文件,在neg\neg.txt;
-w 20:输出样本的宽度,20;
-h 20:输出样本的高度,20;
-num 1500:要产生的正样本数量,1500;
训练模型:
Windows控制台进入指定目录下,我们之前已经在目录下放了opencv_haartraining.exe文件,在控制台下输入opencv_haartraining.exe可以得到各参数信息:输入如下指令进行训练:
opencv_haartraining.exe -vec pos.vec -bg neg\neg.txt -data xml -w 20 -h 20 -mem 1024 -npos 1000 -neg 3000 -nstages 2 -nsplits 5
简要介绍指令:
-vec pos.vec:正样本文件名;
-bg neg\neg.txt:背景描述文件;
-data xml:指定存放训练好的分类器的路径名,也就是前面建立的xml文件夹;
-w 20:样本图片宽度,20;
-h 20:样本图片高度,20;
-mem 1024:提供的以MB为单位的内存,很明显,这个值越大,提供的内存越多,运算也越快;
-npos 1000:取1000个正样本,小于总正样本数;
-neg 3000:取3000个负样本,小于总负样本数;
-nstages 2:指定训练层数,层数越高耗时越长;
-nsplits 5:分裂子节点数目, 默认值 为2;
其他参数:
-minhitrate:最小命中率,即训练目标准确度;
-maxfalsealarm:最大虚警(误检率),每一层训练到这个值小于0.5时训练结束,进入下一层训练;
-sym或者-nonsym:脸是否垂直对称,若是,则选前者,且可以加快训练速度。
输入指令之后就是等待了,最后可以看到结果如下:
这里我的层数太少了,导致训练结果不是很好,一般要增加到15~20层才能有较好的效果。
中间可能遇到的问题:
可能在训练的过程中,过了很长时间但是却一直停留在某一层不动,上网查找解决办法如下:增大负样本数目,增大负样本之间的变化! 增加负样本,然后重新接着训练,注意更改负样本的数目。详细说明可以查看:http://blog.csdn.net/jimeshui/article/details/42039615
参考链接:
1.http://blog.csdn.net/yangleo1987/article/details/52883864
2.http://blog.csdn.net/u014365862/article/details/52997019
相关文章推荐
- OpenCV学习记录(二):自己训练haar特征的adaboost分类器进行人脸识别 标签: 脸部识别opencv 2017-07-03 21:38 26人阅读
- OpenCV学习笔记(三十一)——让demo在他人电脑跑起来 OpenCV学习笔记(三十二)——制作静态库的demo,没有dll也能hold住 OpenCV学习笔记(三十三)——用haar特征训练自己
- 用opencv的traincascade.exe训练行人的HAAR、LBP和HOG特征的xml文件,并对分类器进行加载和检测
- 自己训练haar特征的adaboost分类器
- iOS开发之opencv学习笔记三:训练一套自己的特征库
- 利用Hog特征和SVM分类器进行行人检测(自己收集正反例样本训练分类器)
- opencv_cascade级联分类器训练haar、LBP特征
- 训练自己的haar-like特征分类器并识别物体(3)
- 利用OpenCV的Haar特征目标检测方法进行人脸识别的尝试(一)
- OpenCV源码中Haar训练及提取特征的代码
- OpenCV Haar特征分类器的训练
- 【原】训练自己haar-like特征分类器并识别物体(1)
- 训练自己haar-like特征分类器并识别物体(2)
- Adaboost应用系列之一:Opencv2.0中利用Adaboost训练Haar特征产生xml分类器
- 学习Haar-Like特征和AdaBoost进行人脸识别
- 利用Opencv中的Haartraining训练特征的经验谈.....
- OpenCV学习笔记之二――基于Haar-like特征的层叠推进分类器快速
- OpenCV学习笔记:基于Haar特征的人脸检测
- 【原】训练自己haar-like特征分类器并识别物体(1)
- 用opencv自带的traincascade.exe训练给予haar特征和LBP特征的分类器