移动端_IOS【MFC基础入门】基于Adaboost算法的车牌检测在OpenCV上的研究与实现

目录结构

E:\Adaboost\

   ---------positive\               //正样本文件夹
			---------pimages\       //正样本图片所在文件夹
			---------pos.dat        //正样本集描述文件
			---------pos.vec        //正样本特征集描述文件

   ---------nagative\               //负样本文件夹
   			---------pimages\       //负样本图片所在文件夹
   			---------nag.dat        //正样本集描述文件

正样本

1  收集样本

找617张带有车牌的图片,一开始设置大小 200*200 左右,报内存错误。
后来重做,即将617张图片中的车牌用画图软件截取下来,重新设置大小为60*17,并保存为bmp文件。
我这人比较懒,617张车牌的照片?其实还是不容易找的。我是这样做的:

1.1 先收集类似图片

运用 网页图片保存能手 这个软件批量下载图片(这个软件找的好辛苦,试过其它的有的收费有的基本不能用)
我在百度图片搜的关键词有 “车牌” “车牌号” “苏州车牌” “江苏车牌” 等等,获取了近7000张的图片

1.2 利用以前写的小软件截取车牌

运用自己以前写的小程序:车牌图片截取软件(运用opencv基于纹理检测车牌,由于效果不太好,姑且用来为adboost提供辅助收集车牌图片),
设置好样本图片所在的输入路径,在设置好车牌输出路径,运行即可得到 60*17 大小的bmp图片
下载地址: http://download.csdn.net/detail/mkr127/5374301
PS由于效果不怎么好吗,所以在出来的图片中你得删掉无用的图片,于是,几千张的图片我只收集到了617张车牌图片,哈哈,很麻烦的。
BUG这个小软件有bug,我懒得改,即图片太大如5400*2700有时会出错,还有每次运行的图片不要太多,不然会出错,将图片 2000张一组就没有问题。
当然,如果你不喜欢,可以自己手动截取。

1.3 将得到的617张正样本图片放在E:\Adaboost\positive\pimages\文件夹中

1.4 负样本图片

即不包含车牌的图片,我收集了几千张,用matlab 批量格式化为 200*200大小的bmp图片,放在E:\Adaboost\nagative\pimages\文件夹内

2 创建正负样本描述文件

2.1 正样本描述文件

cd E:\Adaboost\positive
dir pimages /b > pos.dat

运用文本编辑软件对生成的文件 pos.dat 进行替换修改:
a: 将jpg 替换为 jpg 1 0 0 60 17
b: 选择所有,tab键,将tab 替换为图片所在路径
得:


2.1 负样本描述文件

cd E:\Adaboost\nagative
dir pimages /b > nag.dat

运用文本编辑软件对生成的文件 pos.dat 进行替换修改:
选择所有,tab键,将tab 替换为图片所在路径


3 设置环境变量

添加Opencv库中opencv_createsamples的环境变量,以便于在cmd中执行,在path中最后添加 ;C:\OpenCV\opencv\install\bin

4 创建正样本特征集描述文件

打开cmd,进入positive所在文件夹

cd E:\Adaboost\positive
opencv_createsamples -vec pos.vec -info pos.dat -num 617 -w 60 -h 17
//-num 正样本数量 -w图像宽 -h高

如下图所示

在E:\Adaboost\positive下生成pos.vec文件,即正样本特征集描述文件。

5 开始训练

cd E:\Adaboost\nagative
opencv_haartraining -data trainout -vec e:\Adaboost\positive\pos.vec -bg nag.dat -npos 317 -nneg 300 -mem 40000 -mode ALL -w 60 -h 17
//-mem分配的内存大小 -w正样本宽 -h正样本高

//-npos正样本数量,-nneg 负样本数量,至于为什么是这个值,最后将有分析。


6 遇到的错误

6.1 内存不够的错误

那是因为正样本图片太大了,我改为60*17就正常了

6.2 OpenCV Error: Assertion failed (elements_read == 1)

原因:-nneg -npos 参数出错

参考:
http://bbs.csdn.net/topics/390388465
http://askbot.alekcac.webfactional.com/question/3085/why-always-opencv-error-assertion-failed-elements_read-1-in-unknown-function/


我英文不太好 - -!初步分析认为:
假如我有正样本总数 617 ,npos(正样本参数设置的大小,待定);负样本数 nneg 待定(我原有3000张左右), nstages 12

617 >= npos + (12-1)*0.001*npos +nneg

那么假如分配 nneg=300,则

npos<= (617-300)/1.011 = 317

6.3 再次测试

opencv_haartraining -data trainout -vec e:\Adaboost\positive\pos.vec -bg nag.dat -npos 317 -nneg 300 -mem 40000 -mode ALL -w 60 -h 17

问题搞定,我没有设置-nstages=12 也没错,额,待进一步研究。


结果

跑到第四层的时候,跑了一天两夜,仍然是第4阶!哥不淡定了,查查估计是死循环了,网上说适当增加负样本,

那么我在控制台中 Ctrl + C, 注意,是可以断开的,以前我一直不敢...原来在执行训练的话会自动加载 以前训练的级,估计这就是级联吧,都是自己摸索的,纯粹的供大家参考,有不到之处尽请谅解。

我将负样本增至600

opencv_haartraining -data trainout -vec e:\Adaboost\positive\pos.vec -bg nag.dat -npos 317 -nneg 600-mem 40000 -mode ALL -w 60 -h 17

这时候在很短的时间内跑到了第10阶。进一步探究中。


接上

请注意要确保 nag.dat 里面的数据大于600行,因为上一步执行到第10层时停止不动


就停在这里,于是我找到 nag.dat(负样本描述文件)发现里面的数据只有300行,怪不得,于是我追加打到1269行,此时我再执行

E:\Adaboost\nagative>opencv_haartraining -data trainout -vec e:\Adaboost\positive\pos.vec -bg nag.dat -npos 317 -nneg 900 -mem 40000 -mode ALL -w 60 -h 17

继续向下训练

截图为证


报一下我的数据,pos.dat =617行,   pimages =617张     ,  nag.dat= 1269行 , nimages= 1269张

trainout 训练到第十层




继续向下探索,由于我对着个完全没有经验,如果大家觉得太过幼稚简单,可以移步,呵呵,纯当给像我这样的一无所知之人一个借鉴。

仅此而已。


训练结束


得到 分类器:


这时我在增大负样本数到1269 发现到13级就训练结束了,和负样本数为900的没有区别,并且  E:\Adaboost\nagative\trainout.xml 自动更新覆盖为最新版,这下我就不用担心以前的成果白费了,当然,最好做个备份,E:\Adaboost\nagative\trainout 这里面的数据不要删,以后增加正负样本的数量的话我估计会自动累加,呵呵。



接下来开始测试:利用之前写的人脸检测代码,将分类器改成我们测试的分类器,一切就容易起来!

实验的结果还是挺差的,估计是样本太少了,我的正样本才600多,专业的最少都7-8000,也有可能是我的正样本图截的不好,用软件截的,没有手工的准确,再者就是网上的图片不行,真正好的样本还是比较少的。

测试结果:



接下来就是增加样本数量,最后还不好的话,就增大样本质量,哈哈!

如果以后有经历,就写个MFC通用的提取分类器的小程序,用来测试分类器的性能。

本人写的通用小项目下载地址:可以提取分类器进行检测,大家必须配置好OpenCV环境和在源码中设置好分类器的路径。

http://download.csdn.net/detail/mkr127/5397219


项目用到的正样本训练库,额,分有点高,毕竟是本人从几千张图片中一张一张筛选出来的...算是我的辛苦费吧,勿喷我......

http://download.csdn.net/detail/mkr127/5418861

60-17像素bmp车牌 共617张。


7 参考文章

基于Adaboost算法的车牌检测在OpenCV上的研究与实现.pdf 

作者:邓育林

http://wenku.baidu.com/view/5a3f464433687e21af45a971.html

转载请注明出处!