一、准备阶段

二、图片处理

三、生成描述文件

四、生成.vec文件

五、生成.xml自定义分类器文件

六、识别检测

一、准备阶段

正样本集：正样本集为包含“识别物体”的灰度图，一般大于等于2000张，尺寸不能太大，尺寸太大会导致训练时间过长。

负样本集：负样本集为不含“识别物体”的任何图片，一般大于等于5000张，尺寸比正样本集稍大。一般为正样品集的3倍。

在当前文件夹下新建五个文件夹，pos和neg放处理后的图片，ini_pos和ini_neg放原来的图像，xml放以后自定义生成的分类器

将下载的正负样本集分别放入ini_pos和ini_neg文件夹。

我百度图片上下载了船的图片到ini_pos,鱼的图片到ini_neg

注意：好的正训练集最好还是图片中只有你需要的物体，而没有其他物体和背景干扰，百度图片里面有动图gif格式图片，不能通过opencv读取，下载完后看好图片后缀。

下面是初始的俩个样品集

二、图片处理

样品集需要统一大小和统一改为灰度图

代码：

import cv2 as cvimport matplotlib.pyplot as pltimport os#解决中文显示问题,固定格式，直接复制下面俩行代码就行plt.rcParams['font.sans-serif']=['SimHei']plt.rcParams['axes.unicode_minus']=Falsepospath = "./ini_pos"#正样本集文件夹路径pos = os.listdir(pospath)#读取路径下的所有文件negpath = "./ini_neg"neg = os.listdir(negpath)#图片处理，注意图片不能有gif格式def picdif():    global pos,neg;    i=1;    for picname in pos:#遍历pos文件数组所有的文件名        #读取灰度图        pic=cv.imread(pospath+"\\"+picname)        pic=cv.cvtColor(pic,cv.COLOR_BGR2GRAY)        #修改尺寸        pic=cv.resize(pic,(40,40))        #保存图片        cv.imwrite("./pos/"+str("%03d"%i)+".jpg",pic)        i+=1    #同理对负样本集进行处理    j = 1;    for picname in neg: # 遍历neg文件数组所有的文件名        #读取灰度图        pic=cv.imread(negpath+"\\"+picname)        pic=cv.cvtColor(pic,cv.COLOR_BGR2GRAY)        #修改尺寸        pic=cv.resize(pic,(50,50))        #重命名，并保存图片        cv.imwrite("./neg/"+str("%03d"%j)+".jpg",pic)        j+=1if __name__ == '__main__':# 1.导入文件夹，对图像统一处理,统一尺寸大小，统一灰度图    picdif()

处理后的正负样本集和图片：

三、生成描述文件

正样本描述文件如下：

其中”1″为图片数量（0,0）坐标，（40,40）是正样本集的长宽

负样本描述文件如下：

代码更新：

a_main.py

import cv2 as cvimport os#解决中文显示问题,固定格式，直接复制下面俩行代码就行plt.rcParams['font.sans-serif']=['SimHei']plt.rcParams['axes.unicode_minus']=Falsepospath = "./ini_pos"#正样本集文件夹路径pos = os.listdir(pospath)#读取路径下的所有文件negpath = "./ini_neg"neg = os.listdir(negpath)#图片处理，注意图片不能有gif格式def picdif():    global pos,neg;    i=1;    for picname in pos:#遍历pos文件数组所有的文件名        #读取灰度图        pic=cv.imread(pospath+"\\"+picname)        pic=cv.cvtColor(pic,cv.COLOR_BGR2GRAY)        #修改尺寸        pic=cv.resize(pic,(40,40))        #保存图片        cv.imwrite("./pos/"+str("%03d"%i)+".jpg",pic)        i+=1    #同理对负样本集进行处理    j = 1;    for picname in neg: # 遍历neg文件数组所有的文件名        #读取灰度图        pic=cv.imread(negpath+"\\"+picname)        pic=cv.cvtColor(pic,cv.COLOR_BGR2GRAY)        #修改尺寸        pic=cv.resize(pic,(50,50))        #重命名，并保存图片        cv.imwrite("./neg/"+str("%03d"%j)+".jpg",pic)        j+=1# 描述文件生成def createtxt():    global pos, neg    #正样本描述文件：    for picname in pos:        line ="pos/"+picname+" />

`四、生成.vec文件`

获取opencv_createsamples.exe和opencv_traincascade.exe

这两个软件在opencv安装包里是没有的，只有下载opencv以及opencv_contrib源码自己编译才会生成这两个可执行程序

我是直接下载别人的程序，下面是网址

opencv341_bin: 编译opencv以及opencv_contrib以后的bin文件夹，里面包含一些可执行程序https://gitee.com/lizaozao/opencv341_bin注意下载依赖项解压到opencv_createsamples.exe和opencv_traincascade.exe同一目录下

在该主目录文件下打开终端窗口，win11可直接通过右键“在终端打开”

输入

 .\opencv_createsamples.exe -info pos.txt -vec detect_number.vec -bg neg.txt -num 19 -w 40 -h 40
-info 正样本txt
-vec 是你生成vec文件的位置和名称
-bg 负样本txt
-num 正样本数量
-w 正样本宽度
-h 正样本高度

`五、生成.xml自定义分类器文件`

当前主目录文件夹终端下输入

./opencv_traincascade.exe -data xml -vec detect_number.vec -bg neg.txt -numPos 19 -numNeg 25 -numStages 20 -featureType HAAR -w 40 -h 40
-data 前面创建好的xml文件夹 -vec 是你之前生成vec文件 -bg 负样本集txt -numPos 正样本的数量 -numNeg 负样本的数量 -numStages 训练步数 -featureType 特征类型
训练时，提取图像特征的类型，目前只支持LBP、HOG、Haar三种特征。但是HAAR训练非常非常的慢，而LBP则相对快很多，因为HAAR需要浮点运算，精度自然比LBP更高 -w -h 正样本的宽高

结果：

由于样本较少，训练十秒就完成了

`六、识别检测`

上一节课已经说了，直接上代码

[图像识别]12.Opencv案例超简单人脸检测识别_ζั͡ ั͡雾 ั͡狼 ั͡✾的博客-CSDN博客1.原理：我们使用机器学习的方法完成人脸检测，首先需要大量的正样本图像(面部图像)和负样本图像(不含面部的图像)来训练分类器。我们需要从其中提取特征。Haar特征（这个值等于黑色矩形中的像素值之后减去白色矩形中的像素值和。）会被使用，就像我们的卷积核,每一个特征是一个值。Haar特征值反映了图像的灰度变化情况。Haar特征可用于于图像任意位置，大小也可以任意改变，所以矩形特征值是矩形模版类别、矩形位置和矩形大小这三个因素的函数。故类别、大小和位置的变化，使得很小的检测窗口含有非常多的矩形特征。https://blog.csdn.net/qq_54263076/article/details/127155374" />

由于所选样本太太太太少，且有些正样本不纯不好，导致结果偏差比较大

根据以上教程，可以不断像文件夹添加样本图片达到上千，生成.vec和.xml文件，完成自己的物品识别，完整代码放在下面，可以自己下载修改

https://download.csdn.net/download/qq_54263076/86736208https://download.csdn.net/download/qq_54263076/86736208

（终章）[图像识别]13.OpenCV案例自定义训练集分类器物体检测

一、准备阶段

二、图片处理

三、生成描述文件

`四、生成.vec文件`

`五、生成.xml自定义分类器文件`

`六、识别检测`

`最新关注`

`热文推荐`

`Java定时器 @Scheduled注解的使用`

`github简单使用`

`C语言中三个数比较大小详解——三种方法`

`Web3.0到底是什么？`

`vscode`

`基于NUXT.JS搭建一款VUE版SSR前端框架（解决SPA应用的SEO优化优化问题）`

（终章）[图像识别]13.OpenCV案例 自定义训练集分类器物体检测

一、准备阶段

二、图片处理

<img decoding="async" class="aligncenter" src="https://img.maxssl.com/uploads/?url=https://img-blog.csdnimg.cn/34b9f6ac1fd249ad84c3c9eb45acfeeb.jpeg">三、生成描述文件

四、生成.vec文件

五、生成.xml自定义分类器文件

六、识别检测

相关文章

最新关注

热文推荐

（终章）[图像识别]13.OpenCV案例自定义训练集分类器物体检测

三、生成描述文件

`四、生成.vec文件`

`五、生成.xml自定义分类器文件`

`六、识别检测`

`相关文章`

`最新关注`

`热文推荐`