【yolov5】数据格式、参数、输出结果 分析


参考链接

    1. YOLOv5训练结果分析:一个毕设笔记,其中对于每次yolov5 训练运行后的结果解释的不错。

本文内容

    1. yolov5 的数据格式
    1. 介绍 yolov5 模型中 train,py 的相关参数
    1. 介绍输出展示的内容都是什么含义

一、yolov5 的数据格式

1.1 数据格式:label_index,cx, cy,w,h

  • label_index :为标签名称在标签数组中的索引,下标从 0 开始。
  • cx:标记框中心点的 x 坐标,数值是原始中心点 x 坐标除以 图宽 后的结果。
  • cy:标记框中心点的 y 坐标,数值是原始中心点 y 坐标除以 图高 后的结果。
  • w:标记框的 宽,数值为 原始标记框的 宽 除以 图宽 后的结果。
  • h:标记框的 高,数值为 原始标记框的 高 除以 图高 后的结果。
    图片[1] - 【yolov5】数据格式、参数、输出结果 分析 - MaxSSL
    注:其中的实例即为标记框。

1.2 样例

图片[2] - 【yolov5】数据格式、参数、输出结果 分析 - MaxSSL

1.3 数据集的存储格式

图片[3] - 【yolov5】数据格式、参数、输出结果 分析 - MaxSSL

1.4 yolov5 创建图片名称列表的程序

# -*- coding:utf-8 -*-import osdef create_data_list(root_path, is_val='val'):    txt_path = './yolov5_face_'+str(is_val)+'.txt'    img_root_path = os.path.join( os.path.join(root_path, 'images', is_val) )    with open(txt_path, 'w') as f:        for file_name in os.listdir(img_root_path):            if file_name.split('.')[-1]!= 'jpg':                print('文件名称有误 {}'.format(file_name))            img_path = os.path.join(img_root_path, file_name)            line = '{}\n'.format(img_path)            f.writelines(line)### 图片和标签文件存储的根路径root_path = ''create_data_list(root_path, 'train')create_data_list(root_path, 'val')

二、 train.py 中相关参数

自己尝试修改过的参数

  • –weigths: 指的是训练好的网络模型,用来初始化网络权重。为空时从头开始训练
  • –cfg:网络结构配置文件。其中 nc 表示标签数据中有多少类别。
  • –data:数据路径。数据集存储路径结构参考 1.3 部分。
      1. 指向数据存储的根路径,例如训练集:root_path / images / train / ,此路径下存储所有训练数据的图片。
      1. 指向存储图片路径的 txt 文件,txt 文件每一行内容为一张图片的绝对路径。例如:…/ coco / train2017.txt 。
      1. 无论采用两种方式中的哪一种,此配置文件中都指定了 【标签数量】、【标签名称】。
  • –epochs:训练迭代次数
  • –batch-size:每次喂给神经网络的图片数量,一般设置为 2 的 n 次幂。
  • –imgsz:训练图片尺寸。第一个参数为训练集图片的输入尺寸,第二个参数为测试集图片的输入尺寸,需要设置为 32 的倍数(网络进行过程中会进行 32 倍下采样)。
  • –nosave: 只保留最终网络模型。
      1. default = True ,只保留最后一次的训练结果,中间过程的权重文件(.pt)不进行保存。
      1. default = False , 训练过程中产生的权重文件,进行可选择性的保存。
        图片[4] - 【yolov5】数据格式、参数、输出结果 分析 - MaxSSL
  • –notest :是否只在训练完成后,对验证集进行测试。
    • default = True ,只在训练完成后,进行一次测试。
    • default = False ,每一个 epoch 完成后都对验证集进行测试。
      图片[5] - 【yolov5】数据格式、参数、输出结果 分析 - MaxSSL
  • –device:训练网络的设备cpu还是gpu
  • –project:训练结果保存路径。即输出结果 results.txt 、权重文件,存储的根路径。默认名称为 runs。
  • –name: 训练结果保存文件名。在project 对应的文件夹中,默认问 exp (看到一篇文章中说,超过10个之后,会循环覆盖)。
  • –save-period:训练多少次保存一次网络模型。(应该综合 –nosave 同时考虑)
  • –noautoanchor:是否采用锚点检查。
    • 在Yolo算法中,针对不同的数据集,都会有初始设定长宽的锚框。
      在网络训练中,网络在初始锚框的基础上输出预测框,进而和真实框groundtruth进行比对,计算两者差距,再反向更新,迭代网络参数。
      因此初始锚框也是比较重要的一部分,比如Yolov5在Coco数据集上初始设定的锚框:

  • 但Yolov5中将此功能嵌入到代码中,每次训练时,自适应的计算不同训练集中的最佳锚框值。当然,如果觉得计算的锚框效果不是很好,也可以在代码中将自动计算锚框功能关闭。

  • 控制的代码即train.py中上面一行代码,设置成False,每次训练时,不会自动计算。

以下参数还未尝试修改。

参考链接:https://blog.csdn.net/weixin_42638415/article/details/120799608

  • –hyp: 训练网络的一些超参数设置

  • –rect: 是否采用矩形训练

  • –resume: 指定你之前训练的网络模型,是否从最近的上一个模型开始训练。

  • –evolve:是否寻找最优参数

  • –bucket:gsutil bucket

  • –cache:是否对图片进行缓存,加快训练

  • –image-weights:测试过程中,图像的那些测试地方不太好,对这些不太好的地方加权重

  • –multi-scale:图片尺度变换

  • –single-cls:训练数据集是单类别还是多类别

  • –adam:是否采用adam

  • –sync-bn:分布式训练

  • –local_rank:DDP参数,请勿修改。

  • –workers: 多线程训练,设置最多多少个线程同时进行分布式的训练。个人理解,线程之间的交互也会耗时。

  • –entity :W&B entity

  • –exist-ok: 覆盖掉上一次的结果,不新建训练结果文件

  • –quad:在dataloader时采用什么样的方式读取我们的数据

  • –linear-lr:按照线性的方式去调整学习率

  • –label-smoothing: 对标签平滑,防止过拟合

  • –upload_dataset:Upload dataset as W&B artifact table

  • –bbox_interval:Set bounding-box image logging interval for W&B

三、输出结果分析

3.1 训练时,屏幕中的输出结果

图片[6] - 【yolov5】数据格式、参数、输出结果 分析 - MaxSSL

3.2 log文件,results.txt 文件中的内容分析

参考链接:https://blog.csdn.net/thy0000/article/details/125281995
图片[7] - 【yolov5】数据格式、参数、输出结果 分析 - MaxSSL

  • results.txt中最后三列是验证集结果,前面的是训练集结果。
  • 训练次数,GPU消耗,边界框损失,目标检测损失,分类损失,total,targets,图片大小,P,R,mAP@.5, mAP@.5:.95, 验证集val Box, 验证集val obj, 验证集val cls

四、其他较好的图解

图片[8] - 【yolov5】数据格式、参数、输出结果 分析 - MaxSSL图片[9] - 【yolov5】数据格式、参数、输出结果 分析 - MaxSSL

© 版权声明
THE END
喜欢就支持一下吧
点赞0 分享