yolov5训练自己的数据集

1.安装cuda

　　可以先看看自己的显卡信息，支持哪个cuda版本

　　cuda下载地址：https://developer.nvidia.com/cuda-toolkit-archive

　　我的RTX3060，下载的cuda11.8

　　下载后安装，直接默认安装到底，然后打开cmd，输入nvcc -V

　2.安装cudnn

　　需要安装和cuda版本对应的cudnn

　　地址：https://developer.nvidia.com/rdp/cudnn-archive

　　下载对应的版本，解压替换到cuda安装目录下

3.安装Pytorch

　　我使用的是conda默认的环境，python3.9

　　进入pytorch官网：https://pytorch.org/

　　找到对应的版本下载，我这里不指定torch版本，直接运行

　　pip3 install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118

　　等待安装完成即可

4.安装标注软件

　　pip install labelImg

　　安装成功后直接运行 labelImg 打开软件

　　open dir打开图片文件夹，change save dir 选择保存的xml文件的文件夹

　　create rectBox去框选需要检测的目标，输入label name

　　标注完自己的数据

　　一个img图片文件夹，一个和图片对应的xml文件夹

5. 将数据集进行分割

　　执行下面代码，即可得到分割好的数据集

import os

import random

import shutil

img_path = 'img'

xml_path = 'xml'

def split_file_name(file_name):

    f_name, _ = file_name.split('.')

    return f_name

def split_move_file(target_path, save_basic_path, train_scale=0.9):

    train_img_path = os.path.join(save_basic_path, 'images/train')

    train_xml_path = os.path.join(save_basic_path, 'xml/train')

    val_img_path = os.path.join(save_basic_path, 'images/val')

    val_xml_path = os.path.join(save_basic_path, 'xml/val')

    print(save_basic_path, train_img_path)

    if not os.path.exists(train_img_path):

        os.makedirs(train_img_path)

    if not os.path.exists(train_xml_path):

        os.makedirs(train_xml_path)

    if not os.path.exists(val_img_path):

        os.makedirs(val_img_path)

    if not os.path.exists(val_xml_path):

        os.makedirs(val_xml_path)

    img_file_path = os.path.join(target_path, img_path)

    file_list = os.listdir(img_file_path)

    # print(file_list)

    # 得到名字列表

    file_name_li = list(map(lambda x: split_file_name(x), file_list))

    random.shuffle(file_name_li)

    # print(file_name_li)

    train_ind = int(len(file_name_li) * train_scale)

    train_data = file_name_li[:train_ind]

    val_data = file_name_li[train_ind:]

    print('total number', len(file_name_li))

    print('train number', len(train_data))

    print('val number', len(val_data))

    for file in train_data:

        file_path = os.path.join(img_file_path, file+'.jpg')

        save_path = os.path.join(train_img_path, file+'.jpg')

        if not os.path.exists(file_path):

            file_path = os.path.join(img_file_path, file + '.jpeg')

            save_path = os.path.join(train_img_path, file + '.jpg')

            if not os.path.exists(file_path):

                file_path = os.path.join(img_file_path, file + '.png')

                save_path = os.path.join(train_img_path, file + '.png')

        if os.path.exists(file_path):

            shutil.copyfile(file_path, save_path)

        # xml文件

        xml_file_path = os.path.join(target_path, xml_path)

        file_path = os.path.join(xml_file_path, file + '.xml')

        save_path = os.path.join(train_xml_path, file + '.xml')

        if os.path.exists(file_path):

            shutil.copyfile(file_path, save_path)

    for file in val_data:

        file_path = os.path.join(img_file_path, file+'.jpg')

        save_path = os.path.join(val_img_path, file+'.jpg')

        if not os.path.exists(file_path):

            file_path = os.path.join(img_file_path, file + '.jpeg')

            save_path = os.path.join(val_img_path, file + '.jpg')

            if not os.path.exists(file_path):

                file_path = os.path.join(img_file_path, file + '.png')

                save_path = os.path.join(val_img_path, file + '.png')

        if os.path.exists(file_path):

            shutil.copyfile(file_path, save_path)

        # xml文件

        xml_file_path = os.path.join(target_path, xml_path)

        file_path = os.path.join(xml_file_path, file + '.xml')

        save_path = os.path.join(val_xml_path, file + '.xml')

        if os.path.exists(file_path):

            shutil.copyfile(file_path, save_path)

if __name__ == '__main__':

    target_path = r'C:\Users\mojia\Desktop\maizi\maozi20230326'

    save_basic_path = r'C:\Users\mojia\Desktop\maizi\maozi20230326_train_val'

    if not os.path.exists(save_basic_path):

        os.mkdir(save_basic_path)

    scale = 0.9     # 训练集比例

    split_move_file(target_path, save_basic_path, scale)

6. 将标注的xml文件转换为txt文件格式

import xml.etree.ElementTree as ET

import os

def convert(size, box):

    dw = 1. / (size[0])

    dh = 1. / (size[1])

    x = (box[0] + box[1]) / 2.0 - 1

    y = (box[2] + box[3]) / 2.0 - 1

    w = box[1] - box[0]

    h = box[3] - box[2]

    x = x * dw

    w = w * dw

    y = y * dh

    h = h * dh

    if w >= 1:

        w = 0.99

    if h >= 1:

        h = 0.99

    return (x, y, w, h)

folder_li = ['train', 'val']

def convert_annotation(rootpath, classes):

    labelpath = rootpath + '/labels'  # 生成的.txt文件会被保存在labels目录下

    if not os.path.exists(labelpath):

        os.makedirs(labelpath)

    for folder in folder_li:

        xmlpath = rootpath + '/xml/'+folder

        file_list = os.listdir(xmlpath)

        for xmlname in file_list:

            xmlfile = os.path.join(xmlpath, xmlname)

            with open(xmlfile, "r", encoding='UTF-8') as in_file:

                txtname = xmlname[:-4] + '.txt'

                # print(txtname)

                txtpath = labelpath + '/' + folder

                if not os.path.exists(txtpath):

                    os.makedirs(txtpath)

                txtfile = os.path.join(txtpath, txtname)

                with open(txtfile, "w+", encoding='UTF-8') as out_file:

                    tree = ET.parse(in_file)

                    root = tree.getroot()

                    size = root.find('size')

                    w = int(size.find('width').text)

                    h = int(size.find('height').text)

                    out_file.truncate()

                    for obj in root.iter('object'):

                        difficult = obj.find('difficult').text

                        cls = obj.find('name').text

                        if cls not in classes or int(difficult) == 1:

                            continue

                        cls_id = classes.index(cls)

                        xmlbox = obj.find('bndbox')

                        b = (float(xmlbox.find('xmin').text), float(xmlbox.find('xmax').text), float(xmlbox.find('ymin').text),

                             float(xmlbox.find('ymax').text))

                        bb = convert((w, h), b)

                        out_file.write(str(cls_id) + " " + " ".join([str(a) for a in bb]) + '\n')

if __name__ == "__main__":

    rootpath = r'C:\Users\mojia\Desktop\maizi\maozi20230326_train_val'

    # 数据标签

    classes = ['帽子']  # 需要修改

    convert_annotation(rootpath, classes)

得到下面这个的目录结构

txt文件里有标签索引和归一化后的坐标和宽高信息

7.下载yolov5源码

　　直接将代码下载到本地，我下载的时v7.0

　　下载版本对应的与训练模型

　8.修改训练的数据集路径及参数

　　修改data/coco128.yaml,给出数据集的路径

　　修改models/yolov5s.yaml,注意我训练时用的yolov5s.pt。这里主要将标签数改成一样的，nc字段改为1个，我只标了一个。

　　修改train.py，这个我只将device改为0，也就是启用GPU训练，其他参数没有改变，或者在运行train.py时传入参数也一样。

　　直接运行 python train.py

9.查看训练结果

　　可以查看损失函数，准确率等信息

　　训练好的结果在run/train文件夹下面，找到最新的文件夹

　　可以运行tensorboard --logdir=C:\Users\mojia\Desktop\yolov5-master\runs\train\exp14 通过浏览器查看运行的结果

　　训练好的权重参数保存在weights文件夹下面

10.进行预测

　　修改detect.py文件，修改使用的权重文件，和检测的目标文件

　　运行 python detect.py

　　结果保存在/runs/detect路径下最新的文件夹里

yolov5训练自己的数据集的更多相关文章

[炼丹术]YOLOv5训练自定义数据集
YOLOv5训练自定义数据一.开始之前的准备工作克隆 repo 并在Python>=3.6.0环境中安装requirements.txt,包括PyTorch>=1.7.模型和数据集会从 ...
yolov5训练自定义数据集
yolov5训练自定义数据 step1:参考文献及代码博客 https://blog.csdn.net/weixin_41868104/article/details/107339535 githu ...
【Tensorflow系列】使用Inception_resnet_v2训练自己的数据集并用Tensorboard监控
[写在前面] 用Tensorflow(TF)已实现好的卷积神经网络(CNN)模型来训练自己的数据集,验证目前较成熟模型在不同数据集上的准确度,如Inception_V3, VGG16,Inceptio ...
目标检测算法SSD之训练自己的数据集
目标检测算法SSD之训练自己的数据集 prerequesties 预备知识/前提条件下载和配置了最新SSD代码 git clone https://github.com/weiliu89/caffe ...
可变卷积Deforable ConvNet 迁移训练自己的数据集 MXNet框架 GPU版
[引言] 最近在用可变卷积的rfcn 模型迁移训练自己的数据集, MSRA官方使用的MXNet框架环境搭建及配置:http://www.cnblogs.com/andre-ma/p/8867031. ...
caffe训练自己的数据集
默认caffe已经编译好了,并且编译好了pycaffe 1 数据准备首先准备训练和测试数据集,这里准备两类数据,分别放在文件夹0和文件夹1中(之所以使用0和1命名数据类别,是因为方便标注数据类别,直 ...
使用yolo3模型训练自己的数据集
使用yolo3模型训练自己的数据集本项目地址:https://github.com/Cw-zero/Retrain-yolo3 一.运行环境 1. Ubuntu16.04. 2. TensorFlo ...
Win10中用yolov3训练自己的数据集全过程（VS、CUDA、CUDNN、OpenCV配置，训练和测试）
在Windows系统的Linux系统中用yolo训练自己的数据集的配置差异很大,今天总结在win10中配置yolo并进行训练和测试的全过程. 提纲: 1.下载适用于Windows的darknet 2. ...
TensorFlow学习笔记——LeNet-5（训练自己的数据集）
在之前的TensorFlow学习笔记——图像识别与卷积神经网络(链接:请点击我)中了解了一下经典的卷积神经网络模型LeNet模型.那其实之前学习了别人的代码实现了LeNet网络对MNIST数据集的训练 ...
YOLO训练自己的数据集的一些心得
YOLO训练自己的数据集 YOLO-darknet训练自己的数据 [Darknet][yolo v2]训练自己数据集的一些心得----VOC格式 YOLO模型训练可视化训练过程中的中间参数项目开源代 ...

随机推荐

ST能维护的性质
总结: 其实ST表不仅能处理最大值/最小值,凡是符合结合律且可重复贡献的信息查询都可以使用ST表高效进行.什么叫可重复贡献呢?设有一个二元运算 ,满足 ,则是可重复贡献的.显然最大值.最小值.最大 ...
IndexError: invalid index of a 0-dim tensor. Use tensor.item() to convert a 0-dim tensor to a Python number
print('Epoch[{}/{}], loss:{:.6f}'.format(epoch+1,num_epoch,loss.data[0])) 将loss.data[0] 改为loss.item( ...
python中的变量定义
1 变量名:由下划线.字母和数字组成 2 python中变量名的特殊含义: xx:标准的标识符,共有的 _xx:只是在from - import *时是不会被导入的,其他导入方式会被引入隐藏变量还有 ...
通过富文本编辑器操作HTML页面
<pre id="list_css" class="brush:css;toolbar:false">/*外部css,多个换行*/ https:// ...
8css 盒子模型
<!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8&quo ...
Javaheima12
Java 不可变集合如果某个数据不能修改,把它防御性地拷贝到不可变集合红是个很好的实践或者当集合对象被不可信的库调用时,不可变形式是安全的创建再List,Set,Map接口中,都存在of方法, ...
Ubuntu与centos之间的文件传输
Ubuntu与centos之间的文件传输默认端口:22 传输前确认端口是否开启 1.在Ubuntu上安装scp命令 apt-get install openssh-server 2.将U ...
PriorityQueue&&Function overload
用 STL 里面堆算法实现的与真正的STL里面的 priority_queue用法相似的priority_queue #include <iostream> #include ...
remove blank line
[$ cat all.experiments.csv.clean|sed -r '/^\s*$/d' > all.experiments.csv.clean2
Servlet的学习之路
一.什么是什么Servlet? Java Servlet 是运行在 Web 服务器或应用服务器上的程序,它是作为来自 Web 浏览器或其他 HTTP 客户端的请求和 HTTP 服务器上的数据库或应用程 ...

yolov5训练自己的数据集

yolov5训练自己的数据集的更多相关文章

随机推荐

热门专题