yolov5训练自定义数据

step1:参考文献及代码

博客 https://blog.csdn.net/weixin_41868104/article/details/107339535
github代码 https://github.com/DataXujing/YOLO-v5
官方代码 https://github.com/ultralytics/yolov5
官方教程 https://github.com/ultralytics/yolov5/wiki/Train-Custom-Data

step2:准备数据集

--yolov5需要的数据集格式为txt格式的(即一个图片对应一个txt文件)
参考文献1利用其将xml格式的代码转换成txt格式的代码

+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++

更新:2021/2/6 0:42
找到了跟好的转换数据集的github库---->可应用与yolov3和yolov5的训练
github地址:https://github.com/pprp/voc2007_for_yolo_torch
如果自己的图片格式不是.jpg需要修改tools/make_for_yolov3_torch.py里面的代码

+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++

训练

利用参考文献而将参考文献1中的labels中的txt数据集和images中的图片放入到参考文献二中

附录:

用于抽取训练集和测试集

抽取图片:抽取.py

import os

import random

import shutil

# source_file:源路径, target_ir:目标路径

def cover_files(source_dir, target_ir):

    for file in os.listdir(source_dir):

        source_file = os.path.join(source_dir, file)

        if os.path.isfile(source_file):

            shutil.copy(source_file, target_ir)

def ensure_dir_exists(dir_name):

    """Makes sure the folder exists on disk.

  Args:

    dir_name: Path string to the folder we want to create.

  """

    if not os.path.exists(dir_name):

        os.makedirs(dir_name)

def moveFile(file_dir, save_dir):

    ensure_dir_exists(save_dir)

    path_dir = os.listdir(file_dir)

    filenumber = len(path_dir)

    rate = 0.1  # 自定义抽取图片的比例，比方说100张抽10张，那就是0.1

    picknumber = int(filenumber * rate)  # 按照rate比例从文件夹中取一定数量图片

    sample = random.sample(path_dir, picknumber)  # 随机选取picknumber数量的样本图片

    # print (sample)

    for name in sample:

        shutil.move(file_dir + name, save_dir + name)

#切记win10路径D:你的路径\\，最后一定要有\\才能进入目标文件

if __name__ == '__main__':

    file_dir = 'G:\\ECANet-master\\train\\0\\'  # 源图片文件夹路径

    save_dir = 'G:\\ECANet-master\\train\\00\\'  # 移动到目标文件夹路径

    moveFile(file_dir, save_dir)

json2xml:(json格式转换成xml格式)

将下面三个文件放入到json_to_xml文件夹下

create_xml_anno.py

# -*- coding: utf-8 -*-

from xml.dom.minidom import Document

class CreateAnno:

    def __init__(self,):

        self.doc = Document()  # 创建DOM文档对象

        self.anno = self.doc.createElement('annotation')  # 创建根元素

        self.doc.appendChild(self.anno)

        self.add_folder()

        self.add_path()

        self.add_source()

        self.add_segmented()

        # self.add_filename()

        # self.add_pic_size(width_text_str=str(width), height_text_str=str(height), depth_text_str=str(depth))

    def add_folder(self, floder_text_str='JPEGImages'):

        floder = self.doc.createElement('floder')  ##建立自己的开头

        floder_text = self.doc.createTextNode(floder_text_str)  ##建立自己的文本信息

        floder.appendChild(floder_text)  ##自己的内容

        self.anno.appendChild(floder)

    def add_filename(self, filename_text_str='00000.jpg'):

        filename = self.doc.createElement('filename')

        filename_text = self.doc.createTextNode(filename_text_str)

        filename.appendChild(filename_text)

        self.anno.appendChild(filename)

    def add_path(self, path_text_str="None"):

        path = self.doc.createElement('path')

        path_text = self.doc.createTextNode(path_text_str)

        path.appendChild(path_text)

        self.anno.appendChild(path)

    def add_source(self, database_text_str="Unknow"):

        source = self.doc.createElement('source')

        database = self.doc.createElement('database')

        database_text = self.doc.createTextNode(database_text_str)  # 元素内容写入

        database.appendChild(database_text)

        source.appendChild(database)

        self.anno.appendChild(source)

    def add_pic_size(self, width_text_str="0", height_text_str="0", depth_text_str="3"):

        size = self.doc.createElement('size')

        width = self.doc.createElement('width')

        width_text = self.doc.createTextNode(width_text_str)  # 元素内容写入

        width.appendChild(width_text)

        size.appendChild(width)

        height = self.doc.createElement('height')

        height_text = self.doc.createTextNode(height_text_str)

        height.appendChild(height_text)

        size.appendChild(height)

        depth = self.doc.createElement('depth')

        depth_text = self.doc.createTextNode(depth_text_str)

        depth.appendChild(depth_text)

        size.appendChild(depth)

        self.anno.appendChild(size)

    def add_segmented(self, segmented_text_str="0"):

        segmented = self.doc.createElement('segmented')

        segmented_text = self.doc.createTextNode(segmented_text_str)

        segmented.appendChild(segmented_text)

        self.anno.appendChild(segmented)

    def add_object(self,

                   name_text_str="None",

                   xmin_text_str="0",

                   ymin_text_str="0",

                   xmax_text_str="0",

                   ymax_text_str="0",

                   pose_text_str="Unspecified",

                   truncated_text_str="0",

                   difficult_text_str="0"):

        object = self.doc.createElement('object')

        name = self.doc.createElement('name')

        name_text = self.doc.createTextNode(name_text_str)

        name.appendChild(name_text)

        object.appendChild(name)

        pose = self.doc.createElement('pose')

        pose_text = self.doc.createTextNode(pose_text_str)

        pose.appendChild(pose_text)

        object.appendChild(pose)

        truncated = self.doc.createElement('truncated')

        truncated_text = self.doc.createTextNode(truncated_text_str)

        truncated.appendChild(truncated_text)

        object.appendChild(truncated)

        difficult = self.doc.createElement('difficult')

        difficult_text = self.doc.createTextNode(difficult_text_str)

        difficult.appendChild(difficult_text)

        object.appendChild(difficult)

        bndbox = self.doc.createElement('bndbox')

        xmin = self.doc.createElement('xmin')

        xmin_text = self.doc.createTextNode(xmin_text_str)

        xmin.appendChild(xmin_text)

        bndbox.appendChild(xmin)

        ymin = self.doc.createElement('ymin')

        ymin_text = self.doc.createTextNode(ymin_text_str)

        ymin.appendChild(ymin_text)

        bndbox.appendChild(ymin)

        xmax = self.doc.createElement('xmax')

        xmax_text = self.doc.createTextNode(xmax_text_str)

        xmax.appendChild(xmax_text)

        bndbox.appendChild(xmax)

        ymax = self.doc.createElement('ymax')

        ymax_text = self.doc.createTextNode(ymax_text_str)

        ymax.appendChild(ymax_text)

        bndbox.appendChild(ymax)

        object.appendChild(bndbox)

        self.anno.appendChild(object)

    def get_anno(self):

        return self.anno

    def get_doc(self):

        return self.doc

    def save_doc(self, save_path):

        with open(save_path, "w") as f:

            self.doc.writexml(f, indent='\t', newl='\n', addindent='\t', encoding='utf-8')

main.py

import os

from tqdm import tqdm

from read_json import ReadAnno

from create_xml_anno import CreateAnno

def json_transform_xml(json_path, xml_path, process_mode="polygon"):

    json_path = json_path

    json_anno = ReadAnno(json_path, process_mode=process_mode)

    width, height = json_anno.get_width_height()

    filename = json_anno.get_filename()

    coordis = json_anno.get_coordis()

    xml_anno = CreateAnno()

    xml_anno.add_filename(filename)

    xml_anno.add_pic_size(width_text_str=str(width), height_text_str=str(height), depth_text_str=str(3))

    for xmin,ymin,xmax,ymax,label in coordis:

        xml_anno.add_object(name_text_str=str(label),

                            xmin_text_str=str(int(xmin)),

                            ymin_text_str=str(int(ymin)),

                            xmax_text_str=str(int(xmax)),

                            ymax_text_str=str(int(ymax)))

    xml_anno.save_doc(xml_path)

if __name__ == "__main__":

    root_json_dir = r"/home/aibc/ouyang/temp_dataset/jjson"

    root_save_xml_dir = r"/home/aibc/ouyang/temp_dataset/xml"

    for json_filename in tqdm(os.listdir(root_json_dir)):

        json_path = os.path.join(root_json_dir, json_filename)

        save_xml_path = os.path.join(root_save_xml_dir, json_filename.replace(".json", ".xml"))

        json_transform_xml(json_path, save_xml_path, process_mode="polygon")

read_json.py

# -*- coding: utf-8 -*-

import numpy as np

import json

class ReadAnno:

    def __init__(self, json_path, process_mode="rectangle"):

        self.json_data = json.load(open(json_path))

        self.filename = self.json_data['imagePath']

        self.width = self.json_data['imageWidth']

        self.height = self.json_data['imageHeight']

        self.coordis = []

        assert process_mode in ["rectangle", "polygon"]

        if process_mode == "rectangle":

            self.process_polygon_shapes()

        elif process_mode == "polygon":

            self.process_polygon_shapes()

    def process_rectangle_shapes(self):

        for single_shape in self.json_data['shapes']:

            bbox_class = single_shape['label']

            xmin = single_shape['points'][0][0]

            ymin = single_shape['points'][0][1]

            xmax = single_shape['points'][1][0]

            ymax = single_shape['points'][1][1]

            self.coordis.append([xmin,ymin,xmax,ymax,bbox_class])

    def process_polygon_shapes(self):

        for single_shape in self.json_data['shapes']:

            bbox_class = single_shape['label']

            temp_points = []

            for couple_point in single_shape['points']:

                x = float(couple_point[0])

                y = float(couple_point[1])

                temp_points.append([x,y])

            temp_points = np.array(temp_points)

            xmin, ymin = temp_points.min(axis=0)

            xmax, ymax = temp_points.max(axis=0)

            self.coordis.append([xmin,ymin,xmax,ymax,bbox_class])

    def get_width_height(self):

        return self.width, self.height

    def get_filename(self):

        return self.filename

    def get_coordis(self):

        return self.coordis

yolov5训练自定义数据集的更多相关文章

[炼丹术]YOLOv5训练自定义数据集
YOLOv5训练自定义数据一.开始之前的准备工作克隆 repo 并在Python>=3.6.0环境中安装requirements.txt,包括PyTorch>=1.7.模型和数据集会从 ...
Scaled-YOLOv4 快速开始，训练自定义数据集
代码: https://github.com/ikuokuo/start-scaled-yolov4 Scaled-YOLOv4 代码: https://github.com/WongKinYiu/S ...
MMDetection 快速开始，训练自定义数据集
本文将快速引导使用 MMDetection ,记录了实践中需注意的一些问题. 环境准备基础环境 Nvidia 显卡的主机 Ubuntu 18.04 系统安装,可见制作 USB 启动盘,及系统安装 ...
PyTorch 自定义数据集
准备数据准备 COCO128 数据集,其是 COCO train2017 前 128 个数据.按 YOLOv5 组织的目录: $ tree ~/datasets/coco128 -L 2 /home ...
torch_13_自定义数据集实战
1.将图片的路径和标签写入csv文件并实现读取 # 创建一个文件,包含image,存放方式:label pokemeon\\mew\\0001.jpg,0 def load_csv(self,file ...
tensorflow从训练自定义CNN网络模型到Android端部署tflite
网上有很多关于tensorflow lite在安卓端部署的教程,但是大多只讲如何把训练好的模型部署到安卓端,不讲如何训练,而实际上在部署的时候,需要知道训练模型时预处理的细节,这就导致了自己训练的模型 ...
Tensorflow2 自定义数据集图片完成图片分类任务
对于自定义数据集的图片任务,通用流程一般分为以下几个步骤: Load data Train-Val-Test Build model Transfer Learning 其中大部分精力会花在数据的准备 ...
Yolo训练自定义目标检测
Yolo训练自定义目标检测参考darknet:https://pjreddie.com/darknet/yolo/ 1. 下载darknet 在 https://github.com/pjreddi ...
pytorch加载语音类自定义数据集
pytorch对一下常用的公开数据集有很方便的API接口,但是当我们需要使用自己的数据集训练神经网络时,就需要自定义数据集,在pytorch中,提供了一些类,方便我们定义自己的数据集合 torch.u ...

随机推荐

Web前端初级问题—ajax登录跳转登录实现
当我们的用户进行系统登录时,用户名和密码的验证都是后端验证的.而且,用户登录状态也是要后端设置的,查询数据库后,用户名和密码正确,则在session中存储一个uuid,每个页面需要根据登录状态判断展示 ...
破解浏览器同源政策利器之JSONP
本文是在了解了浏览器的同源规则之后,学习了破解这个规则的一个简单有效的方法->JSONP.主要通过阮一峰老师的博客学习浏览器的同源规则有这样一个背景,如果你通过银行的网站进行的取钱的交易,而 ...
AS之去掉顶部标题栏
在该目录下,将原本<style name的这行代码改为: <style name="Theme.Tongxunlu" parent="Theme.Materi ...
git总是需要输入用户名密码问题解决
解决办法: git bash进入你的项目目录,输入: git config --global credential.helper store 然后你会在你本地生成一个文本,上边记录你的账号和密码.当然 ...
Linux---远程连接、命令行基础、文件及目录管理
远程连接管理Linux实践(centos) 连接小知识 IP地址:访问连接服务器,需要通过服务器的IP地址来实现,服务器的IP地址就相当于服务器的具体地址.一计算机都会有一个唯一的32位的IP地址,8 ...
conn username/password@servicename
conn username/password 方式连接的时候,会碰到这样的错误问题 oracle@prd:/home/oracle/impdir$sqlplus /nolog SQL*Plus: Re ...
drf中的请求与响应
请求与响应(3星) 请求:Request REST framework 传入视图的request对象不再是Django默认的HttpRequest对象,而是REST framework提供的扩展了Ht ...
【直播回顾】OpenHarmony知识赋能第四期第二课——GPIO驱动开发
3月17日晚上19点,知识赋能第四期直播的第二节课<OpenHarmony标准系统HDF框架之GPIO驱动开发>,在OpenHarmony开发者成长计划社群内成功举办. 本期课程,由 ...
微信小程序循环列表点击每一个单独添加动画
首先,咱们看一下微信小程序动画怎么实现,我首先想到的是anime.js,但是引入之后用不了,微信小程序内的css也无法做到循环的动态,我就去找官方文档看看有没有相应的方法,哎,还真有点击这里查看微 ...
IDEA Debug过程中使用Drop Frame或Reset Frame实现操作回退
大家在Debug程序的时候,是否遇到过因为"下一步"按太快,而导致跳过了想要深入分析的那段代码?是不是很想要有"回到上一步"这样的操作呢? 在IDEA中就提供了 ...

yolov5训练自定义数据集

yolov5训练自定义数据

step1:参考文献及代码

step2:准备数据集

+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++

+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++

训练

附录:

用于抽取训练集和测试集

json2xml:(json格式转换成xml格式)

yolov5训练自定义数据集的更多相关文章

随机推荐

热门专题