yolov5数据集制作数据集分割+voc格式转txt格式代码

先上数据集分割代码网上没找到合适的自己写了一个分割比例为0.6 ：0.2 ：0.2

import os

import random

oriImgDir = "./change14img"

oriXmlDir = "./change14xml"    #源文件夹

desTestImgDir = "./insect/images/test"   #目标文件夹

desValImgDir = "./insect/images/val"

desTrainImgDir = "./insect/images/train"

desTestXmlDir = "./insect/labels/test"

desValXmlDir = "./insect/labels/val"

desTrainXmlDir = "./insect/labels/train"

# 获取目录下文件名清单

flist = os.listdir(oriImgDir)

random.shuffle(flist)

length = len(flist)

val = int(length * 0.2)

test = int(length * 0.2)

count = 0

while (count < length):

    # 移动测试集

    while test:

        item = flist[count]

        fname = os.path.splitext(item)[0]  # 获得不带后缀的文件名

        os.rename(oriImgDir + "/" + item, desTestImgDir+"/14"+str(count)+".jpg")  # 图片

        os.rename(oriXmlDir + "/" + fname + ".xml", desTestXmlDir+"/14"+str(count)+".xml")

        test -= 1

        count += 1

    # 移动验证集

    while val:

        item = flist[count]

        fname = os.path.splitext(item)[0]  # 获得不带后缀的文件名

        os.rename(oriImgDir + "/" + item, desValImgDir+"/14"+str(count)+".jpg")  # 图片

        os.rename(oriXmlDir + "/" + fname + ".xml", desValXmlDir+"/14"+str(count)+".xml")

        val -= 1

        count += 1

    # 剩下的移到训练集

    item = flist[count]

    fname = os.path.splitext(item)[0]

    os.rename(oriImgDir + "/" + item, desTrainImgDir+"/14"+str(count)+".jpg")  # 图片

    os.rename(oriXmlDir + "/" + fname + ".xml", desTrainXmlDir+"/14"+str(count)+".xml")

    count += 1

比例可以自己改，不需要验证集的话把第二个while循环去掉即可
os.rename的第二个参数是移动过去之后的文件名，可以改，如果源文件夹有很多个且有重名的情况，第二个参数就需要设计成让移过去之后新的文件名不会重复
os函数不支持跨磁盘移动文件

voc标签转txt格式代码网上找的源代码地址：
https://github.com/DLLXW/objectDetectionDatasets

'''

2020/6/15,标注文件转换xml转txt（vol to yolo）转完后需添加labels文件，即数字序号对应的标签名。

'''

import xml.etree.ElementTree as ET

import pickle

import os

from os import listdir, getcwd

from os.path import join

classes = ['0', '1', '2', '3', '4', '5', '6', '7', '9', '10', '12', '13', '14']

def convert(size, box):

    dw = 1./(size[0])

    dh = 1./(size[1])

    x = (box[0] + box[1])/2.0 - 1

    y = (box[2] + box[3])/2.0 - 1

    w = box[1] - box[0]

    h = box[3] - box[2]

    x = x*dw

    w = w*dw

    y = y*dh

    h = h*dh

    if w>=1:

        w=0.99

    if h>=1:

        h=0.99

    return (x,y,w,h)

def convert_annotation(rootpath,xmlname):

    xmlfile = os.path.join(xmlpath,xmlname)

    with open(xmlfile, "r", encoding='UTF-8') as in_file:

        txtname = xmlname[:-4]+'.txt'

        print(txtname)

        txtpath = 'yolov5txt/train'#生成的.txt文件会被保存在这里

        if not os.path.exists(txtpath):

            os.makedirs(txtpath)

        txtfile = os.path.join(txtpath,txtname)

        with open(txtfile, "w+" ,encoding='UTF-8') as out_file:

            tree=ET.parse(in_file)

            root = tree.getroot()

            size = root.find('size')

            w = int(size.find('width').text)

            h = int(size.find('height').text)

            out_file.truncate()

            for obj in root.iter('object'):

                difficult = obj.find('difficult').text

                cls = obj.find('name').text

                if cls not in classes or int(difficult)==1:

                    continue

                cls_id = classes.index(cls)

                xmlbox = obj.find('bndbox')

                b = (float(xmlbox.find('xmin').text), float(xmlbox.find('xmax').text), float(xmlbox.find('ymin').text), float(xmlbox.find('ymax').text))

                bb = convert((w,h), b)

                out_file.write(str(cls_id) + " " + " ".join([str(a) for a in bb]) + '\n')

if __name__ == "__main__":

    xmlpath='insect/labels/train'

    list=os.listdir(xmlpath)

    for i in range(0,len(list)) :

        path = os.path.join(xmlpath,list[i])

        if ('.xml' in path)or('.XML' in path):

            convert_annotation(xmlpath,list[i])

            print('done', i)

        else:

            print('not xml file',i)

class列表里放的是类别，改成你自己的类别名称，类别如果没添加进去的话就会出现转化出来的txt是空的的情况

yolov5数据集制作数据集分割+voc格式转txt格式代码的更多相关文章

yolov5训练自定义数据集
yolov5训练自定义数据 step1:参考文献及代码博客 https://blog.csdn.net/weixin_41868104/article/details/107339535 githu ...
在Ubuntu内制作自己的VOC数据集
一.VOC数据集的简介 PASCAL VOC为图像的识别和分类提供了一整套标准化的优秀数据集,基本上就是目标检测数据集的模板.现在有VOC2007,VOC2012.主要有20个类.而现在主要的模型评估 ...
【目标检测实战】目标检测实战之一--手把手教你LMDB格式数据集制作！
文章目录 1 目标检测简介 2 lmdb数据制作 2.1 VOC数据制作 2.2 lmdb文件生成 lmdb格式的数据是在使用caffe进行目标检测或分类时,使用的一种数据格式.这里我主要以目标检测为 ...
从零开始制作数据集所需要的所有python脚本
最近一直在做图片数据集,积累了很多心得.我把我所使用的python脚本全部拿出来,当然这些脚本大部分网上都有,只不过比较分散. 我已经把所有代码上传到github上,觉得写的好的话,请给我一个star ...
图像分割实验：FCN数据集制作，网络模型定义，网络训练（提供数据集和模型文件，以供参考）
论文:<Fully Convolutional Networks for Semantic Segmentation> 代码:FCN的Caffe 实现数据集:PascalVOC 一数据 ...
YOLO 从数据集制作到训练
1.图片数据集收集共 16种集装箱船 container ship 散货船 bulker 油船 tanker 游轮 / 客轮 / 邮轮 passenger liner 渔船 fishing boa ...
[炼丹术]YOLOv5训练自定义数据集
YOLOv5训练自定义数据一.开始之前的准备工作克隆 repo 并在Python>=3.6.0环境中安装requirements.txt,包括PyTorch>=1.7.模型和数据集会从 ...
PyTorch中的MIT ADE20K数据集的语义分割
PyTorch中的MIT ADE20K数据集的语义分割代码地址:https://github.com/CSAILVision/semantic-segmentation-pytorch Semant ...
Camtasia制作视频分割与视频拼接
视频的分割与拼接是在制作和编辑视频中经常用到的方法,运用Camtasia视频编辑器能够让视频制作更加的简单和便捷.Camtasia是一款录频软件和视频编辑器,可以进行屏幕录制.拖放视频等操作.小编采用 ...

随机推荐

驱动开发：内核枚举IoTimer定时器
今天继续分享内核枚举系列知识,这次我们来学习如何通过代码的方式枚举内核IoTimer定时器,内核定时器其实就是在内核中实现的时钟,该定时器的枚举非常简单,因为在IoInitializeTimer初始化 ...
Java 集合简介一
什么是集合? 集合就是由若干个确定的元素所构成的整体.例如,5只小兔构成的集合: 在数学中,我们经常遇到集合的概念.例如: ● 有限集合 ○ 一个班所有的同学构成的集合: ○ 一个网站所有的商品构成的 ...
齐博x1客服系统显示客户在哪个页面
如下图所示,要想实现下面的效果,即显示客户给你发消息时,当时处于哪个商品页面.这样方便跟客户针对此商品进行交流. 你的模板如果使用了碎片的话,就可以添加下面的代码index_style/default ...
python查找相似图片或重复图片
1.查找重复图片利用文件的MD5值可查找完全一样的重复图片 import os,time,hashlib def getmd5(file): if not os.path.isfile(file): ...
使用dotnet-monitor sidecar模式 dump docker运行的dotnet程序.
前情概要随着容器和云技术的发展, 大量的应用运行在云上的容器中, 它们的好处是毋庸置疑的, 例如极大的提高了我们的研发部署速度, 快速的扩缩容等等, 但是也存在一些小小的问题, 例如难以调试. 基于 ...
五、Python操作redis
五.Python操作redis 一.python对redis基本操作 (1)连接redis # 方式1 import redis r = redis.Redis(host='127.0.0.1', p ...
Sprint产品待办列表的优先级要怎么排？
在梳理产品待办事项列表的过程中,产品负责人需要先做优先级排列,保证我们在一定的时间盒内能够交付需要优先级最高.最具价值的用户故事. 那这个用户故事的优先级要怎么排列,我们怎样选择用户故事的实现顺序? ...
从0搭建vue3组件库: Input组件
本篇文章将为我们的组件库添加一个新成员:Input组件.其中Input组件要实现的功能有: 基础用法禁用状态尺寸大小输入长度可清空密码框带Icon的输入框文本域自适应文本高度的文本域 ...
K8S节点配置资源驱逐
#参考文章:https://www.cnblogs.com/zhangrui153169/p/15726165.html 当节点内存到达多少时.对节点的pod进行驱逐 [root@lecode-tes ...
在服务器上搭建Jenkins自动化部署工具
在公司发现很多时候都需要手动部署,然后有天听到自动部署这个词想着有没有什么工具能够自动部署项目,最好能自动化部署前后端生成 docker images 运行方便管理.最后经过我各种筛查,发现用 jen ...

yolov5数据集制作 数据集分割+voc格式转txt格式代码

yolov5数据集制作 数据集分割+voc格式转txt格式代码的更多相关文章

随机推荐

热门专题

yolov5数据集制作数据集分割+voc格式转txt格式代码

yolov5数据集制作数据集分割+voc格式转txt格式代码的更多相关文章