先上数据集分割代码 网上没找到合适的 自己写了一个 分割比例为0.6 :0.2 :0.2

import os
import random oriImgDir = "./change14img"
oriXmlDir = "./change14xml" #源文件夹
desTestImgDir = "./insect/images/test" #目标文件夹
desValImgDir = "./insect/images/val"
desTrainImgDir = "./insect/images/train"
desTestXmlDir = "./insect/labels/test"
desValXmlDir = "./insect/labels/val"
desTrainXmlDir = "./insect/labels/train"
# 获取目录下文件名清单
flist = os.listdir(oriImgDir)
random.shuffle(flist)
length = len(flist)
val = int(length * 0.2)
test = int(length * 0.2) count = 0 while (count < length):
# 移动测试集
while test:
item = flist[count]
fname = os.path.splitext(item)[0] # 获得不带后缀的文件名
os.rename(oriImgDir + "/" + item, desTestImgDir+"/14"+str(count)+".jpg") # 图片
os.rename(oriXmlDir + "/" + fname + ".xml", desTestXmlDir+"/14"+str(count)+".xml")
test -= 1
count += 1
# 移动验证集
while val:
item = flist[count]
fname = os.path.splitext(item)[0] # 获得不带后缀的文件名
os.rename(oriImgDir + "/" + item, desValImgDir+"/14"+str(count)+".jpg") # 图片
os.rename(oriXmlDir + "/" + fname + ".xml", desValXmlDir+"/14"+str(count)+".xml")
val -= 1
count += 1
# 剩下的移到训练集
item = flist[count]
fname = os.path.splitext(item)[0]
os.rename(oriImgDir + "/" + item, desTrainImgDir+"/14"+str(count)+".jpg") # 图片
os.rename(oriXmlDir + "/" + fname + ".xml", desTrainXmlDir+"/14"+str(count)+".xml")
count += 1

比例可以自己改,不需要验证集的话把第二个while循环去掉即可
os.rename的第二个参数是移动过去之后的文件名,可以改,如果源文件夹有很多个且有重名的情况,第二个参数就需要设计成让移过去之后新的文件名不会重复
os函数不支持跨磁盘移动文件

voc标签转txt格式代码 网上找的 源代码地址:
https://github.com/DLLXW/objectDetectionDatasets

'''
2020/6/15,标注文件转换xml转txt(vol to yolo)转完后需添加labels文件,即数字序号对应的标签名。 ''' import xml.etree.ElementTree as ET
import pickle
import os
from os import listdir, getcwd
from os.path import join classes = ['0', '1', '2', '3', '4', '5', '6', '7', '9', '10', '12', '13', '14'] def convert(size, box):
dw = 1./(size[0])
dh = 1./(size[1])
x = (box[0] + box[1])/2.0 - 1
y = (box[2] + box[3])/2.0 - 1
w = box[1] - box[0]
h = box[3] - box[2]
x = x*dw
w = w*dw
y = y*dh
h = h*dh
if w>=1:
w=0.99
if h>=1:
h=0.99
return (x,y,w,h) def convert_annotation(rootpath,xmlname):
xmlfile = os.path.join(xmlpath,xmlname)
with open(xmlfile, "r", encoding='UTF-8') as in_file:
txtname = xmlname[:-4]+'.txt'
print(txtname)
txtpath = 'yolov5txt/train'#生成的.txt文件会被保存在这里
if not os.path.exists(txtpath):
os.makedirs(txtpath)
txtfile = os.path.join(txtpath,txtname)
with open(txtfile, "w+" ,encoding='UTF-8') as out_file:
tree=ET.parse(in_file)
root = tree.getroot()
size = root.find('size')
w = int(size.find('width').text)
h = int(size.find('height').text)
out_file.truncate()
for obj in root.iter('object'):
difficult = obj.find('difficult').text
cls = obj.find('name').text
if cls not in classes or int(difficult)==1:
continue
cls_id = classes.index(cls)
xmlbox = obj.find('bndbox')
b = (float(xmlbox.find('xmin').text), float(xmlbox.find('xmax').text), float(xmlbox.find('ymin').text), float(xmlbox.find('ymax').text))
bb = convert((w,h), b)
out_file.write(str(cls_id) + " " + " ".join([str(a) for a in bb]) + '\n') if __name__ == "__main__":
xmlpath='insect/labels/train'
list=os.listdir(xmlpath)
for i in range(0,len(list)) :
path = os.path.join(xmlpath,list[i])
if ('.xml' in path)or('.XML' in path):
convert_annotation(xmlpath,list[i])
print('done', i)
else:
print('not xml file',i)

class列表里放的是类别,改成你自己的类别名称,类别如果没添加进去的话就会出现转化出来的txt是空的的情况

yolov5数据集制作 数据集分割+voc格式转txt格式代码的更多相关文章

  1. yolov5训练自定义数据集

    yolov5训练自定义数据 step1:参考文献及代码 博客 https://blog.csdn.net/weixin_41868104/article/details/107339535 githu ...

  2. 在Ubuntu内制作自己的VOC数据集

    一.VOC数据集的简介 PASCAL VOC为图像的识别和分类提供了一整套标准化的优秀数据集,基本上就是目标检测数据集的模板.现在有VOC2007,VOC2012.主要有20个类.而现在主要的模型评估 ...

  3. 【目标检测实战】目标检测实战之一--手把手教你LMDB格式数据集制作!

    文章目录 1 目标检测简介 2 lmdb数据制作 2.1 VOC数据制作 2.2 lmdb文件生成 lmdb格式的数据是在使用caffe进行目标检测或分类时,使用的一种数据格式.这里我主要以目标检测为 ...

  4. 从零开始制作数据集所需要的所有python脚本

    最近一直在做图片数据集,积累了很多心得.我把我所使用的python脚本全部拿出来,当然这些脚本大部分网上都有,只不过比较分散. 我已经把所有代码上传到github上,觉得写的好的话,请给我一个star ...

  5. 图像分割实验:FCN数据集制作,网络模型定义,网络训练(提供数据集和模型文件,以供参考)

    论文:<Fully Convolutional Networks for Semantic Segmentation> 代码:FCN的Caffe 实现 数据集:PascalVOC 一 数据 ...

  6. YOLO 从数据集制作到训练

    1.图片数据集收集 共 16种 集装箱船 container ship 散货船 bulker 油船 tanker 游轮 / 客轮 / 邮轮 passenger liner 渔船 fishing boa ...

  7. [炼丹术]YOLOv5训练自定义数据集

    YOLOv5训练自定义数据 一.开始之前的准备工作 克隆 repo 并在Python>=3.6.0环境中安装requirements.txt,包括PyTorch>=1.7.模型和数据集会从 ...

  8. PyTorch中的MIT ADE20K数据集的语义分割

    PyTorch中的MIT ADE20K数据集的语义分割 代码地址:https://github.com/CSAILVision/semantic-segmentation-pytorch Semant ...

  9. Camtasia制作视频分割与视频拼接

    视频的分割与拼接是在制作和编辑视频中经常用到的方法,运用Camtasia视频编辑器能够让视频制作更加的简单和便捷.Camtasia是一款录频软件和视频编辑器,可以进行屏幕录制.拖放视频等操作.小编采用 ...

随机推荐

  1. getColumnName 和 getColumnLabel 的区别

    select id as user from * getColumnName返回:"id" getColumnLabel 返回:"user"

  2. LabVIEW开放神经网络交互工具包【ONNX】,大幅降低人工智能开发门槛,实现飞速推理

    前言 前面给大家介绍了自己开发的LabVIEW AI视觉工具包,后来发现有一些onnx模型无法使用opencv dnn加载,且速度也偏慢,所以就有了今天的onnx工具包,如果你想要加载更多模型,追求更 ...

  3. VS2022连接Oracle数据库所需包和连接字符串

    VS连接ORACLE数据库 l  VS2022连接ORACLE数据库时,需要引入Oracle.ManagedDataAccess.Core包. l  引入方式:打开VS2022==>项目==&g ...

  4. 【日志系统】Loki日志监控 - 入门初体验

    使用Grafana+Loki+Promtail入门级部署分布式日志系统(windows环境) 生命不息,写作不止 继续踏上学习之路,学之分享笔记 总有一天我也能像各位大佬一样 一个有梦有戏的人 @怒放 ...

  5. Mysql之MGR高可用实战案例

    MGR高可用实战案例 1.环境准备 node1 rocky8.6 10.0.0.8 node2 rocky8.6 10.0.0.18 node3 rocky8.6 10.0.0.28 2.所有节点更改 ...

  6. Agda学习笔记1

    目录 Agda学习笔记1 快捷键 refl Natural Number 自然数集合 operations rewrite cong 加法结合律 加法交换律 乘法分配律 比较大小 衍生的一些证明 be ...

  7. perl静态变量

    state操作符功能类似于C里面的static修饰符,state关键字将局部变量变得持久. state也是词法变量,所以只在定义该变量的词法作用域中有效,举个例子: #!/usr/bin/perl u ...

  8. 2022-11-13 Acwing每日一题

    本系列所有题目均为Acwing课的内容,发表博客既是为了学习总结,加深自己的印象,同时也是为了以后回过头来看时,不会感叹虚度光阴罢了,因此如果出现错误,欢迎大家能够指出错误,我会认真改正的.同时也希望 ...

  9. GO语言内存操作指导—unsafe的使用

    在unsafe包里面,官方的说明是:A uintptr is an integer, not a reference.Converting a Pointer to a uintptr creates ...

  10. 云原生学习笔记-1-docker

    一.基础环境说明 1.操作系统:Centos7.6:1master:2node 2.docker版本:docker-ce 19.03.8-3 二.docker安装 1.使用阿里镜像仓库,mirror. ...