torch_13_自定义数据集实战

1.将图片的路径和标签写入csv文件并实现读取

  # 创建一个文件，包含image，存放方式：label pokemeon\\mew\\0001.jpg,0

     def load_csv(self,filename):

         if not os.path.exists(os.path.join(self.root,filename)):

             images = [] # 将所有的信息组成一个列表，类别信息通过中间的一个路径判断

             for name in self.name2label.keys():

                 # pokemeon\\mew\\0001.jpg mew可以通过字典查看其类别

                 images += glob.glob(os.path.join(self.root,name,'*.png'))#img的完整路径

                 images += glob.glob(os.path.join(self.root,name,'*.jpg'))

             random.shuffle(images)

             with open(os.path.join(self.root,filename),'w') as f:

                 writer = csv.writer(f)

                 for img in images:

                     name = img.split(os.sep)

                     label = self.name2label[name[-2]]

                     writer.writerow([img,label])

          # 从csv中读取文件

         images, labels = [], []

         with open(os.path.join(self.root,filename),'r') as f:

             reader = csv.reader(f)

             for row in reader:

                 img,label = row

                 label = int(label)

                 images.append(img)

                 labels.append(label)

         assert len(images) == len(labels) # 保证数据长度一致
　　　　　　 return images,labels

2.加载自定义数据集

 """

 自定义数据集

 image_resize

 data argumentation(数据增强):Rotate,crop

 normalize:mean,std

 ToTensor

 """

 import torch

 import os,glob

 import random,csv

 from torch.utils.data import Dataset,DataLoader

 from torchvision import transforms

 from PIL import Image

 import visdom

 class Pokemon(Dataset):

     def __init__(self,root,resize,mode):

         super(Pokemon,self).__init__()

         self.root = root

         self.resize = resize

         self.name2label = {}

         for name in os.listdir(os.path.join(root)): #把文件和dir都会加载近来

             if not sorted(os.path.isdir(os.path.join(root,name))):#排序后，文件夹顺序固定了

                 continue

             self.name2label[name] = len(self.name2label.keys())

         # name2label:{文件夹名，类别编号}

         # 创建一个文件，包含image，存放方式：label pokemeon\\mew\\0001.jpg,0

         self.images, self.labels = self.load_csv('images.csv')

         # 对数据进行裁剪，mode：train-0.6，validation-0.2，test-0.2数据量是不同的

         if mode == 'train':

             self.images = self.images[:,int(len(self.images)*0.6)]

             self.labels = self.labels[:,int(len(self.images)*0.6)]

         elif mode == 'val':

             self.images = self.images[int(len(self.images)*0.6):int(len(self.images)*0.8)]

             self.labels = self.labels[int(len(self.labels)*0.6):int(len(self.labels)*0.8)]

         else:

             self.images = self.images[int(len(self.images) * 0.8):]

             self.labels = self.labels[int(len(self.labels) * 0.8):]

     def load_csv(self,filename):

         if not os.path.exists(os.path.join(self.root,filename)):

             images = [] # 将所有的信息组成一个列表，类别信息通过中间的一个路径判断

             for name in self.name2label.keys():

                 # pokemeon\\mew\\0001.jpg mew可以通过字典查看其类别

                 images += glob.glob(os.path.join(self.root,name,'*.png'))#img的完整路径

                 images += glob.glob(os.path.join(self.root,name,'*.jpg'))

             random.shuffle(images)

             with open(os.path.join(self.root,filename),'w') as f:

                 writer = csv.writer(f)

                 for img in images:

                     name = img.split(os.sep)

                     label = self.name2label[name[-2]]

                     writer.writerow([img,label])

          # 从csv中读取文件

         images, labels = [], []

         with open(os.path.join(self.root,filename),'r') as f:

             reader = csv.reader(f)

             for row in reader:

                 img,label = row

                 label = int(label)

                 images.append(img)

                 labels.append(label)

         assert len(images) == len(labels) # 保证数据长度一致

         return images,labels

     def __len__(self):

         return len(self.images)

     def __getitem__(self, idx):

         # idx是[0-len(self.images]

         # self.images，self.label

         # img:pokemeon\\mew\\0001.jpg(这是一个路径)要转变成img数据

         # label:是数字

         img, label = self.images[idx], self.labels[idx]

         tf = transforms.Compose([

             lambda x:Image.open(x).convert('RGB'),# string path -> img data

             transforms.Resize(int(self.resize*1.25), int(self.resize*1.25)),

             transforms.Randomrotation(15), # 旋转度数

             transforms.CenterCrop(self.resize),#中心裁剪，保留resize大小

             transforms.ToTensor(),

             transforms.Normalize(mean=[0.485,0.456,0.406],

                                  std=[0.229,0.224,0.225])  # 归一化之后，范围为-1~1，之前的图片范围为0~1

             ])

         img = tf(img)  # 将path转换成数据

         label = torch.tensor(label)  # 将变量label转换成tensor

         return img,label

     def denormalize(self,x_hat):

         mean=[0.485,0.456,0.406]

         std=[0.229,0.224,0.225]

         # x:[c,h,w]

         # x_hat = (x-mean)/std

         # maen[3]->[3,1,1]

         mean = torch.tensor(mean).unsqueeze(1).unsqueeze(1)

         std = torch.tensor(std).unsqueeze(1).unsqueeze(1)

         x = x_hat * std+mean

         return x

 def main():

     import torchvision

     vis = visdom.Visdom()

     """

     如果存储比较规范的话，可以使用下面简单的代码加载数据集,文件夹的标签从0开始编码

     tf = transforms.Compose([

         transforms.Resize((64,64)),

         transforms.ToTensor()

     ])

     db = torchvision.datasets.ImageFolder('./pokemon',transform=tf)

     loader = DataLoader(db,batch_size=32,shuffle=True)

     print(db.class_to_idx) #查看类标签

     """

     db = Pokemon('./pokemon', 224, 'train') # 根据idx，返回一个

     x,y = next(iter(db))

     print('sample:',x.shape,y.shape)

     #可视化

     vis.image(db.denormalize(x),win='sample_x',opts=dict(title = 'sample_x'))

     # 加载一批

     loader = DataLoader(db,batch_size = 32,shuffle=True,num_workers=8 )

     for x,y in loader:

         vis.images(db.denormalize(x), nrow=8, win='batch',opts=dict(title='batch'))

         vis.text(str(y.numpy()),win='label',opts=dict(title='batch-y'))

 if __name__ == '__main__':

     main()

小结：

在加载自定义数据集时，一般步骤

1.定义一个类继承Dataset

2.在类中读取数据集（图片的路径），重写len函数，和getitem函数

在len函数中返回数据集的长度

在getitem函数中，处理一张图片，单个图片路径转换成图片数据（包括transform转换），返回该图片数据和标签

3，将处理好的数据集（均为张量）放入DataLoader中，进行分批

loader = DataLoader(db,batch_size = 32,shuffle=True,num_workers=8 )

4.训练时通过enumerate遍历每个batchsize

torch_13_自定义数据集实战的更多相关文章

SpringBoot2.x过滤器Filter和使用Servlet3.0配置自定义Filter实战
补充:SpringBoot启动日志 1.深入SpringBoot2.x过滤器Filter和使用Servlet3.0配置自定义Filter实战(核心知识) 简介:讲解SpringBoot里面Filter ...
Tensorflow2 自定义数据集图片完成图片分类任务
对于自定义数据集的图片任务,通用流程一般分为以下几个步骤: Load data Train-Val-Test Build model Transfer Learning 其中大部分精力会花在数据的准备 ...
pytorch加载语音类自定义数据集
pytorch对一下常用的公开数据集有很方便的API接口,但是当我们需要使用自己的数据集训练神经网络时,就需要自定义数据集,在pytorch中,提供了一些类,方便我们定义自己的数据集合 torch.u ...
MMDetection 快速开始，训练自定义数据集
本文将快速引导使用 MMDetection ,记录了实践中需注意的一些问题. 环境准备基础环境 Nvidia 显卡的主机 Ubuntu 18.04 系统安装,可见制作 USB 启动盘,及系统安装 ...
Scaled-YOLOv4 快速开始，训练自定义数据集
代码: https://github.com/ikuokuo/start-scaled-yolov4 Scaled-YOLOv4 代码: https://github.com/WongKinYiu/S ...
PyTorch 自定义数据集
准备数据准备 COCO128 数据集,其是 COCO train2017 前 128 个数据.按 YOLOv5 组织的目录: $ tree ~/datasets/coco128 -L 2 /home ...
Android自定义View实战（SlideTab－可滑动的选择器）
转载请标明出处: http://blog.csdn.net/xmxkf/article/details/52178553 本文出自:[openXu的博客] 目录: 初步分析重写onDraw绘制重写o ...
高级UI晋升之自定义view实战（七）
更多Android高级架构进阶视频学习请点击:https://space.bilibili.com/474380680本篇文章自定义ViewGroup实现瀑布流效果来进行详解dispatchTouch ...
自定义View实战
PS:上一篇从0开始学自定义View有博友给我留言说要看实战,今天我特意写了几个例子,供大家参考,所画的图案加上动画看着确实让人舒服,喜欢的博友可以直接拿到自己的项目中去使用,由于我这个写的是demo ...

随机推荐

IT兄弟连 Java语法教程流程控制语句分支结构语句1
不论哪一种编程语言,都会提供两种基本的流程控制结构:分支结构和循环结构.其中分支结构用于实现根据条件来选择性地执行某段代码,循环结构则用于实现根据循环条件重复执行某段代码.Java同样提供了这两种流程 ...
SpringBoot系列之快速创建项目教程
本博客简介一下SpringBoot快速创建工程的方法,主要介绍一下Spring Initializer,Spring Initializer是IntelliJ IDEA才集成的一种快速创建Spring ...
黄聪：wordpress登录后台后load-scripts.php载入缓慢
今天一个微信群里一个好友问大鸟,他的wordpess后台载入非常缓慢,缓慢到什么程度,我们看图: 这个真的是超级慢了,这类问题怎么解决呢,我们登录后台后,按下F12打开控制台,接着点击network, ...
CSAPP lab3 bufbomb-缓冲区溢出攻击实验（下）bang boom kaboom
CSAPP lab3 bufbomb-缓冲区溢出攻击实验(上)smoke fizz CSAPP lab3 bufbomb-缓冲区溢出攻击实验(下)bang boom kaboom 栈结构镇楼这里先给 ...
使用zabbix监控oracle的后台日志
本文将介绍如何使用zabbix监控oracle的后台日志,当oracle后台日志出现“ORA-”或“Error”时,第一时间将该信息报警出来 zabbix agent端以下所有操作均用root执行 ...
pycharm 取消连按两下shift出现的全局搜索
在来回切换中英文输入法的时候连按两下shift总是会蹦出来全局搜索框真的很是麻烦,现在是把这个框给禁用掉 1.按ctrl+shift+a,弹出搜索框2.输入registry,然后按回车3.找到“id ...
基于token机制鉴权架构
常见的鉴权方式有两种,一种是基于session,另一种是基于token方式的鉴权,我们来浅谈一下两种鉴权方式的区别. 两种鉴权方式对比 session 安全性:session是基于cookie进行用 ...
PHP odbc_errormsg ODBC 函数
定义和用法 odbc_errormsg - 获取最后一条错误消息语法 odbc_errormsg ( [ resource $connection_id ] ) 返回包含最后一个ODBC错误消息的字 ...
MAC TXT文本
Mac系统下.txt格式的纯文本怎么保存? 作者:佚名字体:[增加减小] 来源:互联网时间:06-02 14:29:23 我要评论 Mac系统下.txt格式的纯文本怎么保存?.txt是个用途广泛 ...
【LeetCode】TreeNode类实现解析（java实现）
https://blog.csdn.net/styshoo/article/details/52865386 在LeetCode中,TreeNode是经常用到的一个结构体,表示数据结构树(Tree)中 ...

torch_13_自定义数据集实战

torch_13_自定义数据集实战的更多相关文章

随机推荐

热门专题