PyTorch 中自定义数据集的读取方法

显然我们在学习深度学习时，不能只局限于通过使用官方提供的MNSIT、CIFAR-10、CIFAR-100这样的数据集，很多时候我们还是需要根据自己遇到的实际问题自己去搜集数据，然后制作数据集（收集数据集的方法有很多，这里就不过多的展开了）。这里只介绍数据集的读取。

自定义数据集的方法：

首先创建一个Dataset类

在代码中：

def init() 一些初始化的过程写在这个函数下

def len() 返回所有数据的数量,比如我们这里将数据划分好之后，这里仅仅返回的是被处理后的关系

def getitem() 回数据和标签
补充代码

上述已经将框架打出来了，接下来就是将框架填充完整就行了，下面是完整的代码，代码的解释说明我也已经写在其中了

# -*- coding: utf-8 -*-

# @Author  : 胡子旋

# @Email   ：1017190168@qq.com

import torch

import os,glob

import visdom

import time

import torchvision

import random,csv

from torch.utils.data import Dataset,DataLoader

from torchvision import transforms

from PIL import Image

class pokemom(Dataset):

    def __init__(self,root,resize,mode,):

        super(pokemom,self).__init__()

        # 保存参数

        self.root=root

        self.resize=resize

        # 给每一个类做映射

        self.name2label={}  # "squirtle":0 ,"pikachu":1……

        for name in sorted(os.listdir(os.path.join(root))):

            # 过滤掉文件夹

            if not os.path.isdir(os.path.join(root,name)):

                continue

            # 保存在表中;将最长的映射作为最新的元素的label的值

            self.name2label[name]=len(self.name2label.keys())

        print(self.name2label)

        # 加载文件

        self.images,self.labels=self.load_csv('images.csv')

        # 裁剪数据

        if mode=='train':

            self.images=self.images[:int(0.6*len(self.images))]   # 将数据集的60%设置为训练数据集合

            self.labels=self.labels[:int(0.6*len(self.labels))]   # label的60%分配给训练数据集合

        elif mode=='val':

            self.images = self.images[int(0.6 * len(self.images)):int(0.8 * len(self.images))]  # 从60%-80%的地方

            self.labels = self.labels[int(0.6 * len(self.labels)):int(0.8 * len(self.labels))]

        else:

            self.images = self.images[int(0.8 * len(self.images)):]   # 从80%的地方到最末尾

            self.labels = self.labels[int(0.8 * len(self.labels)):]

        # image+label 的路径

    def load_csv(self,filename):

        # 将所有的图片加载进来

        # 如果不存在的话才进行创建

        if not os.path.exists(os.path.join(self.root,filename)):

            images=[]

            for name in self.name2label.keys():

                images+=glob.glob(os.path.join(self.root,name,'*.png'))

                images+=glob.glob(os.path.join(self.root, name, '*.jpg'))

                images += glob.glob(os.path.join(self.root, name, '*.jpeg'))

            print(len(images),images)

            # 1167 'pokeman\\bulbasaur\\00000000.png'

            # 将文件以上述的格式保存在csv文件内

            random.shuffle(images)

            with open(os.path.join(self.root,filename),mode='w',newline='') as f:

                writer=csv.writer(f)

                for img in images:    #  'pokeman\\bulbasaur\\00000000.png'

                    name=img.split(os.sep)[-2]

                    label=self.name2label[name]

                    writer.writerow([img,label])

                print("write into csv into :",filename)

        # 如果存在的话就直接的跳到这个地方

        images,labels=[],[]

        with open(os.path.join(self.root, filename)) as f:

            reader=csv.reader(f)

            for row in reader:

                # 接下来就会得到 'pokeman\\bulbasaur\\00000000.png' 0 的对象

                img,label=row

                # 将label转码为int类型

                label=int(label)

                images.append(img)

                labels.append(label)

        # 保证images和labels的长度是一致的

        assert len(images)==len(labels)

        return images,labels

    # 返回数据的数量

    def __len__(self):

        return len(self.images)   # 返回的是被裁剪之后的关系

    def denormalize(self, x_hat):

        mean = [0.485, 0.456, 0.406]

        std = [0.229, 0.224, 0.225]

        mean = torch.tensor(mean).unsqueeze(1).unsqueeze(1)

        std = torch.tensor(std).unsqueeze(1).unsqueeze(1)

        # print(mean.shape, std.shape)

        x = x_hat * std + mean

        return x

    # 返回idx的数据和当前图片的label

    def __getitem__(self,idx):

        # idex-[0-总长度]

        # retrun images,labels

        # 将图片，label的路径取出来

        # 得到的img是这样的一个类型：'pokeman\\bulbasaur\\00000000.png'

        # 然而label得到的则是 0，1，2 这样的整形的格式

        img,label=self.images[idx],self.labels[idx]

        tf=transforms.Compose([

            lambda x:Image.open(x).convert('RGB'),  # 将t图片的路径转换可以处理图片数据

            # 进行数据加强

            transforms.Resize((int(self.resize*1.25),int(self.resize*1.25))),

            # 随机旋转

            transforms.RandomRotation(15),   # 设置旋转的度数小一些，否则的话会增加网络的学习难度

            # 中心裁剪

            transforms.CenterCrop(self.resize),   # 此时：既旋转了又不至于导致图片变得比较的复杂

            transforms.ToTensor(),

            transforms.Normalize(mean=[0.485,0.456,0.406],

                                 std=[0.229,0.224,0.225])

        ])

        img=tf(img)

        label=torch.tensor(label)

        return img,label

def main():

    # 验证工作

    viz=visdom.Visdom()

    db=pokemom('pokeman',64,'train')  # 这里可以改变大小 224->64,可以通过visdom进行查看

    # 可视化样本

    x,y=next(iter(db))

    print('sample:',x.shape,y.shape,y)

    viz.image(db.denormalize(x),win='sample_x',opts=dict(title='sample_x'))

    # 加载batch_size的数据

    loader=DataLoader(db,batch_size=32,shuffle=True,num_workers=8)

    for x,y in loader:

        viz.images(db.denormalize(x),nrow=8,win='batch',opts=dict(title='batch'))

        viz.text(str(y.numpy()),win='label',opts=dict(title='batch-y'))

        # 每一次加载后，休息10s

        time.sleep(10)

if __name__ == '__main__':

    main()

PyTorch 中自定义数据集的读取方法的更多相关文章

Django 模型中自定义Manager和模型方法
1.自定义管理器(Manager) 在语句Book.objects.all()中,objects是一个特殊的属性,通过它来查询数据库,它就是模型的一个Manager. 每个Django模型至少有一个m ...
Pytorch中自定义神经网络卷积核权重
1. 自定义神经网络卷积核权重神经网络被深度学习者深深喜爱,究其原因之一是神经网络的便利性,使用者只需要根据自己的需求像搭积木一样搭建神经网络框架即可,搭建过程中我们只需要考虑卷积核的尺寸,输入输出 ...
转--Android中自定义字体的实现方法
1.Android系统默认支持三种字体,分别为:“sans”, “serif”, “monospace 2.在Android中可以引入其他字体 . 复制代码代码如下: <?xml versio ...
Wordpress在主题或者插件中自定义存储附件的方法
1.前端使用form表单 //单文件上传,我的业务需求中限制了必须上传图片 <input type="file" name="singlename" ac ...
Vue中自定义指令的使用方法！
除了核心功能默认内置的指令 (v-model 和 v-show),Vue 也允许注册自定义指令.注意,在 Vue2.0 中,代码复用和抽象的主要形式是组件.然而,有的情况下,你仍然需要对普通 DOM ...
【Azure 应用服务】在 App Service for Windows 中自定义 PHP 版本的方法
问题描述在App Service for Windows的环境中,当前只提供了PHP 7.4 版本的选择情况下,如何实现自定义PHP Runtime的版本呢? 如 PHP Version 8.1.9 ...
pytorch 中交叉熵损失实现方法
6.1 如何在spring中自定义xml标签
dubbo自定义了很多xml标签,例如<dubbo:application>,那么这些自定义标签是怎么与spring结合起来的呢?我们先看一个简单的例子. 一编写模型类 package ...
[Pytorch]PyTorch Dataloader自定义数据读取
整理一下看到的自定义数据读取的方法,较好的有一下三篇文章, 其实自定义的方法就是把现有数据集的train和test分别用含有图像路径与label的list返回就好了,所以需要根据数据集随机应变. 所 ...
pytorch加载语音类自定义数据集
pytorch对一下常用的公开数据集有很方便的API接口,但是当我们需要使用自己的数据集训练神经网络时,就需要自定义数据集,在pytorch中,提供了一些类,方便我们定义自己的数据集合 torch.u ...

随机推荐

算术逻辑单元的实现（ALU）
一.实验目的掌握Vivado集成开发环境掌握Verilog语言基本知识. 掌握并理解算术逻辑单元ALU的原理和设计二.实验预习 1．ALU(算术逻辑单元)的16种运算的编码三.模块接口设计 A ...
QA|不同模块之间的引用（导入问题）问题；|Pycharm
结构如图,在xxu的test.py中想要导入t2包中的sayhello和word两个方法注意:首先需要打开xxu和t2的上层目录,因为解释器是从打开的那个文件开始查找的,所以这里应该打开B01_01 ...
【RocketMQ】消息的拉取总结
在上一讲中,介绍了消息的存储,生产者向Broker发送消息之后,数据会写入到CommitLog中,这一讲,就来看一下消费者是如何从Broker拉取消息的. RocketMQ消息的消费以组为单位,有两种 ...
ES 2023新特性速解
ES 2023新特性速解一.新增数组方法操作数组的方法 Array.prototype.toSorted(compareFn) //返回一个新数组,其中元素按升序排序,而不改变原始数组. Arra ...
2023年了，复习了一下spring boot配置使用mongodb
前言 MongoDB是一个基于分布式文件存储的开源数据库系统,使用C++语言编写.它是一个介于关系数据库和非关系数据库之间的产品,具有类似关系数据库的功能,但又有一些非关系数据库的特点.MongoDB ...
Linux下jdk配置
1.首先执行以下命令查看可安装的jdk版本: yum -y list java* 执行成功后可看到如下界面: 2.选择自己需要的jdk版本进行安装,比如这里安装1.8,执行以下命令: yum in ...
Go语言常用标准库——fmt
文章目录 fmt 向外输出 Print Fprint Sprint Errorf 格式化占位符通用占位符布尔型整型浮点数与复数字符串和[]byte 指针宽度标识符其他falg 获取输入 ...
Python面向对象——property装饰器、继承（与python2不同点）、多继承（优缺点、Mixins）、属性查找、多继承带来的菱形问题
文章目录内容回顾 property装饰器继承与python2的差别多继承为何要用继承如何实现继承属性查找多继承带来的菱形问题总结: 作业内容回顾 1.封装=>整合人的对象. ...
0 基础晋级 Serverless 高手课 — 初识 Serverless（上）
应用 - 无服务器 2017- 2006 函数即服务类似云计算 (Serverless) faas 函数服务 + 后端数据库账号服务弹性,按量服务器,客户端的终结 - 弹性 - 按量优点 ...
JS个人总结（1）
1. html页面引入js文件优先使用引入外部js文件. 2. 如果在html页面里使用<script></script>,则把js内容放在html内容下面,也就是</b ...

PyTorch 中自定义数据集的读取方法

PyTorch 中自定义数据集的读取方法的更多相关文章

随机推荐

热门专题