Pytorch dataset自定义【直播】2019 年县域农业大脑AI挑战赛---数据准备(二)，Dataset定义

在我的torchvision库里介绍的博文（https://www.cnblogs.com/yjphhw/p/9773333.html）里说了对pytorch的dataset的定义方式。

本文相当于实现一个自定义的数据集，而这正是我们在做自己工程所需要的，我们总是用自己的数据嘛。

继承 from torch.utils.data import Dataset 类

然后实现 __len__(self) ，和 __getitem__(self,idx) 两个方法。以及数据增强也可以写入，数据增强想了想还是放到了Dataset里，

习惯上可能与常用的不同，但是觉得由于每种数据都有自己的增强方法所以，增强方法可以和数据集绑定到一起的。

接上一节我们通过切割，获取了2217个图像切片。

这就是我的FarmDataset

from torch.utils.data import Dataset, DataLoader

from PIL import Image,ImageEnhance

from osgeo import gdal

from torchvision import transforms

import glob

import torch as tc

import numpy as np

class FarmDataset(Dataset):

    def __init__(self,istrain=True,isaug=True):

        self.istrain=istrain

        self.trainxformat='./data/train/data1500/*.bmp'

        self.trainyformat='./data/train/label1500/*.bmp'

        self.testxformat='./data/test/*.png'

        self.fns=glob.glob(self.trainxformat) if istrain else glob.glob(self.testxformat)

        self.length=len(self.fns)

        self.transforms=transforms

        self.isaug=isaug

    def __len__(self):

        #total length is 2217

        return self.length

    def __getitem__(self,idx):

        if self.istrain:

            imgxname=self.fns[idx]

            sampleimg = Image.open(imgxname)

            imgyname=imgxname.replace('data1500','label1500')

            targetimg = Image.open(imgyname).convert('L')

            #sampleimg.save('original.bmp')

            #data augmentation

            if self.isaug:

                sampleimg,targetimg=self.imgtrans(sampleimg,targetimg)

            #check the result of dataautmentation

            #sampleimg.save('sampletmp.bmp')

            #targetimg.save('targettmp.bmp')

            sampleimg=transforms.ToTensor()(sampleimg)

            #targetimg=transforms.ToTensor()(targetimg).squeeze(0).long()

            targetimg=np.array(targetimg)

            targetimg=tc.from_numpy(targetimg).long()         #to tensor

            #print(sampleimg.shape,targetimg.shape)

            return sampleimg,targetimg

        else:

            return gdal.Open(self.fns[idx])

    def imgtrans(self,x,y,outsize=1024):

        '''input is a PIL image

           image dataaugumentation

           return also aPIL image。

        '''

        #rotate should consider y

        degree=np.random.randint(360)

        x=x.rotate(degree,resample=Image.NEAREST,fillcolor=0)

        y=y.rotate(degree,resample=Image.NEAREST,fillcolor=0)  #here should be carefull, in case of label damage

        #random do the input image augmentation

        if np.random.random()>0.5:

            #sharpness

            factor=0.5+np.random.random()

            enhancer=ImageEnhance.Sharpness(x)

            x=enhancer.enhance(factor)

        if np.random.random()>0.5:

            #color augument

            factor=0.5+np.random.random()

            enhancer=ImageEnhance.Color(x)

            x=enhancer.enhance(factor)

        if np.random.random()>0.5:

            #contrast augument

            factor=0.5+np.random.random()

            enhancer=ImageEnhance.Contrast(x)

            x=enhancer.enhance(factor)

        if np.random.random()>0.5:

            #brightness

            factor=0.5+np.random.random()

            enhancer=ImageEnhance.Brightness(x)

            x=enhancer.enhance(factor)

        #img flip

        transtypes=[Image.FLIP_LEFT_RIGHT,Image.FLIP_TOP_BOTTOM,

                Image.ROTATE_90,Image.ROTATE_180,Image.ROTATE_270]

        transtype=transtypes[np.random.randint(len(transtypes))]

        x = x.transpose(transtype)

        y = y.transpose(transtype)

        #img resize between 0.8-1.2

        w,h=x.size

        factor=1+np.random.normal()/5

        if factor>1.2: factor=1.2

        if factor<0.8: factor=0.8

        #print(factor,x.size)

        x=x.resize((int(w*factor),int(h*factor)),Image.NEAREST)

        y=y.resize((int(w*factor),int(h*factor)),Image.NEAREST)

        #random crop

        w,h=x.size

        stx=np.random.randint(w-outsize)

        sty=np.random.randint(h-outsize)

        #print((stx,sty,outsize,outsize))

        x=x.crop((stx,sty,stx+outsize,sty+outsize)) #stx,sty,width,height

        y=y.crop((stx,sty,stx+outsize,sty+outsize))

        #print(x.size,y.size)

        return x,y   #return outsized pil image

if __name__=='__main__':

    d=FarmDataset(istrain=True)

    x,y=d[2216]

    print(x.shape)

    print(y.shape)

　　输入的是个1500x1500的图像，输出的是增强后的1024x1024后的图像。

　　其实对于分割问题来看，以后这个就可以作为一个模板，修改修改就可以换到另一个数据集中。

放几张图片：

原始图像：

进行数据增强后可以得到的一系列：

经过check 发现没有的问题通过测试。

Pytorch dataset自定义【直播】2019 年县域农业大脑AI挑战赛---数据准备(二)，Dataset定义的更多相关文章

Pytorch 分割模型构建和训练【直播】2019 年县域农业大脑AI挑战赛---(四)模型构建和网络训练
对于分割网络,如果当成一个黑箱就是:输入一个3x1024x1024 输出4x1024x1024. 我没有使用二分类,直接使用了四分类. 分类网络使用了SegNet,没有加载预训练模型,参数也是默认初始 ...
Pytorch 加载保存模型【直播】2019 年县域农业大脑AI挑战赛---(三)保存结果
在模型训练结束,结束后,通常是一个分割模型,输入 1024x1024 输出 4x1024x1024. 一种方法就是将整个图切块,然后每张预测,但是有个不好处就是可能在边界处断续. 由于这种切块再预测很 ...
Pytorch【直播】2019 年县域农业大脑AI挑战赛---初级准备(一)切图
比赛地址:https://tianchi.aliyun.com/competition/entrance/231717/introduction 这次比赛给的图非常大5万x5万,在训练之前必须要进行数 ...
XAF 框架中，自定义参数动作（Action），输入参数的控件可定义，用于选择组织及项目
XAF 框架中,如何生成一个自定义参数动作(Action),输入参数的控件可定义? 参考文档:https://documentation.devexpress.com/eXpressAppFramew ...
“全栈2019”Java第八十九章：接口中能定义内部类吗？
难度初级学习时间 10分钟适合人群零基础开发语言 Java 开发环境 JDK v11 IntelliJ IDEA v2018.3 文章原文链接 "全栈2019"Java第 ...
2019年全国高校计算机能力挑战赛 C语言程序设计决赛
2019年全国高校计算机能力挑战赛 C语言程序设计决赛毕竟这个比赛是第一次举办,能理解.. 希望未来再举办时,能够再完善一下题面表述.数据范围. 话说区域赛获奖名额有点少吧.舍友花60块想混个创新创 ...
2019年全国高校计算机能力挑战赛初赛C语言解答
http://www.ncccu.org.cn 2019年全国高校计算机能力挑战赛分设大数据算法赛,人工智能算法赛,Office高级应用赛,程序设计赛4大赛项 C语言初赛解答 1:编程1 16.现有一 ...
C# 将Excel里面的数据填充到DataSet中
/// <summary> /// 将Excel表里的数据填充到DataSet中 /// </summary> /// <param name="filenam ...
[Pytorch]PyTorch Dataloader自定义数据读取
整理一下看到的自定义数据读取的方法,较好的有一下三篇文章, 其实自定义的方法就是把现有数据集的train和test分别用含有图像路径与label的list返回就好了,所以需要根据数据集随机应变. 所 ...

随机推荐

记C++中发现的隐式转换问题
#include <iostream> #include <string> using std::cin; using std::cout; using std::endl; ...
acm数论之旅（转载）--素数
https://www.cnblogs.com/linyujun/p/5198832.html 前言:好多学ACM的人都在问我数论的知识(其实我本人分不清数学和数论有什么区别,反正以后有关数学的知识我 ...
洛谷 P3808 【模板】AC自动机（简单版）（AC自动机优化板子）
题中有一个坑点,就是模式串可以相同,并且全部计数. #include <bits/stdc++.h> using namespace std; const int maxn=1e6+10; ...
Kubernetes的pod控制器及ReplicaSet控制器类型的pod的定义
为什么需要Pod Kubernetes项目之所以这么做的原因: 因为Kubernetes是谷歌公司基于Borg项目做出来的,谷歌工程师发现,他们部署的应用往往存在这进程与进程组的关系.具体说呢,就是这 ...
CodeForces-220B Little Elephant and Array
小象喜欢玩数组.他有一个数组a,由n个正整数组成,从1到n进行索引.让我们用索引i表示数字ai. 此外,小象对数组还有m个查询,每个查询的特征是一对整数lj和rj(1 ≤ lj ≤ rj ≤ n).对 ...
创建Ajax兼容
var request = new XMLHttpRequest(); IE7以下: var request = new ActiveXObject("Microsoft.XMLHTTP&q ...
Update(Stage5)：DMP项目_业务介绍_框架搭建
DMP (Data Management Platform) 导读整个课程的内容大致分为如下两个部分业务介绍技术实现对于业务介绍, 比较困难的是理解广告交易过程中各个参与者是干什么的对于技术 ...
vue.js 第九课
这次讲红色框框. 方法与事件处理器: 方法处理器: 内联语句处理器: 事件修饰符: 按键修饰符: 为什么在HTML中监听事件? 1.v-on绑定事件带参数 2.事件对象$event: 有时也需要调用 ...
centos 安装phpize
yum -y install php-devel 然后 /usr/bin/phpize
SpringBoot与Jpa入门
一.JPA简介目前JPA主要实现由hibernate和openJPA等. Spring Data JPA 是Spring Data 的一个子项目,它通过提供基于JPA的Repository极大了减少 ...

Pytorch dataset自定义【直播】2019 年县域农业大脑AI挑战赛---数据准备(二)，Dataset定义

Pytorch dataset自定义【直播】2019 年县域农业大脑AI挑战赛---数据准备(二)，Dataset定义的更多相关文章

随机推荐

热门专题