#切分数据集

img_dir = train_parameters['img_dir']

file_name = train_parameters['file_name']

df = pd.read_csv(file_name)

df = df.sample(frac=1)

train_list = []

val_list = []

for i in range(len(df)):

    if (i <= len(df)*0.8):

        dirlist = img_dir + '/' + df.iloc[i][0] + '.jpg'

        label = df.iloc[i][1]

        datainfo = [dirlist, label]

        train_list.append(datainfo)

    else:

        dirlist = img_dir + '/' + df.iloc[i][0] + '.jpg'

        label = df.iloc[i][1]

        datainfo = [dirlist, label]

        val_list.append(datainfo)

# print(len(train_list))

# print(train_list[1][1])

定义数据集

'''

继承paddle.io.Dataset类

'''

IMAGE_SIZE = [3,224,224]

class Datasets(Dataset):

def init(self, data, mode='train'):

'''

步骤二：实现构造函数，定义数据读取，划分训练和测试、验证数据集

'''

    super(Datasets, self).__init__()

    self.data = data

    self.mode = mode

    if self.mode == 'train':

        self.transforms = T.Compose([

            # T.RandomResizedCrop(IMAGE_SIZE),

            # T.RandomHorizontalFlip(0.5),

            # T.ToTensor(),

            # T.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225]),

            #对输入图像进行裁剪，保持图片中心点不变。transform = CenterCrop(224)。

            T.CenterCrop(224),

            #随机调整图像的亮度，对比度，饱和度和色调。 transform = ColorJitter(0.4, 0.4, 0.4, 0.4)

            T.ColorJitter(0.4, 0.4, 0.4, 0.4),

            #依据degrees参数指定的角度范围，按照均匀分布随机产生一个角度对图像进行旋转。

            T.RandomRotation(60),

            #将形状为 （H x W x C）的输入数据 PIL.Image 或 numpy.ndarray 转换为 (C x H x W)。

            T.ToTensor(),

            #图像归一化处理，支持两种方式： 1. 用统一的均值和标准差值对图像的每个通道进行归一化处理； 2. 对每个通道指定不同的均值和标准差值进行归一化处理。

            T.Normalize(mean=[0.485, 0.456, 0.406],std=[0.229, 0.224, 0.225],)

        ])

    elif self.mode == 'valid':

        self.transforms = T.Compose([

            # T.Resize(IMAGE_SIZE[0]),

            # T.RandomCrop(IMAGE_SIZE),

            # T.ToTensor(),

            # T.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225])

            #对输入图像进行裁剪，保持图片中心点不变。transform = CenterCrop(224)。

            T.CenterCrop(224),

            #随机调整图像的亮度，对比度，饱和度和色调。 transform = ColorJitter(0.4, 0.4, 0.4, 0.4)

            T.ColorJitter(0.4, 0.5, 0.6, 0.7),

            #依据degrees参数指定的角度范围，按照均匀分布随机产生一个角度对图像进行旋转。

            T.RandomRotation(60),

            #将形状为 （H x W x C）的输入数据 PIL.Image 或 numpy.ndarray 转换为 (C x H x W)。

            T.ToTensor(),

            #图像归一化处理，支持两种方式： 1. 用统一的均值和标准差值对图像的每个通道进行归一化处理； 2. 对每个通道指定不同的均值和标准差值进行归一化处理。

            T.Normalize(mean=[0.485, 0.456, 0.406],std=[0.229, 0.224, 0.225],)

        ])

def __getitem__(self, index):

    '''

    实现getitem方法，定义指定index时如何获取数据，并返回单条数（训练数据，对应的标签）

    '''

    image = Image.open(self.data[index][0])

    if image.mode != 'RGB':

        image = image.convert('RGB')

    data = self.transforms(image)

    label = np.array([self.data[index][1]-1]).astype('int64')

    return data, label

def __len__(self):

    return len(self.data)

datasets数据读取器的更多相关文章

Extjs的数据读取器store和后台返回类型简单解析
工作中用到了Extjs,从后台获取数据的时候,用到了extjs自己的Ext.data.store方法,然后封装了ExtGridReturn方法, 目的:前台用到Ext.data.store读取从后台传 ...
[原创]SSIS-WMI 数据读取器任务：监控物理磁盘空间
背景: 随着时间的推移,我们的DW会越来越大,也就意味着磁盘空间会越来越小,那如果哪一天留意不当,就会造成磁盘空间的不足而导致ETL失败,最终影响我们的系统的数据正确性和使用,更严重的有可 ...
数据读取器对象SqlDataReader与数据适配器对象SqlDataAdapter的使用
一.数据读取器对象SqlDataReader的使用如何执行有查询结果集的select语句. 1.SqlDataReader对象的作用:当包含select语句的SqlCommad对象 ...
c#中使用数据读取器读取查询结果
今天有时间了. 在看<c#数据库入门经典> ,总结数据读取器查询结果. 针对单个结果集使用读取器,有3中方法: String connString =..; String sql =@&q ...
如何在ADO中使用数据读取器（DataReader）读取数据
DbDataReader类型(实现IDataReader接口)是从数据源获取信息最简单也最快速的方法. 数据读取器是只读向前的效据流．井且一次返回一条记录.因此．只有当你向数据源提交 Select 查 ...
调用EF的存储过程报“存储区数据提供程序返回的数据读取器所具有的列数对于所请求的查询不够”问题
在运用Entity Framework调用存储过程的时候,遇到"调用EF的存储过程报"调用EF的存储过程报“存储区数据提供程序返回的数据读取器所具有的列数对于所请求的查询不够”问题 ...
【原创】SSIS-WMI 数据读取器任务：监控物理磁盘空间
1.背景随着时间的推移,我们的DW会越来越大,也就意味着磁盘空间会越来越小,那如果哪一天留意不当,就会造成磁盘空间的不足而导致ETL失败,最终影响我们的系统的数据正确性和使用,更严重的有可能导致物理 ...
怎样在C#中从数据库中读取数据(数据读取器)
实现在C#中通过语句,查询数据库中的数据 SqlConnection con = null; //创建SqlConnection 的对象 try //try里面放可能出现错误的代码 ...
数据库学习任务四：数据读取器对象SqlDataReader、数据适配器对象SqlDataAdapter、数据集对象DataSet
数据库应用程序的开发流程一般主要分为以下几个步骤: 创建数据库使用Connection对象连接数据库使用Command对象对数据源执行SQL命令并返回数据使用DataReader和DataSet ...

随机推荐

ybt1184：明明的随机数
[题目描述] 明明想在学校中请一些同学一起做一项问卷调查,为了实验的客观性,他先用计算机生成了N个1到1000之间的随机整数(N≤100),对于其中重复的数字,只保留一个,把其余相同的数去掉,不同的数 ...
Idea进行spring-boot-devtools热部署以及不生效的问题解决
实现的方式有两种: spring-boot-devtools spring Loaded 我在此只介绍spring-boot-devtools的使用方法: 1.在pom中直接引入依赖 <depe ...
实现一个cache
实现一个LRU cache,定义get函数和set函数,cache是固定长度的,当cache已经满,那么就删除一直没有被更新的记录,然后将新的记录放进去. LRU: 全称是Least Recently ...
『忘了再学』Shell基础 — 3、echo命令的介绍与使用
目录 1.echo命令的作用 2.echo命令的基本用法 3.echo命令的-e选项用法 4.echo命令一些特殊用法 (1)输出字符带有字体颜色 (2)输出字符带有背景颜色在讲Shell脚本之前, ...
bzoj4671 异或图(斯特林反演，线性基)
bzoj4671 异或图(斯特林反演,线性基) 祭奠天国的bzoj. 题解时间首先考虑类似于容斥的东西. 设 $ f_{ i } $ 为至少有 $ i $ 个连通块的方案数, $ g_{ i } $ ...
CF487E Tourists(圆方树+树链剖分+multiset/可删堆)
CF487E Tourists(圆方树+树链剖分+multiset/可删堆) Luogu 给出一个带点权的无向图,两种操作: 1.修改某点点权. 2.询问x到y之间简单路径能走过的点的最小点权. 题解 ...
[MRCTF]XOR-无法生成反汇编的处理
主程序,无法生成伪代码由此分为两种方法即: 直接看反汇编解决问题,尝试生成伪代码硬啃汇编输入与输出判断输入长度是否为0x1B,其中al为eax的低8位将输入的字符每个与当前字符所在下标异或 ...
Oracle的数据优化(经常被问到)？
以Oracle数据库举例:(a-G要求掌握,H一般为DBA操作,了解就可以了) a. 建库:已知将保存海量数据的时候,因为Oracle是通过用户来管理数据的, 第一步我们先建一个tableaspace ...
Java 中怎么打印数组？
你可以使用 Arrays.toString() 和 Arrays.deepToString() 方法来打印数组.由于数组没有实现 toString() 方法,所以如果将数组传递给 System.ou ...
springboot-数据库访问之jpa+mybatis+jdbc的区别
什么是jdbc jdbc(Java DataBase Connectivity)是java连接数据库操作的原生接口. 什么是jpa jpa(Java Persistence API)是java持久化规 ...

datasets数据读取器

定义数据集

datasets数据读取器的更多相关文章

随机推荐

热门专题