使用Numpy将数据集中的data和target同时shuffle

假设现在有图像数据imgs和对应标签targets。数据维度分别如下

imgs.shape = (num, channel, width, height)

targets.shape = (num, class)

因为通常我们需要将数据打散，这样的好处是可以让模型训练更具鲁棒性，那么如何同时打散data和target，而且还需要保持对应顺序不变呢？方法如下

# 得到打乱后的index

from random import shuffle

index = [i for i in range(len(imgs))]

shuffle(index)

imgs = imgs[index, :, :, :]

targets = targets[index, :]

要注意的是数据的维度要保持正确，也就是上面的:数量要正确，假如在mnist数据集上，target的维度是(num,)维度，所以此时应该写成targets = targets[index]即可。

使用Numpy将数据集中的data和target同时shuffle的更多相关文章

Scikit-learn：数据预处理Preprocessing data
http://blog.csdn.net/pipisorry/article/details/52247679 本blog内容有标准化.数据最大最小缩放处理.正则化.特征二值化和数据缺失值处理. 基础 ...
ABP(现代ASP.NET样板开发框架)系列之13、ABP领域层——数据过滤器（Data filters）
点这里进入ABP系列文章总目录基于DDD的现代ASP.NET开发框架--ABP系列之13.ABP领域层——数据过滤器(Data filters) ABP是“ASP.NET Boilerplate P ...
代码的坏味道（5）——数据泥团(Data Clumps)
坏味道--数据泥团(Data Clumps) 特征有时,代码的不同部分包含相同的变量组(例如用于连接到数据库的参数).这些绑在一起出现的数据应该拥有自己的对象. 问题原因通常,数据泥团的出现时因为 ...
【菜鸟学习jquery源码】数据缓存与data()
前言最近比较烦,深圳的工作还没着落,论文不想弄,烦.....今天看了下jquery的数据缓存的代码,参考着Aaron的源码分析,自己有点理解了,和大家分享下.以后也打算把自己的jquery的学习心得 ...
数据访问模式：数据并发控制（Data Concurrency Control）
1.数据并发控制(Data Concurrency Control)简介数据并发控制(Data Concurrency Control)是用来处理在同一时刻对被持久化的业务对象进行多次修改的系统.当 ...
Python/Numpy大数据编程经验
Python/Numpy大数据编程经验 1.边处理边保存数据,不要处理完了一次性保存.不然程序跑了几小时甚至几天后挂了,就啥也没有了.即使部分结果不能实用,也可以分析程序流程的问题或者数据的特点. ...
EF 更新数据出现 System.Data.Entity.Infrastructure.DbUpdateConcurrencyException: 异常
EF6更新数据出现 System.Data.Entity.Infrastructure.DbUpdateConcurrencyException: Store update, insert, or ...
WCF技术剖析之十二：数据契约（Data Contract）和数据契约序列化器（DataContractSerializer）
原文:WCF技术剖析之十二:数据契约(Data Contract)和数据契约序列化器(DataContractSerializer) [爱心链接:拯救一个25岁身患急性白血病的女孩[内有苏州电视台经济 ...
Spark性能优化之道——解决Spark数据倾斜（Data Skew）的N种姿势
原创文章,同步首发自作者个人博客转载请务必在文章开头处注明出处. 摘要本文结合实例详细阐明了Spark数据倾斜的几种场景以及对应的解决方案,包括避免数据源倾斜,调整并行度,使用自定义Partitio ...

随机推荐

java连接数据库报了ssl连接的警告
警告内容:Establishing SSL connection without server's identity verification is not recommended(不建议在没有服务器 ...
day06-(mysql)
建表: CREATE DATABASE mysqltest2; USE mysqltest2; -- 部门表 CREATE TABLE DEPT( DEPTNO INT PRIMARY KEY, -- ...
使用CMD 命令创建指定大小的文件
在做资源更新的时候要做磁盘空间不足的测试,于是想创建一个文件塞满硬盘,搜索到可以用命令来创建. fsutil file createnew null.zip 524288000
python 函数基础及装饰器
没有参数的函数及return操作 def test1(): print ("welcome") def test2(): print ("welcomt test2&qu ...
Hbase运维手册（1）
1. region情况需要检查 1. region的数量(总数和每台regionserver上的region数) 2. region的大小如果发现异常可以通过手动merge region和手动分配 ...
request模块的使用
安装方式 $ pip install requests 基本GET请求(headers参数和 parmas参数) 1. 最基本的GET请求可以直接用get方法 response = requests ...
netty的数据通信之心跳检测
问题1:我们想实现客户端和服务端建立连接之后,5秒钟之后如果没有数据传输就关闭与客户端的连接. 解决办法:在服务端加上下面一条代码 ch.pipeline().addLast(new ReadTime ...
Kafka权威指南读书笔记之（五）深入Kafka
集中讨论以下3 个有意思的话题 :• Kafka 如何进行复制:• Kafka 如何处理来自生产者和消费者的请求 :• Kafka 的存储细节,比如文件格式和索引. 集群成员关系 Kafka 使用 Z ...
WebRequest/HttpWebRequest/HttpRequest/WebClient/HttpClient的区别
1.WebRequest和HttpWebRequest WebRequest 的命名空间是: System.Net ,它是HttpWebRequest的抽象父类(还有其他子类如FileWebReque ...
使用Ruby处理大型CSV文件
处理大型文件是一种内存密集型操作,可能导致服务器耗尽RAM内存并交换到磁盘.让我们看一下使用Ruby处理CSV文件的几种方法,并测量内存消耗和速度性能. Prepare CSV data sample ...

使用Numpy将数据集中的data和target同时shuffle

使用Numpy将数据集中的data和target同时shuffle的更多相关文章

随机推荐

热门专题