数据集(benchmark)、常用数据集的解析(cifar-10、)
What is the class of this image ?
主要是以下常见的数据集,用以衡量算法的分类准确率:
- mnist、cifar-10、cifar-100stl-10
- svhn、ILSVRC2012 task 1
1. cifar-10
CIFAR-10 and CIFAR-100 datasets
cifar-10-batches-py(Python 接口)
import os
import pickle
import numpy as np def load_CIFAR10_batch(filename):
with open(filename, 'rb') as f:
data = pickle.load(f, encoding='latin1')
X = data['data']
y = data['labels']
X = X.reshape(-1, 3, 32, 32).transpose(0, 2, 3, 1).astype(np.float32)
y = np.array(y)
return X, y def load_CIFAR10(root):
xs, ys = [], []
for n in range(1, 6):
filename = os.path.join(root, 'data_batch_{}'.format(n))
X, y = load_CIFAR10_batch(filename)
xs.append(X)
ys.append(y)
Xtr = np.concatenate(xs)
Ytr = np.concatenate(ys)
Xte, Yte = load_CIFAR10_batch(os.path.join(root, 'test_batch'))
return Xtr, Ytr, Xte, Yte对于描述数据信息的信息(batches.meta),仍然可以使用 pickle.load 的形式加载,加载的结果仍然是一个字典类型:
with open('batches.meta', 'rb') as f:
data = pickle.load(f, encoding='latin1')
print(data) {'label_names': ['airplane',
'automobile',
'bird',
'cat',
'deer',
'dog',
'frog',
'horse',
'ship',
'truck'],
'num_cases_per_batch': 10000,
'num_vis': 3072}cifar-10-batches-mat(matlab 接口)
最方便的方式是调用 matlab 内置已封装好的 api,helperCIFAR10Data.download/load,或者使用
edit helperCIFAR10Data查看其实现;function [train_x, train_y, test_x, test_y] = load_cifar(filepath) train_x = []; train_y = [];
for i = 1:5
filename = fullfile(filepath, sprintf('data_batch_%d.mat', i));
[batch_train, batch_labels] = load_batch_as_4d_tensor(filename, true);
train_x = cat(4, train_x, batch_train);
train_y = [train_y; batch_labels];
end
filename = fullfile(filepath, 'test_batch.mat');
[test_x, test_y] = load_batch_as_4d_tensor(filename, true);
end function [train_x, train_y] = load_batch_as_4d_tensor(filename, to_categorical)
% 这里的 x_train 是 4 维的 tensor, 32*32*3*num
if ~exist('to_categorical', 'var') || isempty(to_categorical)
to_categorical = false;
end
load(filename);
train_x = reshape(data', 32, 32, 3, []);
train_x = permute(train_x, [2, 1, 3, 4]); % 互换第一维和第二维
train_y = labels;
if to_categorical
metafile = fullfile(fileparts(filename), 'batches.meta.mat');
load(metafile);
train_y = categorical(train_y, 0:9, label_names);
end end
数据集(benchmark)、常用数据集的解析(cifar-10、)的更多相关文章
- 深度学习常用数据集 API(包括 Fashion MNIST)
基准数据集 深度学习中经常会使用一些基准数据集进行一些测试.其中 MNIST, Cifar 10, cifar100, Fashion-MNIST 数据集常常被人们拿来当作练手的数据集.为了方便,诸如 ...
- RDD(弹性分布式数据集)及常用算子
RDD(弹性分布式数据集)及常用算子 RDD(Resilient Distributed Dataset)叫做弹性分布式数据集,是 Spark 中最基本的数据 处理模型.代码中是一个抽象类,它代表一个 ...
- 【AO笔记】有关TIN数据集的常用介绍
写论文查了很多TIN的接口和属性,特此来记录一下. 转载请注明出处:博客园@秋意正寒,B站同名. 未完待续 1. Tin数据集在ArcGIS中的描述 Tin数据集在磁盘中,被ArcGIS以文件夹形式管 ...
- 【转帖】Linux上,最常用的一批命令解析(10年精选)
Linux上,最常用的一批命令解析(10年精选) https://juejin.im/post/5d134fbfe51d4510727c80d1 写的挺好呢 Linux这么多命令,通常会让初学者望而生 ...
- torchvision的理解和学习 加载常用数据集,对主流模型的调用.md
torchvision的理解和学习 加载常用数据集,对主流模型的调用 https://blog.csdn.net/tsq292978891/article/details/79403617 加载常用数 ...
- 【神经网络与深度学习】基于Windows+Caffe的Minst和CIFAR—10训练过程说明
Minst训练 我的路径:G:\Caffe\Caffe For Windows\examples\mnist 对于新手来说,初步完成环境的配置后,一脸茫然.不知如何跑Demo,有么有!那么接下来的教 ...
- 【翻译】TensorFlow卷积神经网络识别CIFAR 10Convolutional Neural Network (CNN)| CIFAR 10 TensorFlow
原网址:https://data-flair.training/blogs/cnn-tensorflow-cifar-10/ by DataFlair Team · Published May 21, ...
- 人工智能大数据,公开的海量数据集下载,ImageNet数据集下载,数据挖掘机器学习数据集下载
人工智能大数据,公开的海量数据集下载,ImageNet数据集下载,数据挖掘机器学习数据集下载 ImageNet挑战赛中超越人类的计算机视觉系统微软亚洲研究院视觉计算组基于深度卷积神经网络(CNN)的计 ...
- 机器学习数据集,主数据集不能通过,人脸数据集介绍,从r包中获取数据集,中国河流数据集
机器学习数据集,主数据集不能通过,人脸数据集介绍,从r包中获取数据集,中国河流数据集 选自Microsoft www.tz365.Cn 作者:Lee Scott 机器之心编译 参与:李亚洲.吴攀. ...
- xml常用四种解析方式优缺点的分析×××××
xml常用四种解析方式优缺点的分析 博客分类: xml 最近用得到xml的解析方式,于是就翻了翻自己的笔记同时从网上查找了资料,自己在前人的基础上总结了下,贴出来大家分享下. 首先介绍一下xml语 ...
随机推荐
- arduino串口输出问题
- ntp 服务器
ntp.sjtu.edu.cn 202.120.2.101 (上海交通大学网络中心NTP服务器地址)s1a.time.edu.cn 北京邮电大学s1b.time.edu.cn 清华大学s1c.time ...
- 很安逸的离线API文档查询工具Dash和Zeal
大家开发的时候难免会查询一些文档,看一下API的调用方法等,所以会不同的语言去某一个地方去找,确实很麻烦,今天给大家安逸两款软件,肯定会让你爱不释手! Dash for macOS 官方地址:http ...
- Playing with coroutines and Qt
你好!我最近想知道C ++中的协程的状态,我发现了几个实现.我决定选择一个用于我的实验.它简单易用,适用于Linux和Windows. 我的目标是试图找到一种方法来让代码异步运行,而不必等待信号触发插 ...
- Scala基础知识
1.scala的变量分为可变变量和不可变变量 不可变变量: val hello = "helloworld" 可变变量的定义方法 var str2 = "我是kw!&qu ...
- 4、基于JZ2440之编写测试代码处理(处理图片识别人脸)
1.代码如下: void detectAndDisplay(Mat image) { CascadeClassifier ccf; //创建脸部对象 //ccf.load(xmlPath); //导入 ...
- 用FATFS在SD卡里写一串数字
用FATFS写SD卡,如写入数组 s[] ={1,2,3,4,5,6} 想要在txt中显示“123456” 就要把 s[0]=1+'0' 或 s[0]=1+48 或 s[0]=1+0x30 ...
- js如何将字符串作为函数名调用函数
js将如何字符串作为函数名调用函数 一.总结 一句话总结:用eval来实现.eval可以执行参数字符串. 二.js将字符串作为函数名调用函数 比如我现在有一个字符串str = "func_a ...
- js进阶 11-16 jquery如何查找元素的父亲、祖先和子代、后代
js进阶 11-16 jquery如何查找元素的父亲.祖先和子代.后代 一.总结 一句话总结:过滤或者查找的方法里面可以带参数进行进一步的选择. 1.parent()和parents()方法的区别是什 ...
- Java中String推断相等equals与==的差别以及StringBuilder的equals
Java中String类型具有一个equals的方法能够用于推断两种字符串是否相等,可是这样的相等又与运算符==所推断的"相等"有所不同,接下来进行分析,结论由程序进行验证 Str ...