数据集(benchmark)、常用数据集的解析(cifar-10、)
What is the class of this image ?
主要是以下常见的数据集,用以衡量算法的分类准确率:
- mnist、cifar-10、cifar-100stl-10
- svhn、ILSVRC2012 task 1
1. cifar-10
CIFAR-10 and CIFAR-100 datasets
cifar-10-batches-py(Python 接口)
import os
import pickle
import numpy as np def load_CIFAR10_batch(filename):
with open(filename, 'rb') as f:
data = pickle.load(f, encoding='latin1')
X = data['data']
y = data['labels']
X = X.reshape(-1, 3, 32, 32).transpose(0, 2, 3, 1).astype(np.float32)
y = np.array(y)
return X, y def load_CIFAR10(root):
xs, ys = [], []
for n in range(1, 6):
filename = os.path.join(root, 'data_batch_{}'.format(n))
X, y = load_CIFAR10_batch(filename)
xs.append(X)
ys.append(y)
Xtr = np.concatenate(xs)
Ytr = np.concatenate(ys)
Xte, Yte = load_CIFAR10_batch(os.path.join(root, 'test_batch'))
return Xtr, Ytr, Xte, Yte对于描述数据信息的信息(batches.meta),仍然可以使用 pickle.load 的形式加载,加载的结果仍然是一个字典类型:
with open('batches.meta', 'rb') as f:
data = pickle.load(f, encoding='latin1')
print(data) {'label_names': ['airplane',
'automobile',
'bird',
'cat',
'deer',
'dog',
'frog',
'horse',
'ship',
'truck'],
'num_cases_per_batch': 10000,
'num_vis': 3072}cifar-10-batches-mat(matlab 接口)
最方便的方式是调用 matlab 内置已封装好的 api,helperCIFAR10Data.download/load,或者使用
edit helperCIFAR10Data查看其实现;function [train_x, train_y, test_x, test_y] = load_cifar(filepath) train_x = []; train_y = [];
for i = 1:5
filename = fullfile(filepath, sprintf('data_batch_%d.mat', i));
[batch_train, batch_labels] = load_batch_as_4d_tensor(filename, true);
train_x = cat(4, train_x, batch_train);
train_y = [train_y; batch_labels];
end
filename = fullfile(filepath, 'test_batch.mat');
[test_x, test_y] = load_batch_as_4d_tensor(filename, true);
end function [train_x, train_y] = load_batch_as_4d_tensor(filename, to_categorical)
% 这里的 x_train 是 4 维的 tensor, 32*32*3*num
if ~exist('to_categorical', 'var') || isempty(to_categorical)
to_categorical = false;
end
load(filename);
train_x = reshape(data', 32, 32, 3, []);
train_x = permute(train_x, [2, 1, 3, 4]); % 互换第一维和第二维
train_y = labels;
if to_categorical
metafile = fullfile(fileparts(filename), 'batches.meta.mat');
load(metafile);
train_y = categorical(train_y, 0:9, label_names);
end end
数据集(benchmark)、常用数据集的解析(cifar-10、)的更多相关文章
- 深度学习常用数据集 API(包括 Fashion MNIST)
基准数据集 深度学习中经常会使用一些基准数据集进行一些测试.其中 MNIST, Cifar 10, cifar100, Fashion-MNIST 数据集常常被人们拿来当作练手的数据集.为了方便,诸如 ...
- RDD(弹性分布式数据集)及常用算子
RDD(弹性分布式数据集)及常用算子 RDD(Resilient Distributed Dataset)叫做弹性分布式数据集,是 Spark 中最基本的数据 处理模型.代码中是一个抽象类,它代表一个 ...
- 【AO笔记】有关TIN数据集的常用介绍
写论文查了很多TIN的接口和属性,特此来记录一下. 转载请注明出处:博客园@秋意正寒,B站同名. 未完待续 1. Tin数据集在ArcGIS中的描述 Tin数据集在磁盘中,被ArcGIS以文件夹形式管 ...
- 【转帖】Linux上,最常用的一批命令解析(10年精选)
Linux上,最常用的一批命令解析(10年精选) https://juejin.im/post/5d134fbfe51d4510727c80d1 写的挺好呢 Linux这么多命令,通常会让初学者望而生 ...
- torchvision的理解和学习 加载常用数据集,对主流模型的调用.md
torchvision的理解和学习 加载常用数据集,对主流模型的调用 https://blog.csdn.net/tsq292978891/article/details/79403617 加载常用数 ...
- 【神经网络与深度学习】基于Windows+Caffe的Minst和CIFAR—10训练过程说明
Minst训练 我的路径:G:\Caffe\Caffe For Windows\examples\mnist 对于新手来说,初步完成环境的配置后,一脸茫然.不知如何跑Demo,有么有!那么接下来的教 ...
- 【翻译】TensorFlow卷积神经网络识别CIFAR 10Convolutional Neural Network (CNN)| CIFAR 10 TensorFlow
原网址:https://data-flair.training/blogs/cnn-tensorflow-cifar-10/ by DataFlair Team · Published May 21, ...
- 人工智能大数据,公开的海量数据集下载,ImageNet数据集下载,数据挖掘机器学习数据集下载
人工智能大数据,公开的海量数据集下载,ImageNet数据集下载,数据挖掘机器学习数据集下载 ImageNet挑战赛中超越人类的计算机视觉系统微软亚洲研究院视觉计算组基于深度卷积神经网络(CNN)的计 ...
- 机器学习数据集,主数据集不能通过,人脸数据集介绍,从r包中获取数据集,中国河流数据集
机器学习数据集,主数据集不能通过,人脸数据集介绍,从r包中获取数据集,中国河流数据集 选自Microsoft www.tz365.Cn 作者:Lee Scott 机器之心编译 参与:李亚洲.吴攀. ...
- xml常用四种解析方式优缺点的分析×××××
xml常用四种解析方式优缺点的分析 博客分类: xml 最近用得到xml的解析方式,于是就翻了翻自己的笔记同时从网上查找了资料,自己在前人的基础上总结了下,贴出来大家分享下. 首先介绍一下xml语 ...
随机推荐
- 使用Tomcat发布war包
第一步:下载tomacat 1.下载地址:http://tomcat.apache.org 2.解压后目录如下 3.双击bin文件夹下startup.bat 即可启动tomcat, 计算机会弹出控制台 ...
- git的安装及其使用
在Windows上安装Git的快捷方式: 工具:1.Windows的console工具:ConEmu(https://conemu.github.io/)多窗口.记录log.多theme选择,操作Gi ...
- JavaFX2 - 文本可复制的Label
背景介绍 我的公司和我个人一直都使用JavaFX2来编写client应用程序,同一时候也作为Applet在浏览器中执行. 我们的客户以前拿我们的产品和网页对照,然后向我们提过两个需求: (1) 希望界 ...
- UVA Bandwidth
题目例如以下: Bandwidth Given a graph (V,E) where V is a set of nodes and E is a set of arcsin VxV, and a ...
- C++ BYTE数组转字符串
第一种情况: BYTE[0]=Ox12 BYTE[1]=0x34 BYTE[2]=0x56 最后要转换成字符串123456 另外一种情况: BYTE[0]=Ox12 BYTE[1]=0x34 BYTE ...
- Codeforces Round #315 (Div. 2) (ABCD题解)
比赛链接:http://codeforces.com/contest/569 A. Music time limit per test:2 seconds memory limit per test: ...
- js静态私有变量(将方法变成原型模式,被所有实例共享,而方法操作变量,故变量是静态)
js静态私有变量(将方法变成原型模式,被所有实例共享,而方法操作变量,故变量是静态) 一.总结 1.js函数中的private和public:js函数中的私有变量 var 变量名,公有变量 this. ...
- C#实现人脸识别
C#实现基于ffmpeg加虹软的人脸识别 关于人脸识别 目前的人脸识别已经相对成熟,有各种收费免费的商业方案和开源方案,其中OpenCV很早就支持了人脸识别,在我选择人脸识别开发库时,也横向对比了三种 ...
- 关于FATFS的读写速度
//////////////////////////////////////////////////////////////////////////////////////////////////// ...
- js 省市二级联动
<html> <head> <meta charset="UTF-8"> <title></title> </he ...