SVHN数据集官网:http://ufldl.stanford.edu/housenumbers/

SVHN数据集官方提供的有两种格式

Format1是那种在街上拍的照片,每张照片的尺寸都不同,然后label提供了照片上门牌上的所有数字,和每一个单独的数字的bounding box;

Format2是把街拍图片上的数字一个一个截出来,然后resize成32*32的图片,label是一个单独的数字。

官方的Format2特别好读,numpy矩阵啥的官方都给了,网上教程也一大堆。但是Format1不太好读,我整了一下午,整了一个从bounding box剪出来的,多数字的版本,这里给大家提供一个开箱即用的预处理过的好读的格式发出来。

input和label如下

input:



label:[2, [2, 3]]

使用方法

import pickle

# 读取数据
f = open('train-set.blob', 'rb')
x_train_set, y_train_set = pickle.load(f)
f.close() f = open('test-set.blob', 'rb')
x_test_set, y_test_set = pickle.load(f)
f.close() # 展示图片和对应标签
from PIL import Image
index = 666
im = Image.fromarray(x_train_set[i].reshape(64,64,3))
im.show()
print(y_train_set[i])

数据格式

x_XXX_set::一个列表,列表中每个元素是一个numpy数组,表示一张图片,数组的尺寸是3*64*64,表示(通道,高度,宽度)。这个numpy数组的dtype为uint8,范围在0-255之间。通道有三个,意思是RGB的,具体哪个是R哪个是G哪个是B我就没管了

y_XXX_set:一个列表,列表中每个元素是一个列表,对应一张图片的label。这个小列表的格式为[数字的数量, [第一个数字,第二个数字,...]],列表中数字的数据类型都是python中的内置的int数据类型。

在原数据集中,图片上的0用“10”来标注。在我们这个版本里做出了修改,0就是用0标注。也就是0-9的正常标注。

下载地址:

有csdn积分的哥们施舍一下:https://download.csdn.net/download/qq_39480548/15617097

实在没积分的哥们咱也不能一棒子打死:https://pan.baidu.com/s/1jgc3-iQjMeDO30mhe8WGmQ 提取码: h9p3

SVHN数据集 Format1 剪裁版的更多相关文章

  1. 《2018:skymind.ai 发布了一份非常全面的开源数据集》

    这是一份非常全面的开源数据集,你,真的不想要吗?   近期,skymind.ai 发布了一份非常全面的开源数据集.内容包括生物识别.自然图像以及深度学习图像等数据集,现机器之心将其整理如下:(内附链接 ...

  2. 论文翻译:XNOR-Net: ImageNet Classification Using BinaryConvolutional Neural Networks

    目录 Abstract 1 Introduction 2 Related Work 3 Binary Convolutional Neural Network 3.1 Binary-Weight-Ne ...

  3. AGS中通过FeatureServer插入数据失败、插入数据在WMTS请求中无法显示以及version概念的讨论

    文章版权由作者李晓晖和博客园共有,若转载请于明显处标明出处:http://www.cnblogs.com/naaoveGIS/. 1.背景 在多个项目中,当我方接口给其他部门人员使用时出现了插入数据失 ...

  4. 《利用Python进行数据分析: Python for Data Analysis 》学习随笔

    NoteBook of <Data Analysis with Python> 3.IPython基础 Tab自动补齐 变量名 变量方法 路径 解释 ?解释, ??显示函数源码 ?搜索命名 ...

  5. ArcGIS Geodatabase版本控制机制的学习总结

    本文是最近内部的一个学习的自我整理,只有关键信息,如果需要详细了解,请参阅ArcGIS帮助文档: http://resources.arcgis.com/zh-cn/help/main/10.1/in ...

  6. [转]Binarized Neural Networks_ Training Neural Networks with Weights and Activations Constrained to +1 or −1

    原文: 二值神经网络(Binary Neural Network,BNN) 在我刚刚过去的研究生毕设中,我在ImageNet数据集上验证了图像特征二值化后仍然具有很强的表达能力,可以在检索中达到较好的 ...

  7. Python 数据分析5

    数据规整化 清理 转换 合并 重塑 数据库风格的DataFrame合并 pd.merge(df1, df2) # 默认会将重叠列的列名当作键,最好显式的指定下,另外merge默认是使用的inner j ...

  8. 论文翻译:BinaryConnect: Training Deep Neural Networks with binary weights during propagations

    目录 摘要 1.引言 2.BinaryConnect 2.1 +1 or -1 2.2确定性与随机性二值化 2.3 Propagations vs updates 2.4 Clipping 2.5 A ...

  9. Pandas数据的去重,替换和离散化,异常值的检测

    数据转换 移除重复数据 import pandas as pd import numpy as np from pandas import Series data = pd.DataFrame( {' ...

随机推荐

  1. Codeforces #637 div2 B. Nastya and Door

    题意:给你一个数组a,定义:若a[i]>a[i]&&a[i]>a[i-1],则a[i]为峰值,求长度为k的区间内峰值最多能为多少,并输出这个区间的左端点(区间需要将峰的左边 ...

  2. Codeforces Round #272 (Div. 2) B. Dreamoon and WiFi (暴力二进制枚举)

    题意:给你一个只含\(+\)和\(-\)的字符串,统计它的加减和,然后再给你一个包含\(+,-,?\)的字符串,其中\(?\)可以表示为\(+\)或\(-\),问有多少种情况使得第二个字符串的加减和等 ...

  3. Navicat 快捷键 for Mysql

     常用快捷键: 1. ctrl + q: 打开新查询窗口 2. ctrl + r: 运行当前窗口内的所有语句 3. ctrl + w: 关闭当前窗口 4. F6: 打开一个MySQL命令行窗口 5. ...

  4. kubernetes进阶(三)服务发现-coredns

    服务发现,说白了就是服务(应用)之间相互定位的过程. 服务发现需要解决的问题: 1.服务动态性强--容器在k8s中ip变化或迁移 2.更新发布频繁--版本迭代快 3.支持自动伸缩--大促或流量高峰 我 ...

  5. 操作系统:Linux进程与线程

    这里是一部分内容,还会做修改. 一:目的及内容 学习fork(),exec,pthread库函数的使用,阅读源码,分析fork,exec,pthread_create函数的机理 代码实现: 进程A创建 ...

  6. 计组CPU设计实验关键材料和关键设计

    我记得这是2016春季学期搞得,参考和学习了很多别人的东西,这里小小的总结一下,逻辑性还不是太强,还需要好好整理 首先是指令集 CPU架构 外部接线架构 指令格式 机器状态自动机 这部分忘了,汗 这部 ...

  7. js uppercase the first letter of string

    js uppercase the first letter of string js String.toUpperCase `-webkit-border-image`.split(`-`).filt ...

  8. queueMicrotask & EventLoop & macrotask & microtask

    queueMicrotask https://developer.mozilla.org/en-US/docs/Web/API/WindowOrWorkerGlobalScope/queueMicro ...

  9. js replace all

    js replace all https://stackoverflow.com/questions/1144783/how-can-i-replace-all-occurrences-of-a-st ...

  10. 星盟全球投资副总裁DENIEL SOIBIM:如何激发创造力

    丹尼尔·索比姆毕业于加州理工大学,2005年通过创建投资俱乐部对潜力公司进行天使投资,获得了美国Blue Run高层的重视,任营收专家评估师,为Blue Run项目提案做风险评估,09年与泰勒·亚当斯 ...