TensorFlow 入门之手写识别(MNIST) 数据处理 一

MNIST
Fly
softmax回归

准备数据

MNIST是在机器学习领域中的一个经典问题。该问题解决的是把28x28像素的灰度手写数字图片识别为相应的数字,其中数字的范围从0到9.

  1. from IPython.display import Image 

  2. import base64 

  3. Image(data=base64.decodestring(url),embed=True) 

同时我们可以通过TensorFlow提供的例子来下载有Yann LeCun提供的MNIST提供的如上的手写数据集。

文件 内容
train-images-idx3-ubyte.gz 训练集图片 - 55000 张 训练图片, 5000 张 验证图片
train-labels-idx1-ubyte.gz 训练集图片对应的数字标签
t10k-images-idx3-ubyte.gz 测试集图片 - 10000 张 图片
t10k-labels-idx1-ubyte.gz 测试集图片对应的数字标签
  1. import os 

  2. import urllib 


  3. SOURCE_URL = 'http://yann.lecun.com/exdb/mnist/' 

  4. # WORK_DIRECTORY = "/tmp/mnist-data" 

  5. WORK_DIRECTORY = '/home/fly/TensorFlow/mnist' 


  6. def maybe_download(filename): 

  7. """A helper to download the data files if not present.""" 

  8. if not os.path.exists(WORK_DIRECTORY): 

  9. os.mkdir(WORK_DIRECTORY) 

  10. filepath = os.path.join(WORK_DIRECTORY, filename) 

  11. if not os.path.exists(filepath): 

  12. filepath, _ = urllib.urlretrieve(SOURCE_URL + filename, filepath) 

  13. statinfo = os.stat(filepath) 

  14. print 'Succesfully downloaded', filename, statinfo.st_size, 'bytes.' 

  15. else: 

  16. print 'Already downloaded', filename 

  17. return filepath 


  18. train_data_filename = maybe_download('train-images-idx3-ubyte.gz') 

  19. train_labels_filename = maybe_download('train-labels-idx1-ubyte.gz') 

  20. test_data_filename = maybe_download('t10k-images-idx3-ubyte.gz') 

  21. test_labels_filename = maybe_download('t10k-labels-idx1-ubyte.gz') 


解压 与 重构

数据被解压成一个二维的Tensor:[image, index, pixel, index],pixel 列是像素的点。0表示的是背景色(白色),255表示的是前景色(黑色)。

上面下载的数据是压缩的格式,我们需要解压它。而且每一幅图是值为[0...255],我们要将它们缩放到[-0.5, 0.5]之间。

我们可以来看一下图片解压后的文件格式:

[offset] [type]          [value]          [description]
0000 32 bit integer 0x00000803(2051) magic number
0004 32 bit integer 60000 number of images
0008 32 bit integer 28 number of rows
0012 32 bit integer 28 number of columns
0016 unsigned byte ?? pixel
0017 unsigned byte ?? pixel
........
xxxx unsigned byte ?? pixel

对应的代码是:

  1. import gzip, binascii, struct, numpy 

  2. import matplotlibpyplot as plt 


  3. with gzip.open(test_data_filename) as f: 

  4. # 打印出解压后的图片格式的头格式 

  5. for field in ['magic number', 'image count', 'rows', 'columns']: 

  6. # struct.unpack reads the binary data provided by f.read. 

  7. # The format string '>i' decodes a big-endian integer, which 

  8. # is the encoding of the data. 

  9. print field, struct.unpack('>i', f.read(4))[0] 


  10. buf = f.read(28*28) 

  11. image = numpy.frombuffer(buf, dtype=numpy.uint8) 


  12. # 打印出前十个image的数据 

  13. print 'First 10 pixels: ', iamge[:10] 


  14. # ==> 

  15. # magic number 2051 

  16. # image count 10000 

  17. # rows 28 

  18. # columns 28 

  19. # First 10 pixels: [0 0 0 0 0 0 0 0 0 0] 


当然我们也可以将解压后的图给绘制出来

  1. # 我们将绘制图以及关于这个图的直方图 

  2. _, (ax1, ax2) = plt.subplots(1,2) 

  3. ax1.imshow(image.reshape(28,28), cmap=plt.cm.Greys) 


  4. ax2.hist(image, bins=20, range=[0,255]) 


我们也可以将reScale后的数据绘制出来看看

  1. # Let's convert the uint8 image to 32 bit floats and rescale  

  2. # the values to be centered around 0, between [-0.5, 0.5].  

  3. #  

  4. # We again plot the image and histogram to check that we  

  5. # haven't mangled the data. 

  6. scaled = image.astype(numpy.float32) 

  7. scaled = (scaled - (255 / 2.0)) / 255 

  8. _, (ax1, ax2) = plt.subplots(1, 2) 

  9. ax1.imshow(scaled.reshape(28, 28), cmap=plt.cm.Greys); 

  10. ax2.hist(scaled, bins=20, range=[-0.5, 0.5]); 


具体的数据使用可以看TensorFlow提供的测试代码[在IPython中是第三个实例3_mnist_from_scratch.ipynb]

手写识别入门

MNIST手写数据集

MNIST数据集的官网是Yann LeCun's website。 在这里,我们提供了一份python源代码用于自动下载和安装这个数据集。你可以下载这份代码,然后用下面的代码导入到你的项目里面,也可以直接复制粘贴到你的代码文件里面。(当然你也可以使用前面提到的代码来下载手写的数字数据)

  1. from tensorflow.examples.tutorials.mnist import input_data 


  2. # 通过指定下载地址就可以下载数据 

  3. mnist = input_data.read_data_sets("/home/fly/TensorFlow/mnist", one_hot=True)  


图片以及标签的数据格式处理

下载解压后,得到的数据分为两部分,60000行的训练集(mnist.train)和10000行的测试数据集(mnist.test)。由前面的介绍可以知道,每个MNIST数据有两部分组成:一个手写数字的图片以及一个对应的标签。比如在训练集中数据图片为mnist.train.images以及标签mnist.train.labels.

因为每一张图片是28 x 28的像素,所以我们可以使用一个数字数组来表示这张图:

然后我们再把这个数组展开为长度为28 * 28 = 784 的 一维向量。因此,在MNIST训练数据集中,mnist.train.images 是一个形状为 [60000, 784] 的张量,第一个维度数字用来索引图片,第二个维度数字用来索引每张图片中的像素点。在此张量里的每一个元素,都表示某张图片里的某个像素的强度值,值介于0和1之间。

相对应的MNIST数据集的标签是介于0到9的数字,用来描述给定图片里表示的数字。比如,标签0将表示成([1,0,0,0,0,0,0,0,0,0,0]).因此, mnist.train.labels 是一个 [60000, 10] 的数字矩阵。


Fly

2016.6

TensorFlow 入门之手写识别(MNIST) 数据处理 一的更多相关文章

  1. TensorFlow 入门之手写识别(MNIST) softmax算法

    TensorFlow 入门之手写识别(MNIST) softmax算法 MNIST flyu6 softmax回归 softmax回归算法 TensorFlow实现softmax softmax回归算 ...

  2. TensorFlow 入门之手写识别(MNIST) softmax算法 二

    TensorFlow 入门之手写识别(MNIST) softmax算法 二 MNIST Fly softmax回归 softmax回归算法 TensorFlow实现softmax softmax回归算 ...

  3. TensorFlow 入门之手写识别CNN 三

    TensorFlow 入门之手写识别CNN 三 MNIST 卷积神经网络 Fly 多层卷积网络 多层卷积网络的基本理论 构建一个多层卷积网络 权值初始化 卷积和池化 第一层卷积 第二层卷积 密集层连接 ...

  4. densenet tensorflow 中文汉字手写识别

    densenet 中文汉字手写识别,代码如下: import tensorflow as tf import os import random import math import tensorflo ...

  5. Tensorflow之基于MNIST手写识别的入门介绍

    Tensorflow是当下AI热潮下,最为受欢迎的开源框架.无论是从Github上的fork数量还是star数量,还是从支持的语音,开发资料,社区活跃度等多方面,他当之为superstar. 在前面介 ...

  6. 使用tensorflow实现mnist手写识别(单层神经网络实现)

    import tensorflow as tf import tensorflow.examples.tutorials.mnist.input_data as input_data import n ...

  7. tensorflow笔记(四)之MNIST手写识别系列一

    tensorflow笔记(四)之MNIST手写识别系列一 版权声明:本文为博主原创文章,转载请指明转载地址 http://www.cnblogs.com/fydeblog/p/7436310.html ...

  8. tensorflow笔记(五)之MNIST手写识别系列二

    tensorflow笔记(五)之MNIST手写识别系列二 版权声明:本文为博主原创文章,转载请指明转载地址 http://www.cnblogs.com/fydeblog/p/7455233.html ...

  9. TensorFlow MNIST(手写识别 softmax)实例运行

    TensorFlow MNIST(手写识别 softmax)实例运行 首先要有编译环境,并且已经正确的编译安装,关于环境配置参考:http://www.cnblogs.com/dyufei/p/802 ...

随机推荐

  1. git强制放弃本地更改

    git fetch --allgit reset --hard origin/master origin是服务器上的本地仓库master是分支

  2. go之变量、指针、引用地址

    一.值类型 定义和说明 定义:变量直接指向存在内存中的值,我们称之为值类型. 值类型的变量的值存储在栈中. 值类型 将一个变量赋值给另一个变量 被称为值拷贝 实例 package main impor ...

  3. oen /var/run/nginx.pid failed

    nginx: [error] open() "/var/run/nginx.pid" failed (2: No such file or directory) [root@TES ...

  4. struts2标签(五)

    标签体系结构 jsp出现目的是为了取代servlet,结果逻辑代码,数据库代码都放到了jsp页面中. 为了解决jsp中代码过多的问题,struts2标签分为普通标签和UI标签. 使用struts2标签 ...

  5. [转]line-height1.5和line-height:150%的区别

    line-height1.5和line-height:150%的区别   一.区别 区别体现在子元素继承时,如下: 父元素设置line-height:1.5会直接继承给子元素,子元素根据自己的font ...

  6. openMSP430之Custom linker script

    The use of the -mmcu switch is of course NOT mandatory. It is simply a convenient way to use the pre ...

  7. Java Web_过滤器

    过滤器分类: Servlet2.5: request:用户直接访问页面时,Web容器将会调用过滤器. forward:目标资源是通过RequestDispatcher的forward访问时,该过滤器将 ...

  8. JSP_内置对象_response

    response对象: response对象包含了相应客户请求的有关信息,但在JSP中很少直接用到它,它是HttpServletResponse类的实例.response对象具有页面作用域,即访问一个 ...

  9. Math工具类的使用

    1.包:java.lang  不需要导包 2.Math 类包含用于执行基本数学运算的方法,如初等指数.对数.平方根和三角函数. 特点: 该类中的方法都是静态方法,所以可以直接使用类名.方法名(实参)调 ...

  10. 用Python来实现斐波那契数列.

    1).递归 def fib_recur(n): assert n >= 0, "n > 0" if n <= 1: return n return fib_rec ...