TensorFlow笔记——关于MNIST数据的一个简单的例子

这个程序参考自极客学院。

from tensorflow.examples.tutorials.mnist import input_data

import tensorflow as tf

# MNIST数据存放的路径

file = "./MNIST"

# 导入数据

mnist = input_data.read_data_sets(file, one_hot=True)

# 模型的输入和输出

x = tf.placeholder(tf.float32, shape=[None, 784])

y_ = tf.placeholder(tf.float32, shape=[None, 10])

# 模型的权重和偏移量

W = tf.Variable(tf.zeros([784, 10]))

b = tf.Variable(tf.zeros([10]))

# 创建Session

sess = tf.InteractiveSession()

# 初始化权重变量

sess.run(tf.global_variables_initializer())

y = tf.nn.softmax(tf.matmul(x, W) + b)

# 交叉熵

cross_entropy = -tf.reduce_sum(y_*tf.log(y))

# 训练

train_step = tf.train.GradientDescentOptimizer(0.01).minimize(cross_entropy)

for i in range(1000):

    batch = mnist.train.next_batch(50)

    train_step.run(feed_dict={x: batch[0], y_: batch[1]})

# 测试

correct_prediction = tf.equal(tf.argmax(y, 1), tf.argmax(y_, 1))

accuracy = tf.reduce_mean(tf.cast(correct_prediction, tf.float32))

print(sess.run(accuracy, feed_dict={x: mnist.test.images, y_:mnist.test.labels}))

注释：

# MNIST数据存放的路径

file = "./MNIST"

# 导入数据

mnist = input_data.read_data_sets(file, one_hot=True)

将下载MNIST数据到./MNIST/文件夹下，此过程可能会由于网络问题而出错。建议自己从MNIST官网下载。将下载好的文件放到上述路径下即可。input_data.read_data_sets()函数可以自动检测指定目录下是否存在MNIST数据，如果存在，就不会下载了。

# 模型的输入和输出

x = tf.placeholder(tf.float32, shape=[None, 784])

y_ = tf.placeholder(tf.float32, shape=[None, 10])

这里x和y不是特定的值。它们是表示输入和输出的占位符，可以在进行计算的时候进行赋值。

模型的输入x是一个2维的浮点数张量。它的大小为shape=[None, 784]，其中784是一张展平的MNIST图片的维度。None表示其值不固定。输出y_也是一个2维张量，它的每一行都是一个10维的one-hot向量，用来表示对应的MNIST图片的类别。

# 模型的权重和偏移量

W = tf.Variable(tf.zeros([784, 10]))

b = tf.Variable(tf.zeros([10]))

变量W和b是线性模型的参数，这个线性模型用如下表达式表示：

y_=x∗W+b

其中，y_和x分别表示上述模型的输入和输出。W是一个784∗10的矩阵，因为输入有784个特征，同时有10个输出值。b是一个10维的向量，是因为输出有10个分类。

# 创建Session

sess = tf.InteractiveSession()

# 初始化权重变量

# 以前版本的初始化代码是

# sess.run(tf.initialize_all_variables())

sess.run(tf.global_variables_initializer())

变量需要经过初始化才可以在Session中使用。

# 构建回归模型

y = tf.nn.softmax(tf.matmul(x, W) + b)

把向量化后的图片x和权重矩阵W相乘，加上偏移量b，然后计算每个分类的softmax概率值。

# 交叉熵

cross_entropy = -tf.reduce_sum(y_*tf.log(y))

为训练过程指定损失函数，损失函数是用来评估模型一次预测的好与坏的。在这里使用目标类别和预测类别之间的交叉熵作为我们的损失函数。交叉熵定义如下：

L(y_,y)=−∑iy_ilog(yi)

其中y_表示目标类别，也就是真实值。y是预测类别，就是模型的输出值。

# 训练

train_step = tf.train.GradientDescentOptimizer(0.01).minimize(cross_entropy)

for i in range(1000):

    batch = mnist.train.next_batch(50)

    train_step.run(feed_dict={x: batch[0], y_: batch[1]})

这里我们使用TensorFlow内置的梯度下降来进行优化，即让损失函数的值下降，步长为0.01。然后通过循环，不断地训练模型。每次循环，都会从训练集中加载50个样本。

# 测试

# 这里返回一个布尔数组，形如[True, False, True]

correct_prediction = tf.equal(tf.argmax(y, 1), tf.argmax(y_, 1))

# 将布尔数组转换为浮点数，并取平均值，如上布尔数组可以转换为[1, 0, 1]，计算平均值为0.667

accuracy = tf.reduce_mean(tf.cast(correct_prediction, tf.float32))

# 计算在测试数据上的准确率

print(sess.run(accuracy, feed_dict={x: mnist.test.images, y_:mnist.test.labels}))

模型到这里就构建完成了，但这个模型到底好不好，我们并不知道。所以需要在测试集上验证模型的泛化能力。

最后，这个模型的准确率约为0.91，结果如下：

TensorFlow笔记——关于MNIST数据的一个简单的例子的更多相关文章

tensorflow笔记：流程，概念和简单代码注释
tensorflow是google在2015年开源的深度学习框架,可以很方便的检验算法效果.这两天看了看官方的tutorial,极客学院的文档,以及综合tensorflow的源码,把自己的心得整理了一 ...
扩展Python模块系列(二)----一个简单的例子
本节使用一个简单的例子引出Python C/C++ API的详细使用方法.针对的是CPython的解释器. 目标:创建一个Python内建模块test,提供一个功能函数distance, 计算空间中两 ...
Struts2的配置和一个简单的例子
Struts2的配置和一个简单的例子笔记仓库:https://github.com/nnngu/LearningNotes 简介这篇文章主要讲如何在 IntelliJ IDEA 中使用 Strut ...
一个简单的例子搞懂ES6之Promise
ES5中实现异步的常见方式不外乎以下几种: 1. 回调函数 2. 事件驱动 2. 自定义事件(根本上原理同事件驱动相同) 而ES6中的Promise的出现就使得异步变得非常简单.promise中的异步 ...
Linux内核中的信号机制--一个简单的例子【转】
本文转载自:http://blog.csdn.net/ce123_zhouwei/article/details/8562958 Linux内核中的信号机制--一个简单的例子 Author:ce123 ...
从一个简单的例子谈谈package与import机制
转,原文:http://annie09.iteye.com/blog/469997 http://blog.csdn.net/gdsy/article/details/398072 这两篇我也不知道到 ...
用一个简单的例子来理解python高阶函数
============================ 用一个简单的例子来理解python高阶函数 ============================ 最近在用mailx发送邮件, 写法大致如 ...
Spring-Context之一:一个简单的例子
很久之前就想系统的学习和掌握Spring框架,但是拖了很久都没有行动.现在趁着在外出差杂事不多,就花时间来由浅入深的研究下Spring框架.Spring框架这几年来已经发展成为一个巨无霸产品.从最初的 ...
关于apriori算法的一个简单的例子
apriori算法是关联规则挖掘中很基础也很经典的一个算法,我认为很多教程出现大堆的公式不是很适合一个初学者理解.因此,本文列举一个简单的例子来演示下apriori算法的整个步骤. 下面这个表格是代表 ...

随机推荐

Power安装linux-BIG ENDIAN mysql编译安装
一.安装系统,不选择额外的软件 mkvdev -vadapter vhost0 -vdev hdisk2 -dev db_mysql01_sys mkvdev -vadapter vhost0 -vd ...
Redis-主从
主从复制过程 1.从服务器开始连接主服务器时,会向主服务器发送一个SYNC同步命令 2.主服务器接收到命令后,执行BGSAVE,异步的将写命令保存到一个缓冲区里 3.主服务器执行完BGSAVE之后,就 ...
二、$CSS部分
1.css sprite是什么,有什么优缺点概念:将多个小图片拼接到一个图片中.通过background-position和元素尺寸调节需要显示的背景图案. 优点: 减少HTTP请求数,极大地提高页 ...
使用盒子定位布局时margin和padding使用
首先说的是区别: 如图所示,黄色padding,绿色margin,中间的content是内容,margin和padding的值是不计算在内容高宽的.这里补充的是在实际情况中边框宽度也是不计算在内的.这 ...
【深度学习】PyTorch之Squeeze()和Unsqueeze()
1. unsqueeze() 该函数用来增加某个维度.在PyTorch中维度是从0开始的. import torch a = torch.arange(0, 9) print(a) 结果: tenso ...
[PHP学习教程 - 文件]002.修改上传文件大小限制(File Upload Limit)
引言:通常大家直装xampp之后,默认的文件上传大小应该被设定成2M左右,这个时候如果上传超过2M的东西,就会报错,让人非常尴尬.如何修改呢? 导航索引: 概念 FTP常用API FTP封装类其他 ...
机器学习pdf资源
<深度学习>(Deep Learning)中文版pdf, 百度网盘: https://pan.baidu.com/s/1jHDiQTg <机器学习导论>(Introductio ...
WEB APPLICATION PENETRATION TESTING NOTES
此文转载 XXE VALID USE CASE This is a nonmalicious example of how external entities are used: <?xml v ...
Java实现 LeetCode 777 在LR字符串中交换相邻字符（分析题）
777. 在LR字符串中交换相邻字符在一个由 'L' , 'R' 和 'X' 三个字符组成的字符串(例如"RXXLRXRXL")中进行移动操作.一次移动操作指用一个"L ...
Java实现 LeetCode 90 子集 II（二）
90. 子集 II 给定一个可能包含重复元素的整数数组 nums,返回该数组所有可能的子集(幂集). 说明:解集不能包含重复的子集. 示例: 输入: [1,2,2] 输出: [ [2], [1], [ ...

TensorFlow笔记——关于MNIST数据的一个简单的例子

TensorFlow笔记——关于MNIST数据的一个简单的例子的更多相关文章

随机推荐

热门专题