TensorFlow 训练MNIST数据集（2）—

　　在我的上一篇随笔中，采用了单层神经网络来对MNIST进行训练，在测试集中只有约90%的正确率。这次换一种神经网络（多层神经网络）来进行训练和测试。

1、获取MNIST数据

　　MNIST数据集只要一行代码就可以获取的到，非常方便。关于MNIST的基本信息可以参考我的上一篇随笔。

mnist = input_data.read_data_sets('./data/mnist', one_hot=True)

2、模型基本结构

　　本次采用的训练模型为三层神经网络结构，输入层节点数与MNIST一行数据的长度一致，为784；输出层节点数与数字的类别数一致，为10；隐藏层节点数为50个；每次训练的mini-batch数量为64,；最大训练周期为50000。

 inputSize  = 784

 outputSize = 10

 hiddenSize = 50

 batchSize  = 64

 trainCycle = 50000

3、输入层

　　输入层用于接收每次小批量样本的输入，先通过placeholder来进行占位，在训练时才传入具体的数据。值得注意的是，在生成输入层的tensor时，传入的shape中有一个‘None’，表示每次输入的样本的数量，该‘None’表示先不作具体的指定，在真正输入的时候再根据实际的数据来进行推断。这个很方便，但也是有条件的，也就是通过该方法返回的tensor不能使用简单的加（+）减（-）乘（*）除（/）符号来进行计算（否则将会报错），需要用TensorFlow中的相关函数来进行代替。

inputLayer = tf.placeholder(tf.float32, shape=[None, inputSize])

4、隐藏层

　　在神经网络中，隐藏层的作用主要是提取数据的特征（feature）。这里的权重参数采用了 tensorflow.truncated_normal() 函数来进行生成，与上次采用的 tensorflow.

random_normal() 不一样。这两者的作用都是生成指定形状、期望和标准差的符合正太分布随机变量。区别是 truncated_normal 函数对随机变量的范围有个限制（与期望的偏差在2个标准差之内，否则丢弃）。另外偏差项这里也使用了变量的形式，也可以采用常量来进行替代。

　　激活函数为sigmoid函数。

 hiddenWeight = tf.Variable(tf.truncated_normal([inputSize, hiddenSize], mean=0, stddev=0.1))

 hiddenBias   = tf.Variable(tf.truncated_normal([hiddenSize]))

 hiddenLayer  = tf.add(tf.matmul(inputLayer, hiddenWeight), hiddenBias)

 hiddenLayer  = tf.nn.sigmoid(hiddenLayer)

5、输出层

　　输出层与隐藏层类似，只是节点数不一样。

 outputWeight = tf.Variable(tf.truncated_normal([hiddenSize, outputSize], mean=0, stddev=0.1))

 outputBias   = tf.Variable(tf.truncated_normal([outputSize], mean=0, stddev=0.1))

 outputLayer  = tf.add(tf.matmul(hiddenLayer, outputWeight), outputBias)

 outputLayer  = tf.nn.sigmoid(outputLayer)

6、输出标签

　　跟输入层一样，也是先占位，在最后训练的时候再传入具体的数据。标签，也就是每一个样本的正确分类。

outputLabel = tf.placeholder(tf.float32, shape=[None, outputSize])

7、损失函数

　　这里采用的是交叉熵损失函数。注意用的是v2版本，第一个版本已被TensorFlow声明为deprecated，准备废弃了。

loss = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits_v2(labels=outputLabel, logits=outputLayer))

8、优化器与目标函数

　　优化器采用了Adam梯度下降法，我试过了普通的GradientDescentOptimizer，效果不如Adam；也用过Adadelta，结果几乎收敛不了。

　　目标函数就是最小化损失函数。

optimizer = tf.train.AdamOptimizer()

target    = optimizer.minimize(loss)

9、训练过程

　　先创建一个会话，然后初始化tensors，最后进行迭代训练。模型的收敛速度很快，在1000次的时候就达到了大概90%的正确率。

 with tf.Session() as sess:

     sess.run(tf.global_variables_initializer())

     for i in range(trainCycle):

         batch = mnist.train.next_batch(batchSize)

         sess.run(target, feed_dict={inputLayer: batch[0], outputLabel: batch[1]})

         if i % 1000 == 0:

             corrected = tf.equal(tf.argmax(outputLabel, 1), tf.argmax(outputLayer, 1))

             accuracy = tf.reduce_mean(tf.cast(corrected, tf.float32))

             accuracyValue = sess.run(accuracy, feed_dict={inputLayer: batch[0], outputLabel: batch[1]})

             print(i, 'train set accuracy:', accuracyValue)

模型训练输出：

10、测试训练结果

　　在测数据集上测试。准确率达到96%，比单层的神经网络好很多。

     corrected = tf.equal(tf.argmax(outputLabel, 1), tf.argmax(outputLayer, 1))

     accuracy  = tf.reduce_mean(tf.cast(corrected, tf.float32))

     accuracyValue = sess.run(accuracy, feed_dict={inputLayer: mnist.test.images, outputLabel: mnist.test.labels})

     print("accuracy on test set:", accuracyValue)

测试集上的输出：

附：

　　完整代码如下：

 import tensorflow as tf

 from tensorflow.examples.tutorials.mnist import input_data

 mnist = input_data.read_data_sets('./data/mnist', one_hot=True)

 inputSize  = 784

 outputSize = 10

 hiddenSize = 50

 batchSize  = 64

 trainCycle = 50000

 # 输入层

 inputLayer = tf.placeholder(tf.float32, shape=[None, inputSize])

 # 隐藏层

 hiddenWeight = tf.Variable(tf.truncated_normal([inputSize, hiddenSize], mean=0, stddev=0.1))

 hiddenBias   = tf.Variable(tf.truncated_normal([hiddenSize]))

 hiddenLayer  = tf.add(tf.matmul(inputLayer, hiddenWeight), hiddenBias)

 hiddenLayer  = tf.nn.sigmoid(hiddenLayer)

 # 输出层

 outputWeight = tf.Variable(tf.truncated_normal([hiddenSize, outputSize], mean=0, stddev=0.1))

 outputBias   = tf.Variable(tf.truncated_normal([outputSize], mean=0, stddev=0.1))

 outputLayer  = tf.add(tf.matmul(hiddenLayer, outputWeight), outputBias)

 outputLayer  = tf.nn.sigmoid(outputLayer)

 # 标签

 outputLabel = tf.placeholder(tf.float32, shape=[None, outputSize])

 # 损失函数

 loss = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits_v2(labels=outputLabel, logits=outputLayer))

 # 优化器

 optimizer = tf.train.AdamOptimizer()

 # 训练目标

 target = optimizer.minimize(loss)

 # 训练

 with tf.Session() as sess:

     sess.run(tf.global_variables_initializer())

     for i in range(trainCycle):

         batch = mnist.train.next_batch(batchSize)

         sess.run(target, feed_dict={inputLayer: batch[0], outputLabel: batch[1]})

         if i % 1000 == 0:

             corrected = tf.equal(tf.argmax(outputLabel, 1), tf.argmax(outputLayer, 1))

             accuracy = tf.reduce_mean(tf.cast(corrected, tf.float32))

             accuracyValue = sess.run(accuracy, feed_dict={inputLayer: batch[0], outputLabel: batch[1]})

             print(i, 'train set accuracy:', accuracyValue)

     # 测试

     corrected = tf.equal(tf.argmax(outputLabel, 1), tf.argmax(outputLayer, 1))

     accuracy  = tf.reduce_mean(tf.cast(corrected, tf.float32))

     accuracyValue = sess.run(accuracy, feed_dict={inputLayer: mnist.test.images, outputLabel: mnist.test.labels})

     print("accuracy on test set:", accuracyValue)

     sess.close()

本文地址：https://www.cnblogs.com/laishenghao/p/9736696.html

TensorFlow 训练MNIST数据集（2）—— 多层神经网络的更多相关文章

TensorFlow训练MNIST数据集（3） —— 卷积神经网络
前面两篇随笔实现的单层神经网络和多层神经网络, 在MNIST测试集上的正确率分别约为90%和96%.在换用多层神经网络后,正确率已有很大的提升.这次将采用卷积神经网络继续进行测试. 1.模型基本结构 ...
TensorFlow训练MNIST数据集（1） —— softmax 单层神经网络
1.MNIST数据集简介首先通过下面两行代码获取到TensorFlow内置的MNIST数据集: from tensorflow.examples.tutorials.mnist import inp ...
2、TensorFlow训练MNIST
装载自:http://www.tensorfly.cn/tfdoc/tutorials/mnist_beginners.html TensorFlow训练MNIST 这个教程的目标读者是对机器学习和T ...
使用caffe训练mnist数据集 - caffe教程实战（一）
个人认为学习一个陌生的框架,最好从例子开始,所以我们也从一个例子开始. 学习本教程之前,你需要首先对卷积神经网络算法原理有些了解,而且安装好了caffe 卷积神经网络原理参考:http://cs231 ...
实践详细篇-Windows下使用VS2015编译的Caffe训练mnist数据集
上一篇记录的是学习caffe前的环境准备以及如何创建好自己需要的caffe版本.这一篇记录的是如何使用编译好的caffe做训练mnist数据集,步骤编号延用上一篇 <实践详细篇-Windows下 ...
一个简单的TensorFlow可视化MNIST数据集识别程序
下面是TensorFlow可视化MNIST数据集识别程序,可视化内容是,TensorFlow计算图,表(loss, 直方图, 标准差(stddev)) # -*- coding: utf-8 -*- ...
MNIST数据集上卷积神经网络的简单实现（使用PyTorch)
设计的CNN模型包括一个输入层,输入的是MNIST数据集中28*28*1的灰度图两个卷积层, 第一层卷积层使用6个3*3的kernel进行filter,步长为1,填充1.这样得到的尺寸是(28+1* ...
TensorFlow训练MNIST报错ResourceExhaustedError
title: TensorFlow训练MNIST报错ResourceExhaustedError date: 2018-04-01 12:35:44 categories: deep learning ...
基于 tensorflow 的 mnist 数据集预测
1. tensorflow 基本使用方法 2. mnist 数据集简介与预处理 3. 聚类算法模型 4. 使用卷积神经网络进行特征生成 5. 训练网络模型生成结果 how to install ten ...

随机推荐

使用 Azure PowerShell 模块创建和管理 Windows VM
Azure 虚拟机提供完全可配置的灵活计算环境. 本教程介绍 Azure 虚拟机的基本部署项目,例如选择 VM 大小.选择 VM 映像和部署 VM. 你将学习如何执行以下操作: 创建并连接到 VM 选 ...
Sql Server2008R2下载地址
ed2k://%7Cfile%7Ccn_sql_server_2008_r2_enterprise_x86_x64_ia64_dvd_522233.iso%7C4662884352%7C1DB0252 ...
【转】Redis学习---哈希结构内存模型剖析
[原文]https://www.toutiao.com/i6594624365906625032/ 概述在前文<Redis字符串类型内部编码剖析>之中已经剖析过 Redis最基本的 St ...
Fix_And_Hold 使用及存在问题
RTKLIB中使用FIXANDHOLD没有对各个卫星的方差进行排序,仅仅是使用了截止高度角.而大软件中进行了排序后,使用30°的截止角作为hold条件. 1.总卫星数与hold卫星数,及ratio,全 ...
Django商城项目笔记No.17用户部分-用户中心用户地址管理
收货地址管理首先就是新增地址看图分析所需要保存的字段因为是用户的地址,所以在users应用中的models创建模型类 class Address(BaseModel): "" ...
解决The valid characters are defined in RFC 7230 and RFC 3986错误问题
分析原因: 导致上述问题是因为tomcat自tomcat 8.0.35版本之后对URL参数做了比较规范的限制,必须遵循RFC 7230 and RFC 3986规范,对于非保留字字符(json格式的请 ...
[部署]VM11下CentOS7mini安装及配置
最近使用了CentOS发现比Ubuntu更简洁,有些爱上CentOS了 1. 准备一版CentOS安装镜像文件官网下载地址:http://www.centos.org/download/ 官方有三个 ...
world转html在线编辑器
轻量富文本编辑器插件:http://fex.baidu.com/ueditor/ http://ueditor.baidu.com/website/onlinedemo.html
Mac下用户名、计算机名、个人目录名修改
1.修改mac用户名 [系统偏好设置]->[用户与群组]->点开左下方的小锁->解锁后再用户头像右击,进入到高级选项->进行设置即可 2.修改mac计算机名 [系统偏好设置]- ...
JAVA框架 Spring AOP注解
一.准备工作: 1)导入jar包: 4个jar包. 2)约束:(spring需要所有的约束)有IOC约束和AOP 还有事务(tx)以及注解注入的约束(context). <?xml versio ...

TensorFlow 训练MNIST数据集（2）—— 多层神经网络

TensorFlow 训练MNIST数据集（2）—— 多层神经网络的更多相关文章

随机推荐

热门专题