TensorFlow训练MNIST数据集（1） —— softmax 单层神经网络

1、MNIST数据集简介

　　首先通过下面两行代码获取到TensorFlow内置的MNIST数据集：

from tensorflow.examples.tutorials.mnist import input_data

mnist = input_data.read_data_sets('./data/mnist', one_hot=True)

　　MNIST数据集共有55000（mnist.train.num_examples）张用于训练的数据，对应的有55000个标签；共有10000（mnist.test.num_examples）张用于测试的图片的数据，同样的有10000个标签与之对应。为了方便访问，这些图片或标签的数据都是被格式化了的。

　　MNIST数据集的训练数据集（mnist.train.images）是一个 55000 * 784 的矩阵，矩阵的每一行代表一张图片（28 * 28 * 1）的数据，图片的数据范围是 [0, 1]，代表像素点灰度归一化后的值。

　　训练集的标签（mnist.train.labels）是一个55000 * 10 的矩阵，每一行的10个数字分别代表对应的图片属于数字0到9的概率，范围是0或1。一个标签行只有一个是1，表示该图片的正确数字是对应的下标值，其余是0。

　　测试集与训练集的类似，只是数据量不同。

　　以下代码显示部分MNIST训练图片的形状及标签：

import numpy as np

import matplotlib.pyplot as plot

from tensorflow.examples.tutorials.mnist import input_data

mnist = input_data.read_data_sets('./data/mnist', one_hot=True)

trainImages = mnist.train.images

trainLabels = mnist.train.labels

plot.figure(1, figsize=(4, 3))

for i in range(6):

    curImage = np.reshape(trainImages[i, :], (28, 28))

    curLabel = np.argmax(trainLabels[i, :])

    ax = plot.subplot(int(str(23) + str(i+1)))

    plot.imshow(curImage, cmap=plot.get_cmap('gray'))

    plot.axis('off')

    ax.set_title(curLabel)

plot.suptitle('MNIST')

plot.show()

　　上述代码输出的MNIST图片及其标签：

2、通过单层神经网络进行训练

 def train(trainCycle=50000, debug=False):

     inputSize  = 784

     outputSize = 10

     batchSize  = 64

     inputs = tf.placeholder(tf.float32, shape=[None, inputSize])

     # x * w = [64, 784] * [784, 10]

     weights   = tf.Variable(tf.random_normal([784, 10], 0, 0.1))

     bias      = tf.Variable(tf.random_normal([outputSize], 0, 0.1))

     outputs   = tf.add(tf.matmul(inputs, weights), bias)

     outputs   = tf.nn.softmax(outputs)

     labels = tf.placeholder(tf.float32, shape=[None, outputSize])

     loss      = tf.reduce_mean(tf.square(outputs - labels))

     optimizer = tf.train.GradientDescentOptimizer(0.1)

     trainer   = optimizer.minimize(loss)

     sess = tf.Session()

     sess.run(tf.global_variables_initializer())

     for i in range(trainCycle):

         batch = mnist.train.next_batch(batchSize)

         sess.run([trainer, loss], feed_dict={inputs: batch[0], labels: batch[1]})

         if debug and i % 1000 == 0:

             corrected = tf.equal(tf.argmax(labels, 1), tf.argmax(outputs, 1))

             accuracy = tf.reduce_mean(tf.cast(corrected, tf.float32))

             accuracyValue = sess.run(accuracy, feed_dict={inputs: batch[0], labels: batch[1]})

             print(i, ' train set accuracy:', accuracyValue)

     # 测试

     corrected = tf.equal(tf.argmax(labels, 1), tf.argmax(outputs, 1))

     accuracy = tf.reduce_mean(tf.cast(corrected, tf.float32))

     accuracyValue = sess.run(accuracy, feed_dict={inputs: mnist.test.images, labels: mnist.test.labels})

     print("accuracy on test set:", accuracyValue)

     sess.close()

3、训练结果

　　上述模型的最终输出为：

由打印日志可以看出，前期收敛速度很快，后期开始波动。最后该模型在训练集上的正确率大概为90%，测试集上也差不多。精度还是比较低的，说明单层的神经网络在处理图片数据上存在着很大的缺陷，并不是一个很好的选择。

本文地址：https://www.cnblogs.com/laishenghao/p/9576806.html

TensorFlow训练MNIST数据集（1） —— softmax 单层神经网络的更多相关文章

TensorFlow 训练MNIST数据集（2）—— 多层神经网络
在我的上一篇随笔中,采用了单层神经网络来对MNIST进行训练,在测试集中只有约90%的正确率.这次换一种神经网络(多层神经网络)来进行训练和测试. 1.获取MNIST数据 MNIST数据集只要一行代码 ...
TensorFlow训练MNIST数据集（3） —— 卷积神经网络
前面两篇随笔实现的单层神经网络和多层神经网络, 在MNIST测试集上的正确率分别约为90%和96%.在换用多层神经网络后,正确率已有很大的提升.这次将采用卷积神经网络继续进行测试. 1.模型基本结构 ...
使用tensorflow实现mnist手写识别(单层神经网络实现)
import tensorflow as tf import tensorflow.examples.tutorials.mnist.input_data as input_data import n ...
2、TensorFlow训练MNIST
装载自:http://www.tensorfly.cn/tfdoc/tutorials/mnist_beginners.html TensorFlow训练MNIST 这个教程的目标读者是对机器学习和T ...
一个简单的TensorFlow可视化MNIST数据集识别程序
下面是TensorFlow可视化MNIST数据集识别程序,可视化内容是,TensorFlow计算图,表(loss, 直方图, 标准差(stddev)) # -*- coding: utf-8 -*- ...
使用caffe训练mnist数据集 - caffe教程实战（一）
个人认为学习一个陌生的框架,最好从例子开始,所以我们也从一个例子开始. 学习本教程之前,你需要首先对卷积神经网络算法原理有些了解,而且安装好了caffe 卷积神经网络原理参考:http://cs231 ...
实践详细篇-Windows下使用VS2015编译的Caffe训练mnist数据集
上一篇记录的是学习caffe前的环境准备以及如何创建好自己需要的caffe版本.这一篇记录的是如何使用编译好的caffe做训练mnist数据集,步骤编号延用上一篇 <实践详细篇-Windows下 ...
TensorFlow训练MNIST报错ResourceExhaustedError
title: TensorFlow训练MNIST报错ResourceExhaustedError date: 2018-04-01 12:35:44 categories: deep learning ...
深度学习原理与框架-Tensorflow基本操作-mnist数据集的逻辑回归 1.tf.matmul(点乘操作) 2.tf.equal(对应位置是否相等) 3.tf.cast(将布尔类型转换为数值类型) 4.tf.argmax(返回最大值的索引) 5.tf.nn.softmax(计算softmax概率值) 6.tf.train.GradientDescentOptimizer(损失值梯度下降器)
1. tf.matmul(X, w) # 进行点乘操作参数说明:X,w都表示输入的数据, 2.tf.equal(x, y) # 比较两个数据对应位置的数是否相等,返回值为True,或者False 参 ...

随机推荐

Linux 中查看 DNS 与配置
DNS(Domain Name System,域名系统),因特网上作为域名和IP地址相互映射的一个分布式数据库,能够使用户更方便的访问互联网,而不用去记住能够被机器直接读取的IP数串. 查看dns 可 ...
tar压缩/解压用法
格式:tar zcvf 压缩后的路径及包名你要压缩的文件 z:gzip压缩 c:创建压缩包 v:显示打包压缩解压过程 f:接着压缩 t:查看压缩包内容 x:解压 X:指定文件列表形式排除不需要打包压 ...
selenium-百度搜索框输入后，定位联想下拉框元素
1.输入关键字后,显示联想下拉框,鼠标右键对应的联想字段,点击检查,就可在F12模式下元素查看器中定位到,之后使用Xpath定位.
团队-UML
UML设计分工刘双玉李佳铭杜宏庆肖小强汪志彬江郑符天愉邓弘立后台数据库求购模块浏览检索商品即时聊天系统商品管理管理员系统后台商品发布收藏系统登录注册与个人信息系统 U ...
未能找到 CodeDom 提供程序类型“Microsoft.CodeDom.Providers.DotNetCompilerPlatform.CSharpCodeProvider,
未能找到 CodeDom 提供程序类型“Microsoft.CodeDom.Providers.DotNetCompilerPlatform.CSharpCodeProvider, Microsoft ...
Android Studio快捷键——编辑篇
Android Studio是官方推出的Android开发IDE,本系列讲解Android Studio中常用的快捷键,本文是该系列的第一篇,讲解的内容是与编辑代码相关的快捷键. 本文所讲快捷键基于A ...
myEtherWallet在线钱包的使用
https://www.myetherwallet.com/#generate-wallet myEtherWallet是一款在线钱包,当你不想安装类似metamask这样的插件时,可以选择使用它 1 ...
leetcode322—Coin Change
You are given coins of different denominations and a total amount of money amount. Write a function ...
CSS3页面布局方案
CSS3页面布局方案 Web页面中的布局,在css3之前,主要使用float属性或者position属性进行页面中的简单布局,但是使用它们也存在一些缺点,比如两栏或者多栏中如果元素的内容高度不一致,则 ...
jquery另外一种类似tab切换效果
简要:最近做项目一些效果不能用淘宝kissy框架所以代码得自己写啊网上当然有很多组件但是用他们的代码很多(有的是我不需要的代码) 且还要看API 还不如自己动手写个简单一个,是这么一种简单的效果 ...

TensorFlow训练MNIST数据集（1） —— softmax 单层神经网络

TensorFlow训练MNIST数据集（1） —— softmax 单层神经网络的更多相关文章

随机推荐

热门专题