【TensorFlow篇】--Tensorflow框架实现SoftMax模型识别手写数字集

一、前述

本文讲述用Tensorflow框架实现SoftMax模型识别手写数字集，来实现多分类。

同时对模型的保存和恢复做下示例。

二、具体原理

代码一：实现代码

#!/usr/bin/python

# -*- coding: UTF-8 -*-

# 文件名: 12_Softmax_regression.py

from tensorflow.examples.tutorials.mnist import input_data

import tensorflow as tf

# mn.SOURCE_URL = "http://yann.lecun.com/exdb/mnist/"

my_mnist = input_data.read_data_sets("MNIST_data_bak/", one_hot=True)#从本地路径加载进来

# The MNIST data is split into three parts:

# 55,000 data points of training data (mnist.train)#训练集图片

# 10,000 points of test data (mnist.test), and#测试集图片

# 5,000 points of validation data (mnist.validation).#验证集图片

# Each image is 28 pixels by 28 pixels

# 输入的是一堆图片，None表示不限输入条数，784表示每张图片都是一个784个像素值的一维向量

# 所以输入的矩阵是None乘以784二维矩阵

x = tf.placeholder(dtype=tf.float32, shape=(None, 784)) #x矩阵是m行*784列

# 初始化都是0，二维矩阵784乘以10个W值 #初始值最好不为0

W = tf.Variable(tf.zeros([784, 10]))#W矩阵是784行*10列

b = tf.Variable(tf.zeros([10]))#bias也必须有10个

y = tf.nn.softmax(tf.matmul(x, W) + b)# x*w 即为m行10列的矩阵就是y #预测值

# 训练

# labels是每张图片都对应一个one-hot的10个值的向量

y_ = tf.placeholder(dtype=tf.float32, shape=(None, 10))#真实值 m行10列

# 定义损失函数，交叉熵损失函数

# 对于多分类问题，通常使用交叉熵损失函数

# reduction_indices等价于axis，指明按照每行加，还是按照每列加

cross_entropy = tf.reduce_mean(-tf.reduce_sum(y_ * tf.log(y),

                                              reduction_indices=[1]))#指明按照列加和 一列是一个类别

train_step = tf.train.GradientDescentOptimizer(0.5).minimize(cross_entropy)#将损失函数梯度下降 #0.5是学习率

# 初始化变量

sess = tf.InteractiveSession()#初始化Session

tf.global_variables_initializer().run()#初始化所有变量

for _ in range(1000):

    batch_xs, batch_ys = my_mnist.train.next_batch(100)#每次迭代取100行数据

    sess.run(train_step, feed_dict={x: batch_xs, y_: batch_ys})

#每次迭代内部就是求梯度，然后更新参数

# 评估

# tf.argmax()是一个从tensor中寻找最大值的序号 就是分类号，tf.argmax就是求各个预测的数字中概率最大的那一个

correct_prediction = tf.equal(tf.argmax(y, 1), tf.argmax(y_, 1))

# 用tf.cast将之前correct_prediction输出的bool值转换为float32，再求平均

accuracy = tf.reduce_mean(tf.cast(correct_prediction, tf.float32))

# 测试

print(accuracy.eval({x: my_mnist.test.images, y_: my_mnist.test.labels}))

# 总结

# 1，定义算法公式，也就是神经网络forward时的计算

# 2，定义loss，选定优化器，并指定优化器优化loss

# 3，迭代地对数据进行训练

# 4，在测试集或验证集上对准确率进行评测

代码二：保存模型

# 有时候需要把模型保持起来，有时候需要做一些checkpoint在训练中

# 以致于如果计算机宕机，我们还可以从之前checkpoint的位置去继续

# TensorFlow使得我们去保存和加载模型非常方便，仅需要去创建Saver节点在构建阶段最后

# 然后在计算阶段去调用save()方法

from tensorflow.examples.tutorials.mnist import input_data

import tensorflow as tf

# mn.SOURCE_URL = "http://yann.lecun.com/exdb/mnist/"

my_mnist = input_data.read_data_sets("MNIST_data_bak/", one_hot=True)

# The MNIST data is split into three parts:

# 55,000 data points of training data (mnist.train)

# 10,000 points of test data (mnist.test), and

# 5,000 points of validation data (mnist.validation).

# Each image is 28 pixels by 28 pixels

# 输入的是一堆图片，None表示不限输入条数，784表示每张图片都是一个784个像素值的一维向量

# 所以输入的矩阵是None乘以784二维矩阵

x = tf.placeholder(dtype=tf.float32, shape=(None, 784))

# 初始化都是0，二维矩阵784乘以10个W值

W = tf.Variable(tf.zeros([784, 10]))

b = tf.Variable(tf.zeros([10]))

y = tf.nn.softmax(tf.matmul(x, W) + b)

# 训练

# labels是每张图片都对应一个one-hot的10个值的向量

y_ = tf.placeholder(dtype=tf.float32, shape=(None, 10))

# 定义损失函数，交叉熵损失函数

# 对于多分类问题，通常使用交叉熵损失函数

# reduction_indices等价于axis，指明按照每行加，还是按照每列加

cross_entropy = tf.reduce_mean(-tf.reduce_sum(y_ * tf.log(y),

                                              reduction_indices=[1]))

train_step = tf.train.GradientDescentOptimizer(0.5).minimize(cross_entropy)

# 初始化变量

init = tf.global_variables_initializer()

# 创建Saver()节点

saver = tf.train.Saver()#在运算之前，初始化之后

n_epoch = 1000

with tf.Session() as sess:

    sess.run(init)

    for epoch in range(n_epoch):

        if epoch % 100 == 0:

            save_path = saver.save(sess, "./my_model.ckpt")#每跑100次save一次模型，可以保证容错性

            #直接保存session即可。

        batch_xs, batch_ys = my_mnist.train.next_batch(100)#每一批次跑的数据 用m行数据/迭代次数来计算出来。

        sess.run(train_step, feed_dict={x: batch_xs, y_: batch_ys})

    best_theta = W.eval()

    save_path = saver.save(sess, "./my_model_final.ckpt")#保存最后的模型，session实际上保存的上面所有的数据

代码三：恢复模型

from tensorflow.examples.tutorials.mnist import input_data

import tensorflow as tf

# mn.SOURCE_URL = "http://yann.lecun.com/exdb/mnist/"

my_mnist = input_data.read_data_sets("MNIST_data_bak/", one_hot=True)

# The MNIST data is split into three parts:

# 55,000 data points of training data (mnist.train)

# 10,000 points of test data (mnist.test), and

# 5,000 points of validation data (mnist.validation).

# Each image is 28 pixels by 28 pixels

# 输入的是一堆图片，None表示不限输入条数，784表示每张图片都是一个784个像素值的一维向量

# 所以输入的矩阵是None乘以784二维矩阵

x = tf.placeholder(dtype=tf.float32, shape=(None, 784))

# 初始化都是0，二维矩阵784乘以10个W值

W = tf.Variable(tf.zeros([784, 10]))

b = tf.Variable(tf.zeros([10]))

y = tf.nn.softmax(tf.matmul(x, W) + b)

# labels是每张图片都对应一个one-hot的10个值的向量

y_ = tf.placeholder(dtype=tf.float32, shape=(None, 10))

saver = tf.train.Saver()

with tf.Session() as sess:

    saver.restore(sess, "./my_model_final.ckpt")#把路径下面所有的session的数据加载进来 y y_head还有模型都保存下来了。

    # 评估

    # tf.argmax()是一个从tensor中寻找最大值的序号，tf.argmax就是求各个预测的数字中概率最大的那一个

    correct_prediction = tf.equal(tf.argmax(y, 1), tf.argmax(y_, 1))

    # 用tf.cast将之前correct_prediction输出的bool值转换为float32，再求平均

    accuracy = tf.reduce_mean(tf.cast(correct_prediction, tf.float32))

    # 测试

    print(accuracy.eval({x: my_mnist.test.images, y_: my_mnist.test.labels}))

【TensorFlow篇】--Tensorflow框架实现SoftMax模型识别手写数字集的更多相关文章

李宏毅 Keras手写数字集识别（优化篇）
在之前的一章中我们讲到的keras手写数字集的识别中,所使用的loss function为‘mse’,即均方差.那我们如何才能知道所得出的结果是不是overfitting?我们通过运行结果中的trai ...
如何用卷积神经网络CNN识别手写数字集？
前几天用CNN识别手写数字集,后来看到kaggle上有一个比赛是识别手写数字集的,已经进行了一年多了,目前有1179个有效提交,最高的是100%,我做了一下,用keras做的,一开始用最简单的MLP, ...
Python实现神经网络算法识别手写数字集
最近忙里偷闲学习了一点机器学习的知识,看到神经网络算法时我和阿Kun便想到要将它用Python代码实现.我们用了两种不同的方法来编写它.这里只放出我的代码. MNIST数据集基于美国国家标准与技术研究 ...
Pytorch卷积神经网络识别手写数字集
卷积神经网络目前被广泛地用在图片识别上, 已经有层出不穷的应用, 如果你对卷积神经网络充满好奇心,这里为你带来pytorch实现cnn一些入门的教程代码 #首先导入包 import torchfrom ...
keras和tensorflow搭建DNN、CNN、RNN手写数字识别
MNIST手写数字集 MNIST是一个由美国由美国邮政系统开发的手写数字识别数据集.手写内容是0~9,一共有60000个图片样本,我们可以到MNIST官网免费下载,总共4个.gz后缀的压缩文件,该文件 ...
tensorflow笔记（四）之MNIST手写识别系列一
tensorflow笔记(四)之MNIST手写识别系列一版权声明:本文为博主原创文章,转载请指明转载地址 http://www.cnblogs.com/fydeblog/p/7436310.html ...
tensorflow笔记（五）之MNIST手写识别系列二
tensorflow笔记(五)之MNIST手写识别系列二版权声明:本文为博主原创文章,转载请指明转载地址 http://www.cnblogs.com/fydeblog/p/7455233.html ...
[机器学习] keras：MNIST手写数字体识别（DeepLearning 的 HelloWord程序）
深度学习界的Hello Word程序:MNIST手写数字体识别 learn from(仍然是李宏毅老师<机器学习>课程):http://speech.ee.ntu.edu.tw/~tlka ...
TensorFlow下利用MNIST训练模型识别手写数字
本文将参考TensorFlow中文社区官方文档使用mnist数据集训练一个多层卷积神经网络(LeNet5网络),并利用所训练的模型识别自己手写数字. 训练MNIST数据集,并保存训练模型 # Pyth ...

随机推荐

Link-Cut Tree指针模板
模板: 以下为弹飞绵羊代码: #define Troy #include "bits/stdc++.h" using namespace std; ; inline int rea ...
【codeforces 718E】E. Matvey's Birthday
题目大意&链接: http://codeforces.com/problemset/problem/718/E 给一个长为n(n<=100 000)的只包含‘a’~‘h’8个字符的字符串 ...
BZOJ_3613_[Heoi2014]南园满地堆轻絮_二分答案
BZOJ_3613_[Heoi2014]南园满地堆轻絮_二分答案 Description 小 Z 是 ZRP(Zombies’ Republic of Poetry,僵尸诗歌共和国)的一名诗歌爱好者, ...
BZOJ_1717_[Usaco2006 Dec]Milk Patterns 产奶的模式_后缀数组
BZOJ_1717_[Usaco2006 Dec]Milk Patterns 产奶的模式_后缀数组 Description 农夫John发现他的奶牛产奶的质量一直在变动.经过细致的调查,他发现:虽然他 ...
BZOJ_4530_[Bjoi2014]大融合_LCT
BZOJ_4530_[Bjoi2014]大融合_LCT Description 小强要在N个孤立的星球上建立起一套通信系统.这套通信系统就是连接N个点的一个树. 这个树的边是一条一条添加上去的.在某个 ...
在线数据库表(sql语句)生成java实体类工具
相信每个做java开发的读者,都接触过SQL建表语句,尤其是在项目开发初期,因为数据库是项目的基石. 在现代项目开发中,出现了许多ORM框架,通过简单的实体映射,即可实现与数据库的交互,然而我们最初设 ...
Entity Framework Core 关联删除
关联删除通常是一个数据库术语,用于描述在删除行时允许自动触发删除关联行的特征:即当主表的数据行被删除时,自动将关联表中依赖的数据行进行删除,或者将外键更新为NULL或默认值. 数据库关联删除行为我们 ...
Spark学习之Spark Streaming
一.简介许多应用需要即时处理收到的数据,例如用来实时追踪页面访问统计的应用.训练机器学习模型的应用,还有自动检测异常的应用.Spark Streaming 是 Spark 为这些应用而设计的模型.它 ...
从壹开始微服务 [ DDD ] 之九 ║从军事故事中，明白领域命令验证（上）
烽烟哈喽大家周二好呀,咱们又见面了,上周末掐指一算,距离圣诞节只有 5 周的时间了(如果你还不知道为啥我要提圣诞节这个时间点,可以看看我的第二系列开篇<之一 ║ D3模式设计初探与我的 ...
Android根据word模板文档将表单数据生成word文档的方案整理
版权声明:本文为HaiyuKing原创文章,转载请注明出处! 前言尝试的方案包括以下几种: freemarker 只能在java项目上运行,无法在Android项目上运行: 参考资料:<Fre ...

【TensorFlow篇】--Tensorflow框架实现SoftMax模型识别手写数字集

【TensorFlow篇】--Tensorflow框架实现SoftMax模型识别手写数字集的更多相关文章

随机推荐

热门专题