TensorFlow 入门之手写识别(MNIST) softmax算法
TensorFlow 入门之手写识别(MNIST) softmax算法
softmax回归算法
我们知道MNIST的每一张图片都表示一个数字,从0到9。我们希望得到给定图片代表每个数字的概率。比如说,我们的模型可能推测一张包含9的图片代表数字9的概率是80%但是判断它是8的概率是5%(因为8和9都有上半部分的小圆),然后给予它代表其他数字的概率更小的值。
这是一个使用softmax回归(softmax regression)模型的经典案例。 softmax 模型可以用来给不同的对象分配概率。即使在之后,我们训练更加精细的模型时,最后一步也需要用softmax来分配概率。
这是一个使用softmax回归(softmax regression)模型的经典案例。softmax模型可以用来给不同的对象分配概率。即使在之后,我们训练更加精细的模型时,最后一步也需要用softmax来分配概率。
softmax回归(softmax regression)分两步:第一步
为了得到一张给定图片属于某个特定数字类的证据(evidence),我们对图片像素值进行加权求和。如果这个像素具有很强的证据说明这张图片不属于该类,那么相应的权值为负数,相反如果这个像素拥有有利的证据支持这张图片属于这个类,那么权值是正数。
下面的图片显示了一个模型学习到的图片上每个像素对于特定数字类的权值。红色代表负数权值,蓝色代表正数权值。
数字的特征
我们也需要加入一个额外的偏置量(bias),因为输入往往会带有一些无关的干扰量。因此对于给定的输入图片x它代表的是数字i的证据可以表示为
求和
其中Wi代表权重,bi 代表数字 i 类的偏置量,j 代表给定图片 x 的像素索引用于像素求和。然后用softmax函数可以把这些证据转换成概率 y:
激励函数
这的softmax可是看做是一个sigmoid形式的函数。把我们定义的线性函数的输出转换成我们想要的格式,也就是关于10个数字类的概率分布。因此,给定一张图片,它对于每一个数字的吻合度可以被softmax函数转换成为一个概率值。
归一化处理
展开等式右边的子式,可以得到:
softmax使用的公式
对于softmax回归模型可以用下面的图解释,对于输入的xs加权求和,再分别加上一个偏置量,最后再输入到softmax函数中:
softmax运行方式
如果把它写成一个等式,我们可以得到:
softmax数学表达式
我们也可以用向量表示这个计算过程:用矩阵乘法和向量相加。这有助于提高计算效率。(也是一种更有效的思考方式):
softmax矩阵表现形式
更进一步,可以写成更加紧凑的方式:
最终会使用的表达式
TensorFlow实现softmax
- # create a softmax regression 
 - import tensorflow as tf 
 - from tensorflow.examples.tutorials.mnist import input_data 
 - mnist = input_data.read_data_sets("/home/fly/TensorFlow/mnist", one_hot=True) 
 - x = tf.placeholder(tf.float32,[None, 784]) 
 - W = tf.Variable(tf.zeros([784, 10])) 
 - b = tf.Variable(tf.zeros([10])) 
 - y = tf.nn.softmax(tf.matmul(x,W)+b) 
 - y_ = tf.placeholder(tf.float32,[None, 10]) 
 - cross_entropy = tf.reduce_mean(-tf.reduce_sum(y_ * tf.log(y), reduction_indices=[1])) 
 - train_step = tf.train.GradientDescentOptimizer(0.5).minimize(cross_entropy) 
 - init = tf.initialize_all_variables() 
 - sess = tf.Session() 
 - sess.run(init) 
 - for i in range(1000): 
 - batch_xs, batch_ys = mnist.train.next_batch(100) 
 - sess.run(train_step, feed_dict = {x: batch_xs, y_: batch_ys}) 
 - correct_prediction = tf.equal(tf.argmax(y,1),tf.argmax(y_,1)) 
 - accuracy = tf.reduce_mean(tf.cast(correct_prediction, tf.float32)) 
 - print(sess.run(accuracy, feed_dict={x:mnist.test.images, y_: mnist.test.labels})) 
 
Fly
2016.6
TensorFlow 入门之手写识别(MNIST) softmax算法的更多相关文章
- TensorFlow 入门之手写识别(MNIST) softmax算法 二
		
TensorFlow 入门之手写识别(MNIST) softmax算法 二 MNIST Fly softmax回归 softmax回归算法 TensorFlow实现softmax softmax回归算 ...
 - TensorFlow 入门之手写识别(MNIST) 数据处理 一
		
TensorFlow 入门之手写识别(MNIST) 数据处理 一 MNIST Fly softmax回归 准备数据 解压 与 重构 手写识别入门 MNIST手写数据集 图片以及标签的数据格式处理 准备 ...
 - TensorFlow 入门之手写识别CNN 三
		
TensorFlow 入门之手写识别CNN 三 MNIST 卷积神经网络 Fly 多层卷积网络 多层卷积网络的基本理论 构建一个多层卷积网络 权值初始化 卷积和池化 第一层卷积 第二层卷积 密集层连接 ...
 - densenet tensorflow 中文汉字手写识别
		
densenet 中文汉字手写识别,代码如下: import tensorflow as tf import os import random import math import tensorflo ...
 - Tensorflow之基于MNIST手写识别的入门介绍
		
Tensorflow是当下AI热潮下,最为受欢迎的开源框架.无论是从Github上的fork数量还是star数量,还是从支持的语音,开发资料,社区活跃度等多方面,他当之为superstar. 在前面介 ...
 - TensorFlow  MNIST(手写识别 softmax)实例运行
		
TensorFlow MNIST(手写识别 softmax)实例运行 首先要有编译环境,并且已经正确的编译安装,关于环境配置参考:http://www.cnblogs.com/dyufei/p/802 ...
 - 使用tensorflow实现mnist手写识别(单层神经网络实现)
		
import tensorflow as tf import tensorflow.examples.tutorials.mnist.input_data as input_data import n ...
 - tensorflow笔记(四)之MNIST手写识别系列一
		
tensorflow笔记(四)之MNIST手写识别系列一 版权声明:本文为博主原创文章,转载请指明转载地址 http://www.cnblogs.com/fydeblog/p/7436310.html ...
 - tensorflow笔记(五)之MNIST手写识别系列二
		
tensorflow笔记(五)之MNIST手写识别系列二 版权声明:本文为博主原创文章,转载请指明转载地址 http://www.cnblogs.com/fydeblog/p/7455233.html ...
 
随机推荐
- css3实现色子自动翻转效果
			
原文:css3实现色子自动翻转效果 css3使我们能够跳出2d空间,实现3维空间的动画效果,这里给出一个自动翻转的3d色子动画效果制作过程. 第一步,首先进行HTML的布局,对于3D效果,布局有一定的 ...
 - php中utf8 与utf-8
			
原文:php中utf8 与utf-8 相信很多程序员刚开始也会有这样的疑惑,如题,我也是. 其实,他们可以这样来区分. 一.在php和html中设置编码,请尽量统一写成“UTF-8”,这才 ...
 - ExtJS4 便捷三层开发模式
			
ExtJS4 便捷三层开发模式 定义类已经不是ext4.x一个新特性,但与ext3.x的自定义类有语法上的区别.将相关模块封装成类可以有效的减少浏览器的压力,提高渲染速度,同时抽象每一个可重用方法,减 ...
 - ActiveReports 9实战教程(1): 手把手搭建环境Visual Studio 2013 社区版
			
原文:ActiveReports 9实战教程(1): 手把手搭建环境Visual Studio 2013 社区版 ActiveReports 9刚刚发布3天,微软就发布了 Visual Studio ...
 - WEB安全实战(五)XSS 攻击的第二种解决方式(推荐)
			
序 说到 XSS 攻击,前边已经有两篇文章在讲这个事了,这次又拿出来说,主要是针对近期工作中的一些新的问题.那么之前是怎么解决问题的呢?为什么又要换解决方式?以下就具体的跟大家分享一下. 旧方案 公司 ...
 - 从实例谈OOP、工厂模式和重构
			
有了翅膀才能飞, 欠缺灵活的代码就象冻坏了翅膀的鸟儿.不能飞翔,就少了几许灵动的气韵.我们需要给代码带去温暖的阳光, 让僵冷的翅膀重新飞起来. 结合实例, 通过应用OOP.设计模式和重构,你会看到代码 ...
 - asp.net如何实现word文档在线预览
			
原文:asp.net如何实现word文档在线预览 实现方式:office文档转html,再在浏览器里面在线浏览 1.首先引入com组件中office库,然后在程序集扩展中引入word的dll 2.将M ...
 - SQL面试题1
			
SQL面试题 Sql常用语法 下列语句部分是Mssql语句,不可以在access中使用. SQL分类: DDL—数据定义语言(CREATE,ALTER,DROP,DECLARE) DML—数据操纵语言 ...
 - PHP中将内容循环出来
			
首先连接数据库: $myDate= @mysql_connect("localhost","root","") or die("数 ...
 - ADFS 2.0 配置简介 PartⅡ – 配置 ADFS 信任关系
			
ADFS 与应用程序间的各种验证是基于信任关系的,在 ADFS 服务器配置好要信赖的应用程序(以 URL 为标识)后,应用程序再通过指定认证服务器来将用户引导至 ADFS 登录页,登录完成后再将用户的 ...