Tensorflow-逻辑斯蒂回归

1.交叉熵

逻辑斯蒂回归这个模型采用的是交叉熵，通俗点理解交叉熵

推荐一篇文章讲的很清楚：

https://www.zhihu.com/question/41252833

因此，交叉熵越低，这个策略就越好，最低的交叉熵也就是使用了真实分布所计算出来的信息熵，因为此时，交叉熵 = 信息熵。这也是为什么在机器学习中的分类算法中，我们总是最小化交叉熵，因为交叉熵越低，就证明由算法所产生的策略最接近最优策略，也间接证明我们算法所算出的非真实分布越接近真实分布

2.代码解释

 import warnings

 warnings.filterwarnings('ignore')

 import numpy as np

 import tensorflow as tf

 # 样本集

 from tensorflow.examples.tutorials.mnist import input_data

 # 加载数据，目标值变成概率的形式，ont-hot

 mnist = input_data.read_data_sets('./',one_hot=True)

 # 训练数据 (55000, 784)

 mnist.train.images.shape

 # 测试数据 (10000, 784)

 mnist.test.images.shape

 # 目标值 ont-hot形式

 mnist.train.labels[:10]

 # 构建方程

 X = tf.placeholder(dtype=tf.float64,shape = (None,784),name = 'data')

 y = tf.placeholder(dtype=tf.float64,shape = (None,10),name = 'target')

 W = tf.Variable(initial_value=tf.zeros(shape =(784,10),dtype = tf.float64))

 b = tf.Variable(initial_value=tf.zeros(shape = (10),dtype = tf.float64))

 y_pred = tf.matmul(X,W) + b

 # 构建损失函数

 # y 和 y_pred对比

 # y表示是概率 [0., 0., 0., 0., 0., 0., 0., 1., 0., 0.]

 # y_pred,矩阵运算求解的目标值

 # 要将y_pred转化成概率，softmax

 y_ = tf.nn.softmax(y_pred)

 # 此时y和y_表示概率

 # y和y_越接近，说明预测函数越准确

 # 此时分类问题，交叉熵，表示损失函数

 # 熵：表示的系统混乱程度

 # 损失函数，越小越好

 # 平均交叉熵------->可以比较大小的数

 loss = tf.reduce_mean(tf.reduce_sum(tf.multiply(y,tf.log(1/y_)),axis = -1))

 # 最优化

 opt = tf.train.GradientDescentOptimizer(0.01).minimize(loss)

 # 训练

 # 训练次数

 epoches = 100

 # 保存

 saver = tf.train.Saver()

 with tf.Session() as sess:

     sess.run(tf.global_variables_initializer())

     for i in range(epoches):

         c = 0

         for j in range(100):

 #      一次取550个，分100次取完数据 next_batch方法

             X_train,y_train = mnist.train.next_batch(550)

             opt_,cost = sess.run([opt,loss],feed_dict = {X:X_train,y:y_train})

             c += cost/100

 #         计算准确率

         X_test,y_test = mnist.test.next_batch(2000)

         y_predict = sess.run(y_,feed_dict={X:X_test})

         y_test = np.argmax(y_test,axis = -1)

         y_predict = np.argmax(y_predict,axis = 1)

         accuracy = (y_test == y_predict).mean()

         print('执行次数：%d。损失函数是：%0.4f。准确率是：%0.4f'%(i+1,c,accuracy))

         if accuracy > 0.91:

             saver.save(sess,'./model/estimator',global_step=i)

             print('---------------------------模型保存成功----------------------------')

保存了模型，在上一次的基础上继续进行学习，这样的话可以直接从上次的准确率开始

 # 其实代码是一样的，只是加了个saver.restore还原

 with tf.Session() as sess:

 #     还原到sess会话中

     saver.restore(sess,'./model/estimator-99')

     for i in range(100,200):

         c = 0

         for j in range(100):

             X_train,y_train = mnist.train.next_batch(550)

             opt_,cost = sess.run([opt,loss],feed_dict = {X:X_train,y:y_train})

             c += cost/100

 #         计算准确率

         X_test,y_test = mnist.test.next_batch(2000)

         y_predict = sess.run(y_,feed_dict={X:X_test})

         y_test = np.argmax(y_test,axis = -1)

         y_predict = np.argmax(y_predict,axis = 1)

         accuracy = (y_test == y_predict).mean()

         print('执行次数：%d。损失函数是：%0.4f。准确率是：%0.4f'%(i+1,c,accuracy))

         if accuracy > 0.91:

             saver.save(sess,'./model/estimator',global_step=i)

             print('---------------------------模型保存成功----------------------------')

Tensorflow-逻辑斯蒂回归的更多相关文章

[置顶] 局部加权回归、最小二乘的概率解释、逻辑斯蒂回归、感知器算法——斯坦福ML公开课笔记3
转载请注明:http://blog.csdn.net/xinzhangyanxiang/article/details/9113681 最近在看Ng的机器学习公开课,Ng的讲法循循善诱,感觉提高了不少 ...
【分类器】感知机+线性回归+逻辑斯蒂回归+softmax回归
一.感知机详细参考:https://blog.csdn.net/wodeai1235/article/details/54755735 1.模型和图像: 2.数学定义推导和优化: 3.流程 ...
【转】机器学习笔记之（3）——Logistic回归（逻辑斯蒂回归）
原文链接:https://blog.csdn.net/gwplovekimi/article/details/80288964 本博文为逻辑斯特回归的学习笔记.由于仅仅是学习笔记,水平有限,还望广大读 ...
机器学习之LinearRegression与Logistic Regression逻辑斯蒂回归(三)
一评价尺度 sklearn包含四种评价尺度 1 均方差(mean-squared-error) 2 平均绝对值误差(mean_absolute_error) 3 可释方差得分(explained_v ...
spark机器学习从0到1逻辑斯蒂回归之(四）
逻辑斯蒂回归一.概念逻辑斯蒂回归(logistic regression)是统计学习中的经典分类方法,属于对数线性模型.logistic回归的因变量可以是二分类的,也可以是多分类的.logis ...
python机器学习实现逻辑斯蒂回归
逻辑斯蒂回归关注公众号"轻松学编程"了解更多. [关键词]Logistics函数,最大似然估计,梯度下降法 1.Logistics回归的原理利用Logistics回归进行分类的 ...
【项目实战】pytorch实现逻辑斯蒂回归
视频指导:https://www.bilibili.com/video/BV1Y7411d7Ys?p=6 一些数据集在pytorch框架下,里面面有配套的数据集,pytorch里面有一个torchv ...
【TensorFlow入门完全指南】模型篇·逻辑斯蒂回归模型
import库,加载mnist数据集. 设置学习率,迭代次数,batch并行计算数量,以及log显示. 这里设置了占位符,输入是batch * 784的矩阵,由于是并行计算,所以None实际上代表并行 ...
逻辑斯蒂回归（Logistic Regression）
逻辑回归名字比较古怪,看上去是回归,却是一个简单的二分类模型. 逻辑回归的模型是如下形式: 其中x是features,θ是feature的权重,σ是sigmoid函数.将θ0视为θ0*x0(x0取值为 ...
逻辑斯蒂回归VS决策树VS随机森林
LR 与SVM 不同 1.logistic regression适合需要得到一个分类概率的场景,SVM则没有分类概率 2.LR其实同样可以使用kernel,但是LR没有support vector在计 ...

随机推荐

Pytest权威教程05-Pytest fixtures：清晰模块化易扩展
目录 Pytest fixtures:清晰模块化易扩展 Fixtures作为函数参数使用 Fixtures: 依赖注入的主要例子 conftest.py: 共享fixture函数共享测试数据生 ...
IIS7 伪静态 web.config 配置方法【详解】
IIS7 做伪静态比较的简单方便 1.程序方面只需要设置web.config 就可以了. 2.服务器需要安装:URL Rewrite 下载地址:http://www.iis.net/download ...
和小哥哥一起刷洛谷(7) 图论之dijkistra算法
关于dijkstra 维基百科戴克斯特拉算法(英语:Dijkstra's algorithm,又译迪杰斯特拉算法)由荷兰计算机科学家艾兹赫尔·戴克斯特拉在1956年提出.戴克斯特拉算法使用了广度优先 ...
【转】JVM类装载机制的解析，热更新的探讨（二）
同样,一个Class对象必须知道自己的超类.超级接口.因此,Class对象会引用自己的超类和超级接口的Class对象.这种引用一定是实例引用.(实际上,超类.超级接口的引用也存储在常量池中,但为了区分 ...
深度学习面试题03：改进版梯度下降法Adagrad、RMSprop、Momentum、Adam
目录 Adagrad法 RMSprop法 Momentum法 Adam法参考资料发展历史标准梯度下降法的缺陷如果学习率选的不恰当会出现以上情况因此有一些自动调学习率的方法.一般来说,随着迭代 ...
name_scope与variable_scope 详解
版权声明:本文为博主原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明. 本文链接:https://blog.csdn.net/lucky7213/article/deta ...
巧用 CSS 实现酷炫的充电动画
循序渐进,看看只使用 CSS ,可以鼓捣出什么样的充电动画效果. 画个电池当然,电池充电,首先得用 CSS 画一个电池,这个不难,随便整一个: 欧了,勉强就是它了.有了电池,那接下来直接充电吧.最最 ...
【转】IDEA 中配置文件properties文件中文乱码解决
1.首先我们的IDEA文件编码一般都修改为utf-8(setting-->file encodings--->Global Encoding 和 Project Encoding 都设置为 ...
SWLU：主核性能采样、调试工具包
http://bbs.nsccwx.cn/topic/262/swlu-主核性能采样-调试工具包
Ubuntu 1604 安装配置 kafka，并配置开机自启（systemctl）
安装 kafka 需要先安装 jdk.一.下载官网:http://kafka.apache.org/downloads.html 二.安装安装参考:https://segmentfault.com/ ...

Tensorflow-逻辑斯蒂回归

Tensorflow-逻辑斯蒂回归的更多相关文章

随机推荐

热门专题