4 TensorFlow入门之dropout解决overfitting问题

————————————————————————————————————

写在开头：此文参照莫烦python教程（墙裂推荐！！！）

————————————————————————————————————

dropout解决overfitting问题

overfitting：当机器学习学习得太好了，就会出现过拟合（overfitting)问题。所以，我们就要采取一些措施来避免过拟合的问题。此实验就来看一下dropout对于解决过拟合问题的效果。
例子实验内容：识别手写数字。此实验的步骤和上一篇的识别手写数字步骤很相似。
例子实验的数据集：sklearn中的datasets
主要运用的函数tf.nn.dropout()
主要参数keep_prob。keep_prob表示留下来的结果的百分比，比如你要drop0.4，那么keep_prob就为0.6

import tensorflow as tf

from sklearn.datasets import load_digits

from sklearn.cross_validation import train_test_split

from sklearn.preprocessing import LabelBinarizer

#加载数据

digits = load_digits()

X = digits.data

y = digits.target

y = LabelBinarizer().fit_transform(y)  #把数字变成1x10的向量

X_train,X_test,y_train,y_test = train_test_split(X,y,test_size = .3)  #把数据分成train数据和test数据

#定义添加层

def add_layer(inputs,in_size,out_size,activation_function=None):

    #定义添加层内容，返回这层的outputs

    Weights = tf.Variable(tf.random_normal([in_size,out_size]))#Weigehts是一个in_size行、out_size列的矩阵，开始时用随机数填满

    biases = tf.Variable(tf.zeros([1,out_size])+0.1) #biases是一个1行out_size列的矩阵，用0.1填满

    Wx_plus_b = tf.matmul(inputs,Weights)+biases  #预测

    #实现dropout，keep_drop为丢弃后剩下的百分比

    Wx_plus_b = tf.nn.dropout(Wx_plus_b, keep_prob)

    if activation_function is None:  #如果没有激励函数，那么outputs就是预测值

        outputs = Wx_plus_b

    else:  #如果有激励函数，那么outputs就是激励函数作用于预测值之后的值

        outputs = activation_function(Wx_plus_b)

    return outputs

#定义计算正确率的函数

def t_accuracy(t_xs,t_ys):

    global prediction

    y_pre = sess.run(prediction,feed_dict={xs:t_xs,keep_prob:1})#测试结果不dropout

    correct_pre = tf.equal(tf.argmax(y_pre,1),tf.argmax(t_ys,1))

    accuracy = tf.reduce_mean(tf.cast(correct_pre,tf.float32))

    result = sess.run(accuracy,feed_dict={xs:t_xs,ys:t_ys,keep_prob:1})

    return result

#定义输入输出值，和keep_drop值

keep_prob = tf.placeholder(tf.float32)

xs = tf.placeholder(tf.float32, [None, 64])  # 8x8

ys = tf.placeholder(tf.float32, [None, 10])

#添加层

l1 = add_layer(xs, 64, 50,activation_function=tf.nn.tanh)

prediction = add_layer(l1, 50, 10,activation_function=tf.nn.softmax)

#误差

cross_entropy = tf.reduce_mean(-tf.reduce_sum(ys * tf.log(prediction),reduction_indices=[1]))  # loss

#训练

train_step = tf.train.GradientDescentOptimizer(0.5).minimize(cross_entropy)

#开始训练

sess = tf.Session()

merged = tf.summary.merge_all()

init = tf.global_variables_initializer()

sess.run(init)

for i in range(1000):

    # 设置keep_drop为1，即不进行dropout

    sess.run(train_step, feed_dict={xs: X_train, ys: y_train, keep_prob: 1})

    if i % 50 == 0:

        # 输出正确率

        print (t_accuracy(X_test,y_test))

for i in range(1000):

    # 设置keep_drop为0.5

    sess.run(train_step, feed_dict={xs: X_train, ys: y_train, keep_prob: 0.5})

    if i % 50 == 0:

        # 输出正确率

        print (t_accuracy(X_test,y_test))

由上面的结果可知，当dropout为0.5时，效果明显比一点儿也不丢弃的好！

*点击[这儿：TensorFlow]发现更多关于TensorFlow的文章*

4 TensorFlow入门之dropout解决overfitting问题的更多相关文章

tensorflow学习之（八）使用dropout解决overfitting（过拟合）问题
#使用dropout解决overfitting(过拟合)问题 #如果有dropout,在feed_dict的参数中一定要加入dropout的值 import tensorflow as tf from ...
TensorFlow实战第七课（dropout解决overfitting）
Dropout 解决 overfitting overfitting也被称为过度学习,过度拟合.他是机器学习中常见的问题. 图中的黑色曲线是正常模型,绿色曲线就是overfitting模型.尽管绿色曲 ...
tensorflow用dropout解决over fitting-【老鱼学tensorflow】
在机器学习中可能会存在过拟合的问题,表现为在训练集上表现很好,但在测试集中表现不如训练集中的那么好. 图中黑色曲线是正常模型,绿色曲线就是overfitting模型.尽管绿色曲线很精确的区分了所有的训 ...
tensorflow用dropout解决over fitting
在机器学习中可能会存在过拟合的问题,表现为在训练集上表现很好,但在测试集中表现不如训练集中的那么好. 图中黑色曲线是正常模型,绿色曲线就是overfitting模型.尽管绿色曲线很精确的区分了所有的训 ...
#tensorflow入门(1)
tensorflow入门(1) 关于 TensorFlow TensorFlow™ 是一个采用数据流图(data flow graphs),用于数值计算的开源软件库.节点(Nodes)在图中表示数学操 ...
TensorFlow入门（五）多层 LSTM 通俗易懂版
欢迎转载,但请务必注明原文出处及作者信息. @author: huangyongye @creat_date: 2017-03-09 前言: 根据我本人学习 TensorFlow 实现 LSTM 的经 ...
转：TensorFlow入门（六）双端 LSTM 实现序列标注（分词）
http://blog.csdn.net/Jerr__y/article/details/70471066 欢迎转载,但请务必注明原文出处及作者信息. @author: huangyongye @cr ...
TensorFlow 入门之手写识别CNN 三
TensorFlow 入门之手写识别CNN 三 MNIST 卷积神经网络 Fly 多层卷积网络多层卷积网络的基本理论构建一个多层卷积网络权值初始化卷积和池化第一层卷积第二层卷积密集层连接 ...
（转）TensorFlow 入门
TensorFlow 入门本文转自:http://www.jianshu.com/p/6766fbcd43b9 字数3303 阅读904 评论3 喜欢5 CS224d-Day 2: 在 Da ...

随机推荐

[转载] 关于mkvtoolnix批量处理的
需要的工具:mkvtoolnix.记事本案例介绍:用文件A的视频+文件B的音频+字幕合成新MKV,在文件列表中,按A.B.C顺序排列.其中A与B都是Mkv格式,所以A与B不能放在同一个文件夹中(就算 ...
C# 时间格式 yyyy/mm/dd
今天遇到个问题在C#中将日期格式设置为yyyy/MM/dd,我是这样写的: DateTime.Now.ToString("yyyy/MM/dd"); 可是获取到的日期还是显示yyy ...
C#和Java的类、继承、重写与多态
面向对象的三大特性是封装.继承.多态,C#和Java都是面向对象的语言所以他们的类.继承.重写与多态有很多共同点,但是实现上也存在一定的区别.其中Java中其实没有虚函数的概念,也可以认为Java的函 ...
C# Dictionary学习
http://www.cnblogs.com/gdjlc/archive/2010/01/22/2086922.html http://wenku.baidu.com/link?url=TOgeedl ...
【BZOJ】1656：[Usaco2006 Jan]The Grove 树木（bfs+特殊的技巧）
http://www.lydsy.com/JudgeOnline/problem.php?id=1656 神bfs! 我们知道,我们要绕这个联通的树林一圈. 那么,我们想,怎么才能让我们的bfs绕一个 ...
【BZOJ】3668: [Noi2014]起床困难综合症（暴力）
http://www.lydsy.com/JudgeOnline/problem.php?id=3668 这题很简单.............. 枚举每一位然后累计即可.. QAQ,第一次以为能1A, ...
将Centos的yum源更换为国内的阿里云(163)源
阿里云是最近新出的一个镜像源.得益于阿里云的高速发展,这么大的需求,肯定会推出自己的镜像源.阿里云Linux安装镜像源地址:http://mirrors.aliyun.com/ CentOS系统更换软 ...
Docker for window 无法共享磁盘
Docker for window 无法共享主机磁盘,环境如下: 操作系统: windown10 Docker version 18.09.0, build 4d60db4 症状如下: 如图,点击ap ...
Cocos2d-x 3.3Bate0 ExpandedListView
之前写的ExpandedListView版本号因为版本号升级这里提供Cocos2d-x 3.3Bate0 版本号代码下载:http://download.csdn.net/detail/qqmcy/ ...
Software Defined Networking For Dummies, Cisco Special Edition
从接触SDN开始,不论是硬件还是软件,一直都是从具体的点开始,慢慢的勾勒出自己认为的SDN的样子,相信读完这本思科出的关于SDN的书会对其有新的认识这本书的名字就是Software Defined ...

4 TensorFlow入门之dropout解决overfitting问题

dropout解决overfitting问题

4 TensorFlow入门之dropout解决overfitting问题的更多相关文章

随机推荐

热门专题