drop解决过拟合的情况

用到的训练数据集：sklearn数据集

可视化工具：tensorboard，这儿记录了loss值（预测值与真实值的差值），通过loss值可以判断训练的结果与真实数据是否吻合

过拟合：训练过程中为了追求完美而导致问题

过拟合的情况：蓝线为实际情况，在误差为10的区间，他能够表示每条数据。

　　　　　　　橙线为训练情况，为了追求0误差，他将每条数据都关联起来，但是如果新增一些点（+），他就不能去表示新增的点了

训练得到的值和实际测试得到的值相比，训练得到的loss更小，但它与实际不合，并不是loss值越小就越好

drop处理过拟合后:

代码：

import tensorflow as tf

from sklearn.datasets import load_digits

from sklearn.cross_validation import train_test_split

from sklearn.preprocessing import LabelBinarizer

# load data

digits = load_digits()

X = digits.data

y = digits.target

y = LabelBinarizer().fit_transform(y)   # 转换格式

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=.3)

def add_layer(inputs, in_size, out_size, layer_name, active_function=None):

    """

    :param inputs:

    :param in_size: 行

    :param out_size: 列 ， [行， 列] =矩阵

    :param active_function:

    :return:

    """

    with tf.name_scope('layer'):

        with tf.name_scope('weights'):

            W = tf.Variable(tf.random_normal([in_size, out_size]), name='W')  #

        with tf.name_scope('bias'):

            b = tf.Variable(tf.zeros([1, out_size]) + 0.1)  # b是一行数据，对应out_size列个数据

        with tf.name_scope('Wx_plus_b'):

            Wx_plus_b = tf.matmul(inputs, W) + b

        Wx_plus_b = tf.nn.dropout(Wx_plus_b, keep_prob=keep_prob)

        if active_function is None:

            outputs = Wx_plus_b

        else:

            outputs = active_function(Wx_plus_b)

        tf.summary.histogram(layer_name + '/outputs', outputs)  # 1.2.记录outputs值，数据直方图

        return outputs

# define placeholder for inputs to network

keep_prob = tf.placeholder(tf.float32)  # 不被dropout的数量

xs = tf.placeholder(tf.float32, [None, 64])  # 8*8

ys = tf.placeholder(tf.float32, [None, 10])

# add output layer

l1 = add_layer(xs, 64, 50, 'l1', active_function=tf.nn.tanh)

prediction = add_layer(l1, 50, 10, 'l2', active_function=tf.nn.softmax)

# the loss between prediction and really

cross_entropy = tf.reduce_mean(-tf.reduce_sum(ys * tf.log(prediction), reduction_indices=[1]))

tf.summary.scalar('loss', cross_entropy)  # 字符串类型的标量张量，包含一个Summaryprotobuf  1.1记录标量(展示到直方图中 1.2 )

# training

train_step = tf.train.GradientDescentOptimizer(0.5).minimize(cross_entropy)

sess = tf.Session()

merged = tf.summary.merge_all()  # 2.把所有summary节点整合在一起,只需run一次,这儿只有cross_entropy

sess.run(tf.initialize_all_variables())

train_writer = tf.summary.FileWriter('log/train', sess.graph)  # 3.写入

test_writer = tf.summary.FileWriter('log/test', sess.graph)  # cmd cd到log目录下，启动 tensorboard --logdir=log\

# start training

for i in range(500):

    sess.run(train_step, feed_dict={xs: X_train, ys: y_train, keep_prob: 0.5})  # keep_prob训练时保留50%， 当这儿为1时，代表不drop任何数据，（没处理过拟合问题）

    if i % 50 == 0:

        # 4. record loss

        train_result = sess.run(merged, feed_dict={xs: X_train, ys: y_train, keep_prob: 1})  # tensorboard记录保留100%的数据

        test_result = sess.run(merged, feed_dict={xs: X_test, ys: y_test, keep_prob: 1})

        train_writer.add_summary(train_result, i)

        test_writer.add_summary(test_result, i)

print("Record Finished !!!")

drop解决过拟合的情况的更多相关文章

过拟合是什么？如何解决过拟合？l1、l2怎么解决过拟合
1. 过拟合是什么? https://www.zhihu.com/question/264909622 那个英文回答就是说h1.h2属于同一个集合,实际情况是h2比h1错误率低,你用h1来训练, ...
tensorflow学习之路---解决过拟合
''' 思路:1.调用数据集 2.定义用来实现神经元功能的函数(包括解决过拟合) 3.定义输入和输出的数据4.定义隐藏层(函数)和输出层(函数) 5.分析误差和优化数据(改变权重)6.执行神经网络 ' ...
L1与L2正则化的对比及多角度阐述为什么正则化可以解决过拟合问题
正则化是一种回归的形式,它将系数估计(coefficient estimate)朝零的方向进行约束.调整或缩小.也就是说,正则化可以在学习过程中降低模型复杂度和不稳定程度,从而避免过拟合的危险. 一. ...
解决谷歌浏览器在F12情况下自动断点问题（Paused in debugger）
解决谷歌浏览器在F12情况下自动断点问题(Paused in debugger) 最近在使用谷歌浏览器在调试js脚本的时候,每次按F12,再刷新页面,都会跳出如上图所示的图标,自动进入断点调试.如果不 ...
把cookie以json形式返回，用js来set cookie.（解决手机浏览器未知情况下获取不到cookie）
.继上一篇随笔,链接点我,解决手机端cookie的问题. .上次用cookie+redis实现了session,并且手机浏览器可能回传cookies有问题,所以最后用js取出cookie跟在请求的ur ...
（五）用正则化(Regularization)来解决过拟合
1 过拟合过拟合就是训练模型的过程中,模型过度拟合训练数据,而不能很好的泛化到测试数据集上.出现over-fitting的原因是多方面的: 1) 训练数据过少,数据量与数据噪声是成反比的,少量数据导 ...
RabbitMQ 使用QOS（服务质量）+Ack机制解决内存崩溃的情况
当消息有几万条或者几十万条的时候,如果消费的方式不对,会造成内存崩溃的情况一:consumer 1. 短链接:basicget 独自去获取message... request 的方式去获取,断开式. ...
深度学习中 --- 解决过拟合问题（dropout, batchnormalization）
过拟合,在Tom M.Mitchell的<Machine Learning>中是如何定义的:给定一个假设空间H,一个假设h属于H,如果存在其他的假设h’属于H,使得在训练样例上h的错误率比 ...
CS229 5.用正则化(Regularization)来解决过拟合
1 过拟合过拟合就是训练模型的过程中,模型过度拟合训练数据,而不能很好的泛化到测试数据集上.出现over-fitting的原因是多方面的: 1) 训练数据过少,数据量与数据噪声是成反比的,少量数据导 ...

随机推荐

如何查看linux系统的版本信息
前言有时候需要查看linux系统的版本信息,本文将对此简单介绍. 方法 1.输入"uname -a ",可显示电脑以及操作系统的相关信息. 2.输入"cat /etc/ ...
CodeForces - 1093D：Beautiful Graph（二分图判定+方案数）
题意:给定无向图,让你给点加权(1,2,3),使得每条边是两端点点权和维奇数. 思路:一个连通块是个二分图,判定二分图可以dfs,并查集,2-sat染色. 这里用的并查集(还可以带权并查集优化一下,或 ...
IO练习--按字节截取字符串
* 在Java中字符串“abcd”和字符串“ab你好”都是4个字符, * 但是字节数不同,因为GBK中一个汉字占两个字节 * 定义一个方法用来按字节数截取字符串. * 如:对于“ab你好”,取3个字节 ...
粘包、拆包发生原因滑动窗口、MSS/MTU限制、Nagle算法
[TCP协议](3)---TCP粘包黏包 [TCP协议](3)---TCP粘包黏包有关TCP协议之前写过两篇博客: 1.[TCP协议](1)---TCP协议详解 2.[TCP协议](2)---TCP ...
（4）socket的基础使用（基于TCP协议的并发编程）
需要实现并发需要依靠socketserver 模块 socketserver模块下有几个功能 def __init__(self, request, client_address, server): ...
【idea】如何将idea的项目路径设置成代码目录和配置文件目录
一:创建相应的目录二.提升目录的等级
CH3602 Counting Swaps
题意 3602 Counting Swaps 0x30「数学知识」例题背景 https://ipsc.ksp.sk/2016/real/problems/c.html Just like yeste ...
做Global Admin
globaladmin.4budget@nokia.com 10:22 https://ultima.int.net.nokia.com/eedb/Solutions/tools/ManageUser ...
Java中的内存泄露
ballerina 学习三十扩展开发（一）
ballerina 主要是分为两大类基于ballerina 语言开发的,一般是客户端的connector 使用java语言开发的(类似的基于jvm的都可以),一般是注解以及进行构件生成 baller ...

drop解决过拟合的情况

drop解决过拟合的情况的更多相关文章

随机推荐

热门专题