深度学习中dropout策略的理解

现在有空整理一下关于深度学习中怎么加入dropout方法来防止测试过程的过拟合现象。

首先了解一下dropout的实现原理：

这些理论的解释在百度上有很多。。。。

这里重点记录一下怎么实现这一技术

参考别人的博客，主要http://www.cnblogs.com/dupuleng/articles/4340293.html

讲解一下用Matlab中的深度学习工具箱怎么实现dropout

首先要载入工具包。DeepLearn Toolbox是一个非常有用的matlab deep learning工具包，下载地址：https://github.com/rasmusbergpalm/DeepLearnToolbox

要使用它首先要将该工具包添加到matlab的搜索路径中，

1、将包复制到matlab 的toolbox中，作者的路径是D:\program Files\matlab\toolbox\

2、在matlab的命令行中输入：　　

cd D:\program Files\matlab\toolbox\deepLearnToolbox\

addpath(gepath('D:\program Files\matlab\toolbox\deepLearnToolbox-master\')

savepath   %保存，这样就不需要每次都添加一次

3、验证添加是否成功，在命令行中输入

which saesetup

果成功就会出现，saesetup.m的路径D:\program Files\matlab\toolbox\deepLearnToolbox-master\SAE\saesetup.m

4、使用deepLearnToolbox 工具包，做一个简单的demo，将autoencoder模型使用dropout前后的结果进行比较。

load mnist_uint8;

train_x = double(train_x(:,:)) / ;

test_x  = double(test_x(:,:))  / ;

train_y = double(train_y(:,:));

test_y  = double(test_y(:,:));

%% //实验一without dropout

rand('state',)

sae = saesetup([ ]);

sae.ae{}.activation_function  = 'sigm';

sae.ae{}.learningRate         =  ;

opts.numepochs = ;

opts.batchsize = ;

sae = saetrain(sae , train_x , opts );

visualize(sae.ae{}.W{}(:,:end)');

nn = nnsetup([  ]);% //初步构造了一个输入-隐含-输出层网络，其中包括了

                           % //权值的初始化，学习率，momentum，激发函数类型，

                           % //惩罚系数，dropout等

nn.W{} = sae.ae{}.W{};

opts.numepochs =  ;   %  //Number of full sweeps through data

opts.batchsize = ;  %  //Take a mean gradient step over this many samples

[nn, ~] = nntrain(nn, train_x, train_y, opts);

[er, ~] = nntest(nn, test_x, test_y);

str = sprintf('testing error rate is: %f',er);

fprintf(str);

%% //实验二：with dropout

rand('state',)

sae = saesetup([ ]);

sae.ae{}.activation_function  = 'sigm';

sae.ae{}.learningRate         =  ;

opts.numepochs = ;

opts.bachsize = ;

sae = saetrain(sae , train_x , opts );

figure;

visualize(sae.ae{}.W{}(:,:end)');

nn = nnsetup([  ]);% //初步构造了一个输入-隐含-输出层网络，其中包括了

                           % //权值的初始化，学习率，momentum，激发函数类型，

                           % //惩罚系数，dropout等

nn.dropoutFraction = 0.5;

nn.W{} = sae.ae{}.W{};

opts.numepochs =  ;   %  //Number of full sweeps through data

opts.batchsize = ;  %  //Take a mean gradient step over this many samples

[nn, L] = nntrain(nn, train_x, train_y, opts);

[er, bad] = nntest(nn, test_x, test_y);

str = sprintf('testing error rate is: %f',er);

fprintf(str);

深度学习中dropout策略的理解的更多相关文章

深度学习中Dropout原理解析
1. Dropout简介 1.1 Dropout出现的原因在机器学习的模型中,如果模型的参数太多,而训练样本又太少,训练出来的模型很容易产生过拟合的现象. 在训练神经网络的时候经常会遇到过拟合的问题 ...
Hebye 深度学习中Dropout原理解析
1. Dropout简介 1.1 Dropout出现的原因在机器学习的模型中,如果模型的参数太多,而训练样本又太少,训练出来的模型很容易产生过拟合的现象. 在训练神经网络的时候经常会遇到过拟合的问题 ...
2.深度学习中的batch_size的理解
Batch_Size(批尺寸)是机器学习中一个重要参数,涉及诸多矛盾,下面逐一展开. 首先,为什么需要有 Batch_Size 这个参数? Batch 的选择,首先决定的是下降的方向.如果数据集比较小 ...
从极大似然估计的角度理解深度学习中loss函数
从极大似然估计的角度理解深度学习中loss函数为了理解这一概念,首先回顾下最大似然估计的概念: 最大似然估计常用于利用已知的样本结果,反推最有可能导致这一结果产生的参数值,往往模型结果已经确定,用于 ...
深度学习中 --- 解决过拟合问题（dropout, batchnormalization）
过拟合,在Tom M.Mitchell的<Machine Learning>中是如何定义的:给定一个假设空间H,一个假设h属于H,如果存在其他的假设h’属于H,使得在训练样例上h的错误率比 ...
【转载】深度学习中softmax交叉熵损失函数的理解
深度学习中softmax交叉熵损失函数的理解 2018-08-11 23:49:43 lilong117194 阅读数 5198更多分类专栏: Deep learning 版权声明:本文为博主原 ...
深度学习中正则化技术概述（附Python代码）
欢迎大家关注我们的网站和系列教程:http://www.tensorflownews.com/,学习更多的机器学习.深度学习的知识! 磐石介绍数据科学研究者们最常遇见的问题之一就是怎样避免过拟合. ...
深度学习中优化【Normalization】
深度学习中优化操作: dropout l1, l2正则化 momentum normalization 1.为什么Normalization? 深度神经网络模型的训练为什么会很困难?其中一个重 ...
zz详解深度学习中的Normalization，BN/LN/WN
详解深度学习中的Normalization,BN/LN/WN 讲得是相当之透彻清晰了深度神经网络模型训练之难众所周知,其中一个重要的现象就是 Internal Covariate Shift. Ba ...

随机推荐

分区默认segment大小变化(64k—>8M)
_partition_large_extents和_index_partition_large_extents 参考: http://www.xifenfei.com/2013/08/%E5%88%8 ...
day15--认识模块、导入模块、自执行与模块的区别
一.认识模块什么是模块? 模块本质是一些功能的集合体创建的一个py文件就是一个模块使用模块: 在使用模块的py文件中通过 import 或者 from import导入模块模块的优点: 可 ...
Spring Security（二十四）：6.6 The Authentication Manager and the Namespace
The main interface which provides authentication services in Spring Security is the AuthenticationMa ...
Flink 集群运行原理兼部署及Yarn运行模式深入剖析
1 Flink的前世今生(生态很重要) 原文:https://blog.csdn.net/shenshouniu/article/details/84439459 很多人可能都是在 2015 年才听到 ...
adaboost-笔记(1)
1 - 加法模型加法模型,就是通过训练集不断的得到不同的分类器(回归),然后将这些分类器组合成一个新的分类器的过程. 假设有\(N\)个样本,且我们的加法模型如下: \[f(x)=\sum_{m=1 ...
Python黑魔法 --- 异步IO（ asyncio）协程
python asyncio 网络模型有很多中,为了实现高并发也有很多方案,多线程,多进程.无论多线程和多进程,IO的调度更多取决于系统,而协程的方式,调度来自用户,用户可以在函数中yield一个状态 ...
搭建SpringBoot+dubbo+zookeeper+maven框架（四）
今天我们完成框架的thymeleaf模板显示页面功能,页面的用户登陆,密码的AES加密解密,输错3次进行验证码验证功能,东西可能比较多,这个是我这两天在网上结合各种资源整合出来的,基本功能都已经实现, ...
kafka原理和实践（三）spring-kafka生产者源码
系列目录 kafka原理和实践(一)原理:10分钟入门 kafka原理和实践(二)spring-kafka简单实践 kafka原理和实践(三)spring-kafka生产者源码 kafka原理和实践( ...
下面哪项技术可以用在WEB开发中实现会话跟踪实现？
下面哪项技术可以用在WEB开发中实现会话跟踪实现? A:session B:Cookie C:地址重写 D:隐藏域答案:ABCD 会话跟踪是一种灵活.轻便的机制,它使Web上的状态编程变为可能. H ...
[C#]SQL Server Express LocalDb(SqlLocalDb)的一些体会
真觉得自己的知识面还是比较窄,在此之前,居然还不知道SqlLocalDb. SqlLocalDb是啥?其实就是简化SQL Server的本地数据库,可以这样子说,SQL Server既可以作为远程,也 ...

深度学习中dropout策略的理解

深度学习中dropout策略的理解的更多相关文章

随机推荐

热门专题