前言

正则化是一种广泛用于机器学习和深度学习的手段，它的目的就是阻碍模型过度学习（过拟合），从而提升算法的泛化能力。

Dropout 是一种常见的缓解过拟合的方法。接下来，本文将从原理和实践来介绍Dropout技术。

一、Dropout原理

丢弃法（Dropout Method）：在训练一个深度神经网络时，可以随机丢弃一部分神经元（同时丢弃其对应的连接边）来避免过拟合。

训练时，每次选择丢弃的神经元是随机的，这些随机选出隐藏层的神经元将被删除，它们将不再传递信号。

常规dropout

(训练测试不一致，测试时调整输入保持一致)

设置一个固定的概率，对每一个神经元都以概率来判定不要保留。对于一个神经层 = ( + )，可引入一个掩蔽函数mask(⋅) 使得 = (mask() + )。掩蔽函数mask(⋅)的定义为：

但在测试时，所有神经元都可激活，这会造成训练和测试时网络的输出不一致。为了缓解这个问题，在测试时需要将神经层的输入乘以，也相当于把不同的神经网络做了平均。（这里的p为保留率）

二、Dropout实现

每次正向传播时，self.mask中都会以False的形式保存要删除的神经元。

self.mask会随机生成和x形状相同的数组，并将值比dropout_ratio大的元素设为True。反向传播时的行为和ReLU相同。

也就是说，正向传播时传递了信号的神经元，反向传播时按原样传递信号；对于正向传播时没有传递信号的神经元，反向传播时信号将停止

大于丢弃率则保留（不训练时乘以 1-p，保持输出期望不变）

实际dropout

在训练时就缩放，不改变其输入期望

实际在Pytorch中。F.dropout 是一个函数，参数包含输入的tensor，概率和training 为真还是假：

training 为真时，才会将一部分元素置为0，其他元素会乘以 scale 1/(1-p).
training 为false时，dropout直接就不起作用。默认情况下training是True。

实际操作：

对于输入层的神经元，其保留率通常设为更接近1的数，使得输入变化不会太大。对输入层神经元进行丢弃时，相当于给数据增加噪声，以此来提高网络的鲁棒性。
一般来讲，对于中间隐藏层的神经元，其 = 0.5 时效果最好，这对大部分的网络和任务都比较有效。当 = 0.5时，在训练时有一半的神经元被丢弃，只剩余一半的神经元是可以激活的，随机生成的网络结构最具多样性。
输出层一般就不加了

集成学习角度的解释

每做一次丢弃，相当于从原始的网络中采样得到一个子网络。如果一个神经网络有个神经元，那么总共可以采样出 2 个子网络。每次迭代都相当于训练一个不同的子网络，这些子网络都共享原始网络的参数。

那么，最终的网络可以近似看作集成了指数级个不同网络的组合模型。（子网络的平均，Dropout提供了一种廉价的Bagging集成近似）

参考内容

(15条消息) PyTorch的F.dropout为什么要加self.training？_诸神缄默不语的博客-CSDN博客

不加train的话，相当于没有用dropout

(15条消息) F.dropout,nn.Dropout的验证使用，参数training,inplace_LUQC638的博客-CSDN博客

【深度学习】神经网络正则化方法之Dropout的更多相关文章

吴恩达深度学习笔记（十一）—— dropout正则化
主要内容: 一.dropout正则化的思想二.dropout算法流程三.dropout的优缺点一.dropout正则化的思想在神经网络中,dropout是一种“玄学”的正则化方法,以减少过拟合 ...
深度学习中正则化技术概述（附Python代码）
欢迎大家关注我们的网站和系列教程:http://www.tensorflownews.com/,学习更多的机器学习.深度学习的知识! 磐石介绍数据科学研究者们最常遇见的问题之一就是怎样避免过拟合. ...
【Todo】【转载】深度学习&神经网络科普及八卦学习笔记 & GPU & SIMD
上一篇文章提到了数据挖掘.机器学习.深度学习的区别:http://www.cnblogs.com/charlesblc/p/6159355.html 深度学习具体的内容可以看这里: 参考了这篇文章:h ...
深度学习的集成方法——Ensemble Methods for Deep Learning Neural Networks
本文主要参考Ensemble Methods for Deep Learning Neural Networks一文. 1. 前言神经网络具有很高的方差,不易复现出结果,而且模型的结果对初始化参数异 ...
深度学习面试题14：Dropout(随机失活)
目录卷积层的dropout 全连接层的dropout Dropout的反向传播 Dropout的反向传播举例参考资料在训练过程中,Dropout会让输出中的每个值以概率keep_prob变为原来 ...
构建基于深度学习神经网络协同过滤模型(NCF)的视频推荐系统(Python3.10/Tensorflow2.11)
毋庸讳言,和传统架构(BS开发/CS开发)相比,人工智能技术确实有一定的基础门槛,它注定不是大众化,普适化的东西.但也不能否认,人工智能技术也具备像传统架构一样"套路化"的流程,也 ...
go微服务框架go-micro深度学习(四) rpc方法调用过程详解
上一篇帖子go微服务框架go-micro深度学习(三) Registry服务的注册和发现详细解释了go-micro是如何做服务注册和发现在,服务端注册server信息,client获取server的地 ...
[深度学习] 神经网络的理解（MLP RBF RBM DBN DBM CNN 整理学习）
转载于 http://lanbing510.info/2014/11/07/Neural-Network.html 开篇语文章整理自向世明老师的PPT,围绕神经网络发展历史,前馈网络(单层感知器,多 ...
深度学习----Xavier初始化方法
“Xavier”初始化方法是一种很有效的神经网络初始化方法,方法来源于2010年的一篇论文<Understanding the difficulty of training deep feedf ...
深度学习——Xavier初始化方法
“Xavier”初始化方法是一种很有效的神经网络初始化方法,方法来源于2010年的一篇论文<Understanding the difficulty of training deep feedf ...

随机推荐

LyScript 实现Hook隐藏调试器
LyScript 插件集成的内置API函数可灵活的实现绕过各类反调试保护机制,前段时间发布的那一篇文章并没有详细讲解各类反调试机制的绕过措施,本次将补充这方面的知识点,运用LyScript实现绕过大多 ...
webpack重新打包清空dist文件夹的问题
1.5.20.0以上版本才支持output属性里的clean:true 5.20.0+ 5.20以下版本清除dist文件内容一般使用插件 clean-webpack-plugin, 5.20版本以后o ...
[Java] 解析Xml配置文件
1.解析方法 import javax.xml.parsers.DocumentBuilder;import javax.xml.parsers.DocumentBuilderFactory;impo ...
基于Wireshark的ARP协议分析和IP报文、ICMP报文的分析｜网络数据抓包｜课程设计｜traceroute｜ping｜
前言那么这里博主先安利一些干货满满的专栏了! 首先是博主的高质量博客的汇总,这个专栏里面的博客,都是博主最最用心写的一部分,干货满满,希望对大家有帮助. 高质量博客汇总https://blog.cs ...
Proxmox的local-lvm改文件存储，提升运行速度
介绍 Proxmox的缺省安装会创建 local 和 local-lvm 两个存储.其中local大约磁盘容量的10%,存储类别为目录. local-lvm的存储类别为 lvm-thin. 实际使用中 ...
1.变量和简单的数据类型--《Python编程：从入门到实践》
1.1 变量在Python中使用变量时,需要遵守一些规则和指南. 变量名只能包含字母.数字和下划线.变量名可以字母或下划线打头,但不能以数字打头. 变量名不能包含空格,但可使用下划线来分隔其中的单 ...
Linux--top命令解释
top命令解释 1.1 系统运行时间和平均负载: top命令的顶部显示与uptime命令相似的输出这些字段显示: 当前时间系统已运行的时间当前登录用户的数量相应最近5.10和15分钟内的平均负 ...
Java21 + SpringBoot3使用Spring Security时如何在子线程中获取到认证信息
目录前言原因分析解决方案方案1:手动设置线程中的认证信息方案2:使用DelegatingSecurityContextRunnable创建线程方案3:修改Spring Security安全 ...
windows_exporter 安装
windows_exporter 安装背景如果想使用Prometheus监控Windows主机相关参数,那么就需要在Windows系统的主机上进行安装指标收集器. windows_exporter ...
JS 页面离开事件页面关闭事件，实现登录成功返回上个页面
壹 ❀ 引登录成功后跳转到上一个页面是很常见的需求,比如在天猫添加购物车时网站会效验用户登录情况,若未登录则跳转登录,登录成功返回到先前的商品页. 这个功能实现并不困难,但因为我的奇思妙想让我先后了 ...

【深度学习】神经网络正则化方法之Dropout

前言

一、Dropout原理

二、Dropout实现

参考内容

【深度学习】神经网络正则化方法之Dropout的更多相关文章

随机推荐

热门专题