【dlbook】正则化

对学习算法的修改——旨在减少泛化误差而不是训练误差

显著减少方差而不过度增加偏差。

【参数范数惩罚】

通常只对权重做惩罚而不对偏置做惩罚，原因是拟合偏置比拟合权重容易很多。

不同层使用不同惩罚的代价很大，会在所有层使用相同的权重衰减。

L2正则化的效果：在Hessian阵特征值较大的方向，正则化的影响比较小，在特征值比较小的方向，会比较快速的趋近到0

　　让算法感知到较高方差的x，从而与

L1正则化的效果：

　　参数向一个方向移动一个特定的距离，如果移动之后变号，那么置为0。

　　会产生稀疏解

【欠约束问题】

对矩阵XTX求逆，只要奇异就会出问题，现实数据中只要在某些方向没有差异，或者在一些方向没有观察到方差，矩阵就是奇异的。

（通常在我们的数据中不会发生）

【噪声稳定性】

bishop 1995: 对x添加方差极小的噪声等价于对权重进行范数惩罚

在一般情况下，注入噪声远比简单的收缩参数强大，尤其是添加到隐藏单元！

另外一种方式是对循环神经网络的权重加噪声，实际上是基于贝叶斯思想。

【early stop】

代价：

1、需要多次评估validation集

2、需要保存最佳参数副本

正则化效果：

将参数空间控制在初始值的小邻域内，如果初始值足够小，那么是有效的。

比weight decay更有效

【稀疏表示】

【Bagging】

【Dropout】

可以认为是廉价的Bagging,

小批量、小步长的学习算法，

还需要继续学习。。。

【dlbook】正则化的更多相关文章

数据预处理中归一化（Normalization）与损失函数中正则化（Regularization）解惑
背景:数据挖掘/机器学习中的术语较多,而且我的知识有限.之前一直疑惑正则这个概念.所以写了篇博文梳理下摘要: 1.正则化(Regularization) 1.1 正则化的目的 1.2 正则化的L1范 ...
【原】关于使用sklearn进行数据预处理 —— 归一化/标准化/正则化
一.标准化(Z-Score),或者去除均值和方差缩放公式为:(X-mean)/std 计算时对每个属性/每列分别进行. 将数据按期属性(按列进行)减去其均值,并处以其方差.得到的结果是,对于每个属 ...
正则化方法：L1和L2 regularization、数据集扩增、dropout
正则化方法:防止过拟合,提高泛化能力在训练数据不够多时,或者overtraining时,常常会导致overfitting(过拟合).其直观的表现如下图所示,随着训练过程的进行,模型复杂度增加,在tr ...
coursera机器学习-logistic回归，正则化
#对coursera上Andrew Ng老师开的机器学习课程的笔记和心得: #注:此笔记是我自己认为本节课里比较重要.难理解或容易忘记的内容并做了些补充,并非是课堂详细笔记和要点: #标记为<补 ...
stanford coursera 机器学习编程作业 exercise 5（正则化线性回归及偏差和方差）
本文根据水库中蓄水标线(water level) 使用正则化的线性回归模型预水流量(water flowing out of dam),然后 debug 学习算法以及讨论偏差和方差对该线性回归 ...
PRML读书会第五章 Neural Networks（神经网络、BP误差后向传播链式求导法则、正则化、卷积网络）
主讲人网神 (新浪微博:@豆角茄子麻酱凉面) 网神(66707180) 18:55:06 那我们开始了啊,前面第3,4章讲了回归和分类问题,他们应用的主要限制是维度灾难问题.今天的第5章神经网络的内 ...
斯坦福第七课：正则化(Regularization)
7.1 过拟合的问题 7.2 代价函数 7.3 正则化线性回归 7.4 正则化的逻辑回归模型 7.1 过拟合的问题如果我们有非常多的特征,我们通过学习得到的假设可能能够非常好地适应训练集( ...
正则化，数据集扩增，Dropout
正则化方法:防止过拟合,提高泛化能力在训练数据不够多时,或者overtraining时,常常会导致overfitting(过拟合).其直观的表现如下图所示,随着训练过程的进行,模型复杂度增加,在tr ...
（五）用正则化(Regularization)来解决过拟合
1 过拟合过拟合就是训练模型的过程中,模型过度拟合训练数据,而不能很好的泛化到测试数据集上.出现over-fitting的原因是多方面的: 1) 训练数据过少,数据量与数据噪声是成反比的,少量数据导 ...

随机推荐

自定义圆形头像CircleImageView的使用和源码分析
http://www.jcodecraeer.com/a/anzhuokaifa/androidkaifa/2015/0806/3268.html tools:context="com.ex ...
ElasticSearch(六) Elasticsearch在Thinkphp5.0中的使用
首先下载需要引入的类库链接:https://pan.baidu.com/s/1XEXviLoWM-ypwJ_B0jXqlg 密码:u54t //Elasticsearch.zip类库压缩包地址然后 ...
CF1155D Beautiful Array(动态规划)
做法 \(f_{i,0}\)表示以\(i\)结尾未操作时的最大值 \(f_{i,1}\)表示以\(i\)结尾正在操作时的最大值 \(f_{i,2}\)表示以\(i\)结尾已结束操作时的最大值 Code ...
debug教程
名称解释格式 a (Assemble) 逐行汇编 a [address] c (Compare) 比较两内存块 c range address d (Dump) 内存16进制显示 d [addre ...
理解 Dubbo SPI 扩展机制
写在前面最近接触了 gRPC 体会到虽然众多 RPC 框架各有各的特点但是他们提供的特性和功能有很多的相似之处 , 这就说明他们面对同样的分布式系统带来的问题.从 2016 年左右开始接触到 dub ...
关于xftp连接不了Linux，但是却可以用xshell连接Linux
解决方法:用sftp协议,不要用ftp协议
Python学习札记(三) I/O
参考:输入和输出 I/O 1.print()函数 a.调用print()输出字符串有以下两种方式:(1)print('[字符串]') (2)print("[字符串]") b.调用p ...
Mysql事物的4种隔离级别
SQL标准定义了4种隔离级别,包括了一些具体规则,用来限定事务内外的哪些改变是可见的,哪些是不可见的. 低级别的隔离级一般支持更高的并发处理,并拥有更低的系统开销. 首先,我们使用 test 数据库, ...
redis_port.py
!/usr/bin/env python import os import json import simplejson as json t=os.popen("""su ...
eclipse及tomcat web站點
eclipse环境下如何配置tomcat https://www.cnblogs.com/Leo_wl/p/4769760.htmleclipse环境下如何配置tomcat,并且把项目部署到Tomca ...

【dlbook】正则化

【dlbook】正则化的更多相关文章

随机推荐

热门专题