【笔记】简谈L1正则项L2正则和弹性网络

L1,L2,以及弹性网络

前情提要：

模型泛化与岭回归与LASSO

正则

ridge和lasso的后面添加的式子的格式上其实和MSE，MAE，以及欧拉距离和曼哈顿距离是非常像的

虽然应用场景不同，但是其表示出来的数学思想是非常相近的

对明科夫斯基距离进行泛化可以得到

对于任何向量x，都可以求其第i个维度的p次方的和在开p次方根，在数学上通常称其为Lp范数

（明科夫斯基距离：）

对于ridge来说，写成这种样式，一般称其为L2正则项

对于LASSO来说，写成这种样式，一般称其为L1正则项

这样就可以说是，对于岭回归来说，就是为损失函数添加一个L2正则项，对于LASSO来说，就是为损失函数添加一个L1正则项

实际上还存在一个L0正则项，为损失函数添加一个项，这个项要让theta的个数尽可能的小（本质是一个离散项）

真的要使用的话，实际上用L1取代，因为L0正则的优化是一个NP难的问题

弹性网 Elastic Net

结合这两种方式，在均方误差后面添加一个L1正则项再添加一个L2正则项，其中引入一个新的超参数r来表示这两种正则项的比例是多少

一般使用的时候，先使用岭回归，但是如果特征数特别大的话，就应该优先选择弹性网，因为弹性网结合了岭回归的计算的优点，又结合了LASSO的数据筛选的优势

【笔记】简谈L1正则项L2正则和弹性网络的更多相关文章

大白话5分钟带你走进人工智能-第十四节过拟合解决手段L1和L2正则
第十四节过拟合解决手段L1和L2正则第十三节中, ...
大白话5分钟带你走进人工智能-第十五节L1和L2正则几何解释和Ridge，Lasso，Elastic Net回归
第十五节L1和L2正则几何解释和Ridge,Lasso,Elastic Net回归上一节中我们讲解了L1和L2正则的概念,知道了L1和L2都会使不重要的维度权重下降得多,重要的维度权重下降得少,引入 ...
L1与L2正则(转)
概念: L0范数表示向量中非零元素的个数:NP问题,但可以用L1近似代替. L1范数表示向量中每个元素绝对值的和: L1范数的解通常是稀疏性的,倾向于选择:1. 数目较少的一些非常大的值 2. 数目 ...
L1和L2正则
https://blog.csdn.net/jinping_shi/article/details/52433975
损失函数———有关L1和L2正则项的理解
一.损失函: 模型的结构风险函数包括了经验风险项和正则项,如下所示: 二.损失函数中的正则项 1.正则化的概念: 机器学习中都会看到损失函数之后会添加一个额外项,常用的额外项一般有2种, ...
L1 正则和 L2 正则的区别
L1,L2正则都可以看成是条件限制,即 $\Vert w \Vert \leq c$ $\Vert w \Vert^2 \leq c$ 当w为2维向量时,可以看到,它们限定的取值范围如下图: 所以它 ...
【机器学习】--鲁棒性调优之L1正则，L2正则
一.前述鲁棒性调优就是让模型有更好的泛化能力和推广力. 二.具体原理 1.背景第一个更好,因为当把测试集带入到这个模型里去.如果测试集本来是100,带入的时候变成101,则第二个模型结果偏差很大, ...
机器学习（二十三）— L0、L1、L2正则化区别
1.概念 L0正则化的值是模型参数中非零参数的个数. L1正则化表示各个参数绝对值之和. L2正则化标识各个参数的平方的和的开方值. 2.问题 1)实现参数的稀疏有什么好处吗? 一个好处是可以简化 ...
L1和L2正则化（转载）
[深度学习]L1正则化和L2正则化在机器学习中,我们非常关心模型的预测能力,即模型在新数据上的表现,而不希望过拟合现象的的发生,我们通常使用正则化(regularization)技术来防止过拟合情况 ...

随机推荐

SpringBoot | 1.4 数据库事务处理
前言前面讲解了Sring的AOP,可以知道它是用来抽取公共代码,增强方法的.而在JDBC操作数据库进行数据处理时,有很多重复的公共代码:事务的提交与回滚跟AOP的约定流程很相似.因此,Spring数 ...
初步了解Unix系统的I/O模式
I/O模式对于一次IO访问(以read举例),数据会先被拷贝到操作系统内核的缓冲区中,然后才会从操作系统内核的缓冲区拷贝到应用程序的地址空间. 当一个read操作发生时,它会经历两个阶段: 等待数据 ...
L inux系统安全及应用---暴力破解密码
系统安全及应用一.开关机安全控制① 调整BIOS引导设置② GRUB限制二.终端登录安全控制① 限制root只在安全终端登录② 禁止普通用户登录举例三.系统弱口令检测① Joth the Ripper ...
mysql 修改my.ini
1.C:\Program Files\MySQL\MySQL Server 5.5\bin>mysqladmin shutdown可能提示:localhost不能启动mysql2.C:\Prog ...
File类与常用IO流第八章——缓冲流
第八章.缓冲流缓冲流概述缓冲流,也叫高效流,是对4个基本的FileXxx流的增强.按照数据类型分为4类: 输入缓冲流输出缓冲流字节缓冲流 BufferedInputStream Buffe ...
Day2基本数据类型字节和类型转换
Java基础语法注释 1.单行注释:// 加内容 2.多行注释:/* 多行注释 */ 3.文档注释: /** * * */ 有趣的注释标识符关键字基本数据类型八大基本数据类型 //整数in ...
ES6 数组Arrary 常用方法
ES6 数组Arrary 常用方法: <script type="text/javascript"> // 操作数据方法 // arr.push() 从后面添加元素,返 ...
Dubbo的优雅下线原理分析
文/朱季谦 Dubbo如何实现优雅下线? 这个问题困扰了我一阵,既然有优雅下线这种说法,那么,是否有非优雅下线的说法呢? 这,还真有. 可以从linux进程关闭说起,其实,我们经常使用到杀进程的指令背 ...
扩展欧几里得(exgcd)-求解不定方程/求逆元
贝祖定理:即如果a.b是整数,那么一定存在整数x.y使得ax+by=gcd(a,b).换句话说,如果ax+by=m有解,那么m一定是gcd(a,b)的若干倍.(可以来判断一个这样的式子有没有解)有一个 ...
java中的集合类学习（三）
JAVA中有许多的集合,常用的有List,Set,Queue,Map. 1.其中List,Set,Queue都是Collection(集合),其每个元素都是单独的一个对象,如List<Strin ...

【笔记】简谈L1正则项L2正则和弹性网络

L1,L2,以及弹性网络

正则

弹性网 Elastic Net

【笔记】简谈L1正则项L2正则和弹性网络的更多相关文章

随机推荐

热门专题