scikit-learn中的岭回归（Ridge Regression）与Lasso回归

一、岭回归模型

　　岭回归其实就是在普通最小二乘法回归（ordinary least squares regression）的基础上，加入了正则化参数λ。

二、如何调用

class sklearn.linear_model.Ridge(alpha=1.0, fit_intercept=True, normalize=False, copy_X=True, max_iter=None, tol=0.001, solver='auto')

alpha：就是上述正则化参数λ；
fit_intercept：默认为true，数据可以拦截，没有中心化；
normalize：输入的样本特征归一化，默认false；
copy_X：复制或者重写；
max_iter：最大迭代次数；
tol: 控制求解的精度；
solver：求解器，有auto, svd, cholesky, sparse_cg, lsqr几种，一般我们选择auto，一些svd，cholesky也都是稀疏表示中常用的omp求解算法中的知识，大家有时间可以去了解。

Ridge函数会返回一个clf类，里面有很多的函数，一般我们用到的有：
clf.fit(X, y)：输入训练样本数据X，和对应的标记y；
clf.predict(X)：利用学习好的线性分类器，预测标记，一般在fit之后调用；
clf.corf_: 输入回归表示系数

详见：

http://scikit-learn.org/stable/modules/generated/sklearn.linear_model.Ridge.html#sklearn.linear_model.Ridge.decision_function

三、Lasso模型（Least absolute shrinkage and selection operator-最小绝对收缩与选择算子）

　　Lasso构造的是一个一阶的惩罚函数，满足L1范数，从而使得模型的一些变量参数可能为0（岭回归系数为0的可能性非常低），得到的模型更为精炼。

　　Lasso的正则化惩罚函数形式是L1范数，属于绝对值形式，L1范数的好处是当lambda充分大时可以把某些待估参数精确地收缩到0。回归的参数估计经常会有为0的状况，对于这种参数，我们便可以选择对它们进行剔除，就不用我们进行人工选择剔除变量，而可以让程序自动根据是否为0来剔除掉变量了。剔除了无用变量后，可能会使的模型效果更好，因为会存在一些关联比较大的共线变量，从这个角度来看，Lasso回归要优于岭回归。

　　scikit-learn对lasso模型的调用与上述岭回归调用大同小异，详见：

　　http://scikit-learn.org/stable/modules/generated/sklearn.linear_model.Lasso.html

scikit-learn中的岭回归（Ridge Regression）与Lasso回归的更多相关文章

岭回归(Ridge Regression)
一.一般线性回归遇到的问题在处理复杂的数据的回归问题时,普通的线性回归会遇到一些问题,主要表现在: 预测精度:这里要处理好这样一对为题,即样本的数量和特征的数量时,最小二乘回归会有较小的方差时, ...
机器学习方法：回归（二）：稀疏与正则约束ridge regression，Lasso
欢迎转载,转载请注明:本文出自Bin的专栏blog.csdn.net/xbinworld. "机器学习方法"系列,我本着开放与共享(open and share)的精神撰写,目的是 ...
ISLR系列：(4.2)模型选择 Ridge Regression & the Lasso
Linear Model Selection and Regularization 此博文是 An Introduction to Statistical Learning with Applicat ...
(原创)（四）机器学习笔记之Scikit Learn的Logistic回归初探
目录 5.3 使用LogisticRegressionCV进行正则化的 Logistic Regression 参数调优一.Scikit Learn中有关logistics回归函数的介绍 1. 交叉 ...
线性回归大结局(岭(Ridge)、 Lasso回归原理、公式推导)，你想要的这里都有
本文已参与「新人创作礼」活动,一起开启掘金创作之路. 线性模型简介所谓线性模型就是通过数据的线性组合来拟合一个数据,比如对于一个数据 $X$ \[X = (x_1, x_2, x_3, ..., ...
(原创)（三）机器学习笔记之Scikit Learn的线性回归模型初探
一.Scikit Learn中使用estimator三部曲 1. 构造estimator 2. 训练模型:fit 3. 利用模型进行预测:predict 二.模型评价模型训练好后,度量模型拟合效果的 ...
Jordan Lecture Note-4: Linear & Ridge Regression
Linear & Ridge Regression 对于$n$个数据$\{(x_1,y_1),(x_2,y_2),\cdots,(x_n,y_n)\},x_i\in\mathbb{R}^d,y ...
多元线性回归模型的特征压缩：岭回归和Lasso回归
多元线性回归模型中,如果所有特征一起上,容易造成过拟合使测试数据误差方差过大:因此减少不必要的特征,简化模型是减小方差的一个重要步骤.除了直接对特征筛选,来也可以进行特征压缩,减少某些不重要的特征系数 ...
L1,L2范数和正则化到lasso ridge regression
一.范数 L1.L2这种在机器学习方面叫做正则化,统计学领域的人喊她惩罚项,数学界会喊她范数. L0范数表示向量xx中非零元素的个数. L1范数表示向量中非零元素的绝对值之和. L2范数表 ...
机器学习：模型泛化（LASSO 回归）
一.基础理解 LASSO 回归(Least Absolute Shrinkage and Selection Operator Regression)是模型正则化的一定方式: 功能:与岭回归一样,解决 ...

随机推荐

按Backspace键删除时，会出现^H
按Backspace键删除时,会出现^H 2014-08-12 19:38 1180人阅读评论(0) 举报版权声明:本文为博主原创文章,未经博主允许不得转载. 在linux/unix 平台的经常使 ...
父类与子类的转换as，is
using System; using System.Collections.Generic; using System.Linq; using System.Text; using System.T ...
C# 知识回顾 - 匿名方法
C# 基础回顾 - 匿名方法目录简介匿名方法的参数使用范围委托示例简介在 C# 2.0 之前的版本中,我们创建委托的唯一形式 -- 命名方法. 而 C# 2.0 -- 引进了匿名方法,在 ...
VS05错误：部署WEB文件失败
直接生成一个空项目就不存在这个问题了.
EJB介绍
EJB定义: 被称为java企业bean,服务器端组件,核心应用是部署分布式应用程序.用它部署的系统不限定平台.实际上EJB是一种产品,描述了应用组件要解决的标准. 标准: 可扩展 (Scalable ...
【bzoj1782】[Usaco2010 Feb]slowdown 慢慢游树链剖分+线段树
题目描述每天Farmer John的N头奶牛(1 <= N <= 100000,编号1…N)从粮仓走向他的自己的牧场.牧场构成了一棵树,粮仓在1号牧场.恰好有N-1条道路直接连接着牧场, ...
Go语言【第八篇】：Go语言变量作用域
Go语言变量作用域作用域为已声明标识符所表示的常量.类型.变量.函数或包在源代码中的作用范围,Go语言中变量可以在三个地方声明: 函数内定义的变量称为局部变量: 函数外定义的变量称为全局变量: 函数 ...
CSS3 transform rotate（旋转）锯齿/元素抖动模糊的解决办法
使用CSS3 3D transforms,通过GPU来渲染,能有效的起到抗锯齿效果.只要在CSS3 transform属性中加入translateZ(0).例:-webkit-transform: r ...
python-输出颜色显示
显示颜色格式:\033[显示方式;字体色;背景色m...主题内容hello world...\033[0m \033 从这里开始标颜色................................. ...
Java异常捕捉
相信你在处理异常的时候不是每次都把它 throws 掉就完事了,很多时候异常是需要我们自己来 catch 并针对所抛出的 Exception 做一些后续的处理工作. 直接上代码,先贴下面测试需要调用的 ...

scikit-learn中的岭回归（Ridge Regression）与Lasso回归

scikit-learn中的岭回归（Ridge Regression）与Lasso回归的更多相关文章

随机推荐

热门专题