回归算法比较（线性回归，Ridge回归，Lasso回归）

代码实现：

 # -*- coding: utf-8 -*-

 """

 Created on Mon Jul 16 09:08:09 2018

 @author: zhen

 """

 from sklearn.linear_model import LinearRegression, Ridge, Lasso

 import mglearn

 from sklearn.model_selection import train_test_split

 import matplotlib.pyplot as plt

 import numpy as np

 # 线性回归

 x, y = mglearn.datasets.load_extended_boston()

 x_train, x_test, y_train, y_test = train_test_split(x, y, random_state=0)

 linear_reg = LinearRegression()

 lr = linear_reg.fit(x_train, y_train)

 print("lr.coef_:{}".format(lr.coef_))  # 斜率

 print("lr.intercept_:{}".format(lr.intercept_))  # 截距

 print("="*25+"线性回归"+"="*25)

 print("Training set score:{:.2f}".format(lr.score(x_train, y_train)))

 print("Rest set score:{:.2f}".format(lr.score(x_test, y_test)))

 """

     总结：

         训练集和测试集上的分数非常接近，这说明可能存在欠耦合。

         训练集和测试集之间的显著性能差异是过拟合的明显标志。解决方式是使用岭回归！

 """

 print("="*25+"岭回归（默认值1.0）"+"="*25)

 # 岭回归

 ridge = Ridge().fit(x_train, y_train)

 print("Training set score:{:.2f}".format(ridge.score(x_train, y_train)))

 print("Test set score:{:.2f}".format(ridge.score(x_test, y_test)))

 print("="*25+"岭回归（alpha=10）"+"="*25)

 # 岭回归

 ridge_10 = Ridge(alpha=10).fit(x_train, y_train)

 print("Training set score:{:.2f}".format(ridge_10.score(x_train, y_train)))

 print("Test set score:{:.2f}".format(ridge_10.score(x_test, y_test)))

 print("="*25+"岭回归（alpha=0.1）"+"="*25)

 # 岭回归

 ridge_01 = Ridge(alpha=0.1).fit(x_train, y_train)

 print("Training set score:{:.2f}".format(ridge_01.score(x_train, y_train)))

 print("Test set score:{:.2f}".format(ridge_01.score(x_test, y_test)))

 # 可视化

 fig = plt.figure(10)

 plt.subplots_adjust(wspace =0, hspace =0.6)#调整子图间距

 ax1 = plt.subplot(2, 1, 1)

 ax2 = plt.subplot(2, 1, 2)

 ax1.plot(ridge_01.coef_, 'v', label="Ridge alpha=0.1")

 ax1.plot(ridge.coef_, 's', label="Ridge alpha=1")

 ax1.plot(ridge_10.coef_, '^', label="Ridge alpha=10")

 ax1.plot(lr.coef_, 'o', label="LinearRegression")

 ax1.set_ylabel("Cofficient magnitude")

 ax1.set_ylim(-25,25)

 ax1.hlines(0, 0, len(lr.coef_))

 ax1.legend(ncol=2, loc=(0.1, 1.05))

 print("="*25+"Lasso回归（默认配置）"+"="*25)

 lasso = Lasso().fit(x_train, y_train)

 print("Training set score:{:.2f}".format(lasso.score(x_train, y_train)))

 print("Test set score:{:.2f}".format(lasso.score(x_test, y_test)))

 print("Number of features used:{}".format(np.sum(lasso.coef_ != 0)))

 print("="*25+"Lasso回归（aplpha=0.01）"+"="*25)

 lasso_001 = Lasso(alpha=0.01, max_iter=1000).fit(x_train, y_train)

 print("Training set score:{:.2f}".format(lasso_001.score(x_train, y_train)))

 print("Test set score:{:.2f}".format(lasso_001.score(x_test, y_test)))

 print("Number of features used:{}".format(np.sum(lasso_001.coef_ != 0)))

 print("="*15+"Lasso回归（aplpha=0.0001）太小可能会过拟合"+"="*15)

 lasso_00001 = Lasso(alpha=0.0001, max_iter=1000).fit(x_train, y_train)

 print("Training set score:{:.2f}".format(lasso_00001.score(x_train, y_train)))

 print("Test set score:{:.2f}".format(lasso_00001.score(x_test, y_test)))

 print("Number of features used:{}".format(np.sum(lasso_00001.coef_ != 0)))

 # 可视化

 ax2.plot(ridge_01.coef_, 'o', label="Ridge alpha=0.1")

 ax2.plot(lasso.coef_, 's', label="lasso alpha=1")

 ax2.plot(lasso_001.coef_, '^', label="lasso alpha=0.001")

 ax2.plot(lasso_00001.coef_, 'v', label="lasso alpha=0.00001")

 ax2.set_ylabel("Cofficient magnitude")

 ax2.set_xlabel("Coefficient index")

 ax2.set_ylim(-25,25)

 ax2.legend(ncol=2, loc=(0.1, 1))

结果：

总结：各回归算法在相同的测试数据中表现差距很多，且算法内的配置参数调整对自身算法的效果影响也是巨大的，

　　因此合理挑选合适的算法和配置合适的配置参数是使用算法的关键！

回归算法比较（线性回归，Ridge回归，Lasso回归）的更多相关文章

线性回归大结局(岭(Ridge)、 Lasso回归原理、公式推导)，你想要的这里都有
本文已参与「新人创作礼」活动,一起开启掘金创作之路. 线性模型简介所谓线性模型就是通过数据的线性组合来拟合一个数据,比如对于一个数据 \(X\) \[X = (x_1, x_2, x_3, ..., ...
Lasso回归算法：坐标轴下降法与最小角回归法小结
前面的文章对线性回归做了一个小结,文章在这: 线性回归原理小结.里面对线程回归的正则化也做了一个初步的介绍.提到了线程回归的L2正则化-Ridge回归,以及线程回归的L1正则化-Lasso回归.但是对 ...
多元线性回归模型的特征压缩：岭回归和Lasso回归
多元线性回归模型中,如果所有特征一起上,容易造成过拟合使测试数据误差方差过大:因此减少不必要的特征,简化模型是减小方差的一个重要步骤.除了直接对特征筛选,来也可以进行特征压缩,减少某些不重要的特征系数 ...
SparkMLlib学习分类算法之逻辑回归算法
SparkMLlib学习分类算法之逻辑回归算法 (一),逻辑回归算法的概念(参考网址:http://blog.csdn.net/sinat_33761963/article/details/51693 ...
SparkMLlib分类算法之逻辑回归算法
SparkMLlib分类算法之逻辑回归算法 (一),逻辑回归算法的概念(参考网址:http://blog.csdn.net/sinat_33761963/article/details/5169383 ...
LASSO回归与L1正则化西瓜书
LASSO回归与L1正则化西瓜书 2018年04月23日 19:29:57 BIT_666 阅读数 2968更多分类专栏: 机器学习机器学习数学原理西瓜书版权声明:本文为博主原创文章,遵 ...
线性回归——lasso回归和岭回归（ridge regression）
目录线性回归--最小二乘 Lasso回归和岭回归为什么 lasso 更容易使部分权重变为 0 而 ridge 不行? References 线性回归很简单,用线性函数拟合数据,用 mean squ ...
Spark MLlib回归算法------线性回归、逻辑回归、SVM和ALS
Spark MLlib回归算法------线性回归.逻辑回归.SVM和ALS 1.线性回归: (1)模型的建立: 回归正则化方法(Lasso,Ridge和ElasticNet)在高维和数据集变量之间多 ...
【机器学习】正则化的线性回归 —— 岭回归与Lasso回归
注:正则化是用来防止过拟合的方法.在最开始学习机器学习的课程时,只是觉得这个方法就像某种魔法一样非常神奇的改变了模型的参数.但是一直也无法对其基本原理有一个透彻.直观的理解.直到最近再次接触到这个概念 ...

随机推荐

Android版数据结构与算法(三):基于链表的实现LinkedList源码彻底分析
版权声明:本文出自汪磊的博客,未经作者允许禁止转载. LinkedList 是一个双向链表.它可以被当作堆栈.队列或双端队列进行操作.LinkedList相对于ArrayList来说,添加,删除元素效 ...
asp.net core系列 28 EF模型配置(字段,构造函数，拥有实体类型)
一. 支持字段 EF允许读取或写入字段而不是一个属性.在使用实体类时,用面向对象的封装来限制或增强应用程序代码对数据访问的语义时,这可能很有用.无法使用数据注释配置.除了约定,还可以使用Fluent ...
redis增删查改数据Util
目录 (1)需要导入的包 (2)redis配置文件 (3)RedisUtil类 (1)需要导入的包 <dependency> <groupId>org.springframew ...
激活效能，CODING 敏捷研发模块上线
昨晚,巴黎圣母院失火,而我们当中的许多人都还没来得及去欣赏它的真容.我们曾以为美好的事物会等待我们,伟大的目标也会等待我们.世事无常,唯一不变的就是变化.在软件研发领域,敏捷研发就是这么一个小步快跑来 ...
Android注解框架实战-ButterKnife
文章大纲 Android注解框架介绍 ButterKnife实战项目源码下载一.框架介绍为什么要用注解框架? 在Android开发过程中,我们经常性地需要操作组件,操作方法有findVie ...
CenOS_文件目录类操作命令
1.pwd 基本语法: pwd (功能描述:显示当前工作目录的绝对路径) 2.ls 基本语法: ls [选项] [目录或是文件] 常用选项: -a :显示当前目录所有的文件和目录,包括隐藏的. -l ...
Hyper-v虚拟机联网配置
最近想做点练手的项目部署到虚拟机的服务器上,然后关于虚拟机联网问题着实把贫道坑了一把.下面做一下记录防止以后忘了.... 1.新建虚拟交换机输入交换机名称和选择外部网络,可以看到外部网络的下拉框的选 ...
LeetCode算法题-Rotate String（Java实现）
这是悦乐书的第317次更新,第338篇原创在开始今天的算法题前,说几句,今天是世界读书日,推荐两本书给大家,<终身成长>和<禅与摩托车维修艺术>,值得好好阅读和反复阅读. 0 ...
Json,Gson,Ajax基础知识
//json 是一种轻量级的文本格式,解析简单,他也是一键值来存,数据与数据的分割是以,来分割 //{} 看到大括号就是一个对象,[]代表集合 ,基本上所有数据的交互都是以json格式来进行传递的 / ...
.NET Core微服务之基于Consul实现服务治理
Tip: 此篇已加入.NET Core微服务基础系列文章索引一.Consul基础介绍 Consul是HashiCorp公司推出的开源工具,用于实现分布式系统的服务发现与配置.与其他分布式服务注册与发 ...

回归算法比较（线性回归，Ridge回归，Lasso回归）

回归算法比较（线性回归，Ridge回归，Lasso回归）的更多相关文章

随机推荐

热门专题