机器学习之路： python线性回归过拟合 L1与L2正则化

git：https://github.com/linyi0604/MachineLearning

正则化：
    提高模型在未知数据上的泛化能力
    避免参数过拟合
正则化常用的方法：
    在目标函数上增加对参数的惩罚项
    削减某一参数对结果的影响力度

L1正则化：lasso
    在线性回归的目标函数后面加上L1范数向量惩罚项。

    f = w * x^n + b + k * ||w||1 

    x为输入的样本特征
    w为学习到的每个特征的参数
    n为次数
    b为偏置、截距
    ||w||1 为 特征参数的L1范数，作为惩罚向量
    k 为惩罚的力度

L2范数正则化：ridge
    在线性回归的目标函数后面加上L2范数向量惩罚项。

    f = w * x^n + b + k * ||w||2 

    x为输入的样本特征
    w为学习到的每个特征的参数
    n为次数
    b为偏置、截距
    ||w||2 为 特征参数的L2范数，作为惩罚向量
    k 为惩罚的力度

下面模拟 根据蛋糕的直径大小 预测蛋糕价格
采用了4次线性模型，是一个过拟合的模型
分别使用两个正则化方法 进行学习和预测

 from sklearn.linear_model import LinearRegression, Lasso, Ridge

 # 导入多项式特征生成器

 from sklearn.preprocessing import PolynomialFeatures

 '''

 正则化：

     提高模型在未知数据上的泛化能力

     避免参数过拟合

 正则化常用的方法：

     在目标函数上增加对参数的惩罚项

     削减某一参数对结果的影响力度

 L1正则化：lasso

     在线性回归的目标函数后面加上L1范数向量惩罚项。

     f = w * x^n + b + k * ||w||1 

     x为输入的样本特征

     w为学习到的每个特征的参数

     n为次数

     b为偏置、截距

     ||w||1 为 特征参数的L1范数，作为惩罚向量

     k 为惩罚的力度

 L2范数正则化：ridge

     在线性回归的目标函数后面加上L2范数向量惩罚项。

     f = w * x^n + b + k * ||w||2 

     x为输入的样本特征

     w为学习到的每个特征的参数

     n为次数

     b为偏置、截距

     ||w||2 为 特征参数的L2范数，作为惩罚向量

     k 为惩罚的力度

 下面模拟 根据蛋糕的直径大小 预测蛋糕价格

 采用了4次线性模型，是一个过拟合的模型

 分别使用两个正则化方法 进行学习和预测

 '''

 # 样本的训练数据，特征和目标值

 x_train = [[6], [8], [10], [14], [18]]

 y_train = [[7], [9], [13], [17.5], [18]]

 # 准备测试数据

 x_test = [[6], [8], [11], [16]]

 y_test = [[8], [12], [15], [18]]

 # 进行四次线性回归模型拟合

 poly4 = PolynomialFeatures(degree=4)  # 4次多项式特征生成器

 x_train_poly4 = poly4.fit_transform(x_train)

 # 建立模型预测

 regressor_poly4 = LinearRegression()

 regressor_poly4.fit(x_train_poly4, y_train)

 x_test_poly4 = poly4.transform(x_test)

 print("四次线性模型预测得分:", regressor_poly4.score(x_test_poly4, y_test))  # 0.8095880795746723

 # 采用L1范数正则化线性模型进行学习和预测

 lasso_poly4 = Lasso()

 lasso_poly4.fit(x_train_poly4, y_train)

 print("L1正则化的预测得分为：", lasso_poly4.score(x_test_poly4, y_test))  # 0.8388926873604382

 # 采用L2范数正则化线性模型进行学习和预测

 ridge_poly4 = Ridge()

 ridge_poly4.fit(x_train_poly4, y_train)

 print("L2正则化的预测得分为：", ridge_poly4.score(x_test_poly4, y_test))  # 0.8374201759366456

通过比较经过正则化的模型泛化能力明显的更好啦

机器学习之路： python线性回归过拟合 L1与L2正则化的更多相关文章

机器学习（二十三）— L0、L1、L2正则化区别
1.概念 L0正则化的值是模型参数中非零参数的个数. L1正则化表示各个参数绝对值之和. L2正则化标识各个参数的平方的和的开方值. 2.问题 1)实现参数的稀疏有什么好处吗? 一个好处是可以简化 ...
机器学习之路: python 线性回归LinearRegression, 随机参数回归SGDRegressor 预测波士顿房价
python3学习使用api 线性回归,和随机参数回归 git: https://github.com/linyi0604/MachineLearning from sklearn.datasets ...
Spark2.0机器学习系列之12：线性回归及L1、L2正则化区别与稀疏解
概述线性回归拟合一个因变量与一个自变量之间的线性关系y=f(x). Spark中实现了: (1)普通最小二乘法 (2)岭回归(L2正规化) (3)La ...
机器学习中的L1、L2正则化
目录 1. 什么是正则化?正则化有什么作用? 1.1 什么是正则化? 1.2 正则化有什么作用? 2. L1,L2正则化? 2.1 L1.L2范数 2.2 监督学习中的L1.L2正则化 3. L1.L ...
4.机器学习——统计学习三要素与最大似然估计、最大后验概率估计及L1、L2正则化
1.前言之前我一直对于“最大似然估计”犯迷糊,今天在看了陶轻松.忆臻.nebulaf91等人的博客以及李航老师的<统计学习方法>后,豁然开朗,于是在此记下一些心得体会. “最大似然估计” ...
L1与L2正则化的对比及多角度阐述为什么正则化可以解决过拟合问题
正则化是一种回归的形式,它将系数估计(coefficient estimate)朝零的方向进行约束.调整或缩小.也就是说,正则化可以在学习过程中降低模型复杂度和不稳定程度,从而避免过拟合的危险. 一. ...
深入理解L1、L2正则化
过节福利,我们来深入理解下L1与L2正则化. 1 正则化的概念正则化(Regularization) 是机器学习中对原始损失函数引入额外信息,以便防止过拟合和提高模型泛化性能的一类方法的统称.也就是 ...
day-17 L1和L2正则化的tensorflow示例
机器学习中几乎都可以看到损失函数后面会添加一个额外项,常用的额外项一般有两种,一般英文称作ℓ1-norm和ℓ2-norm,中文称作L1正则化和L2正则化,或者L1范数和L2范数.L2范数也被称为权重衰 ...
L1与L2正则化
目录过拟合结构风险最小化原理正则化 L2正则化 L1正则化 L1与L2正则化参考链接过拟合机器学习中,如果参数过多.模型过于复杂,容易造成过拟合. 结构风险最小化原理在经验风险最小化(训 ...

随机推荐

java基础学习：JavaWeb之Cookie和Session
一.会话概述 1.1.什么是会话? 会话可简单理解为:用户开一个浏览器,点击多个超链接,访问服务器多个web资源,然后关闭浏览器,整个过程称之为一个会话其中不管浏览器发送多少请求,都视为一次会话,直到 ...
C++中getline()和cin()同时使用时的注意事项
今天做tju的oj,遇到一个问题,想前部分用cin函数一个一个的读入数据,中间部分利用getline()一起读入一行,但是测试发现,cin之后的getline函数并无作用,遂谷歌之.原来cin只是在缓 ...
Oracle分析函数Over()
一.Over()分析函数说明:聚合函数(如sum().max()等)可以计算基于组的某种聚合值,但是聚合函数对于某个组只能返回一行记录.若想对于某组返回多行记录,则需要使用分析函数. 1.rank( ...
JS设计模式——10.门面模式
门面模式这是一种组织性的模式,它可以用来修改类和对象的接口,使其更便于使用.它可以让程序员过得更轻松,使他们的代码变得更容易管理. 门面模式有两个作用: 简化类的接口消除与使用她的客户代码之间的耦 ...
关于onConfigurationChanged
这两天测试app时,发现一个奇怪问题,app在启动后,Activity会onCreate两次,起初以为是横屏设置导致,随即在Activity中添加了android:configChanges=&quo ...
Dream------scala--scala内部类实战
Dream------scala--scala内部类实战 scala的内部类跟java的内部类有很大的不同,java中的内部类实际上是从属于外部类,而scala的内部类是从属于外部类对象的(及外部类实 ...
80.YCrCb - YUV - RGB之间的介绍
一,引言 YUV(亦称YCrCb)是被欧洲电视系统所采用的一种颜色编码方法(属于PAL).YUV主要用于优化彩色视频信号的传输,使其向后兼容老式黑白电视.与RGB视频信号传输相比,它最大的优点在于只需 ...
aarch64_a1
AGReader-1.2-16.fc26.aarch64.rpm 2017-02-14 07:01 50K fedora Mirroring Project ATpy-0.9.7-11.fc26.no ...
python 元组分组并排序
# -*- coding: utf-8 -*- # @Time : 2018/8/31 14:32 # @Author : cxa # @File : glomtest.py # @Software: ...
转：vue-cli的webpack模板项目配置文件分析
转载地址:http://blog.csdn.net/hongchh/article/details/55113751 一.文件结构本文主要分析开发(dev)和构建(build)两个过程涉及到的文件, ...

机器学习之路： python线性回归 过拟合 L1与L2正则化

机器学习之路： python线性回归 过拟合 L1与L2正则化的更多相关文章

随机推荐

热门专题

机器学习之路： python线性回归过拟合 L1与L2正则化

机器学习之路： python线性回归过拟合 L1与L2正则化的更多相关文章