最小二乘法的矩阵正则化改进——“岭回归”和“LASSO回归”算法

看代码过程中发现了一个很奇怪的概念，叫做“最小二乘法的矩阵正则化”，这个词汇十分的陌生，虽然最小二乘法是知道的，但是用了矩阵正则化的最小二乘法是个什么东西呢？

后来在网上一通查才知道，原来“最小二乘法的二范数矩阵正则化”就是“岭回归”算法，而“最小二乘法的一范数矩阵正则化”就是“LASSO回归”算法。

不得不感慨，为什么有的人写东西总是要挑那些令人生疏的词汇表达，用一些常见的词汇表达不是更易懂嘛。

note: 本文不对“岭回归”和“LASSO回归”算法进行数学推导和数学解释，也不从统计学上给出显著性解释，本文就是解释一下算法概念的别名。

-----------------------------------------------------

给出岭回归的推导公式：

图及代码源自：https://blog.csdn.net/weixin_44831924/article/details/103929256

sklearn对Longley数据集进行岭回归计算：

（数据集见：

https://www.cnblogs.com/devilmaycry812839668/p/17445172.html）

import numpy as np

from numpy import genfromtxt

from sklearn import linear_model

import matplotlib.pyplot as plt

# 读入数据

data = genfromtxt(r"longley.csv",delimiter=',')

print(data)

# 切分数据

x_data = data[1:,2:]

y_data = data[1:,1]

print(x_data)

print(y_data)

# 创建模型

# 生成50个值作为label的候选值，此处是alphas

# linspace默认生成50个值，若想生成100个，可以修改为(0.001,1,100)

alphas_to_test = np.linspace(0.001,1)

# 创建模型，保存误差值，ridge表示岭回归，cv表示交叉验证

model = linear_model.RidgeCV(alphas=alphas_to_test, store_cv_values=True)

model.fit(x_data,y_data)

# 岭系数

print(model.alpha_)

# loss值（16个loss值，50个岭系数，每一个系数对应一个loss值）

print(model.cv_values_.shape)

# 画图，横坐标是岭系数的50个值，纵坐标是交叉验证法得到的16个loss值的平均值

# 岭系数跟loss值的关系

plt.plot(alphas_to_test,model.cv_values_.mean(axis=0))

# 选取的岭系数值的位置

plt.plot(model.alpha_,min(model.cv_values_.mean(axis=0)),'ro')

plt.show()

model.predit(x_data[2,np.newaxis])

----------------------------------------------------------

给出一个pytorch的岭回归代码（部分代码，不可运行）：

    def fit(self, episodes):

        # sequence_length * batch_size x feature_size

        featmat = self._feature(episodes).view(-1, self.feature_size)

        # sequence_length * batch_size x 1

        returns = episodes.returns.view(-1, 1)

        reg_coeff = self._reg_coeff

        eye = torch.eye(self.feature_size, dtype=torch.float32,

                        device=self.linear.weight.device)

        for _ in range(5):

            try:

                coeffs = torch.linalg.lstsq(

                    torch.matmul(featmat.t(), featmat) + reg_coeff * eye,

                    torch.matmul(featmat.t(), returns)

                ).solution

                break

            except RuntimeError:

                reg_coeff += 10

        else:

            raise RuntimeError('Unable to solve the normal equations in '

                               '`LinearFeatureBaseline`. The matrix X^T*X (with X the design '

                               'matrix) is not full-rank, regardless of the regularization '

                               '(maximum regularization: {0}).'.format(reg_coeff))

        self.linear.weight.data = coeffs.data.t()

详细代码地址：

https://gitee.com/devilmaycry812839668/MAML-Pytorch-RL/blob/master/maml_rl/baseline.py

最小二乘法的矩阵正则化改进——“岭回归”和“LASSO回归”算法的更多相关文章

【机器学习】正则化的线性回归 —— 岭回归与Lasso回归
注:正则化是用来防止过拟合的方法.在最开始学习机器学习的课程时,只是觉得这个方法就像某种魔法一样非常神奇的改变了模型的参数.但是一直也无法对其基本原理有一个透彻.直观的理解.直到最近再次接触到这个概念 ...
机器学习之五正则化的线性回归-岭回归与Lasso回归
机器学习之五正则化的线性回归-岭回归与Lasso回归注:正则化是用来防止过拟合的方法.在最开始学习机器学习的课程时,只是觉得这个方法就像某种魔法一样非常神奇的改变了模型的参数.但是一直也无法对其基 ...
岭回归和lasso回归（转）
回归和分类是机器学习算法所要解决的两个主要问题.分类大家都知道,模型的输出值是离散值,对应着相应的类别,通常的简单分类问题模型输出值是二值的,也就是二分类问题.但是回归就稍微复杂一些,回归模型的输出值 ...
线性回归大结局(岭(Ridge)、 Lasso回归原理、公式推导)，你想要的这里都有
本文已参与「新人创作礼」活动,一起开启掘金创作之路. 线性模型简介所谓线性模型就是通过数据的线性组合来拟合一个数据,比如对于一个数据 \(X\) \[X = (x_1, x_2, x_3, ..., ...
岭回归和Lasso回归以及norm1和norm2
norm代表的是距离,两个向量的距离:下图代表的就是p-norm,其实是对向量里面元素的一种运算: 最简单的距离计算(规范)是欧式距离(Euclidean distance),两点间距离是如下来算的, ...
岭回归与Lasso回归
线性回归的一般形式过拟合问题及其解决方法问题:以下面一张图片展示过拟合问题解决方法:(1):丢弃一些对我们最终预测结果影响不大的特征,具体哪些特征需要丢弃可以通过PCA算法来实现:(2):使用正 ...
多元线性回归模型的特征压缩：岭回归和Lasso回归
多元线性回归模型中,如果所有特征一起上,容易造成过拟合使测试数据误差方差过大:因此减少不必要的特征,简化模型是减小方差的一个重要步骤.除了直接对特征筛选,来也可以进行特征压缩,减少某些不重要的特征系数 ...
机器学习入门线性回归岭回归与Lasso回归(二)
一线性回归(Linear Regression ) 1. 线性回归概述回归的目的是预测数值型数据的目标值,最直接的方法就是根据输入写出一个求出目标值的计算公式,也就是所谓的回归方程,例如y = a ...
吴裕雄数据挖掘与分析案例实战（7）——岭回归与LASSO回归模型
# 导入第三方模块import pandas as pdimport numpy as npimport matplotlib.pyplot as pltfrom sklearn import mod ...
回归算法比较（线性回归，Ridge回归，Lasso回归）
代码: # -*- coding: utf-8 -*- """ Created on Mon Jul 16 09:08:09 2018 @author: zhen &qu ...

随机推荐

mysql8新版本安装注意事项及解决本地系统账户Strart the server和SQLyog客户端连接报 plugin caching_sha2_password could not be loaded
mysql 安装包一路next安装, 到Apply Configuration,卡住在Start the server,原因是mysql8新版本的登录身份不对,需要进入服务,找到mysql80,然后属 ...
const 和 volatile 指针
关键字 const 和 volatile 规定了指针的处理方式: const 规定指针在初始化后是受保护的,不能够再修改. volatile 规定了变量的值能够被用户应用程序外部的操作所修改. 因此, ...
Springcloud开发之OpenFeign调用和认证
SpringCloud开发cloud具有巨大的灵活性. 在调用其它服务的时候有多种方式,虽然本质一样,但是细节还是有所差异. 一.概述当a服务调用b服务的时候有多种方式进行: 1.通过openFei ...
mysql8.0.22在centos7.6下的简单安装
如果想把mysql安装得好一些,则严重推荐使用压缩包来安装,不推荐使用rpm方式. 一般情况下,现在大部分的服务器都是x86-64,少数是arm架构的. 选择合适的版本,下载即可. 本文中,使用的是 ...
Python中r+,w+,a+的区别
相信有很多人对他们的区别不清楚,网上对他们的讨论又过于复杂. 其实利用光标位置来区分它们就会变得非常地简单. r+读写模式打开文件之后光标位置位于0的位置根据光标位置读写 w+写读模式会清空文件 ...
C# Newtonsoft增删改查(本地存储)(简单便捷)(拿来即用)
调用方法: LocalSetupHelper.SetData(Sss.维护, "密码", "123456"); //保存 var c=LocalSetupHel ...
opengauss Need repair修复
问题描述:opengauss集群在做切换的时候,或者增删节点的时候,很容易发生节点repair,找不到主库的情况,这种情况需要把主库使用primary角色启动,然后build重建从库,就可以恢复集群 ...
Node.js中的模块
CommonJS模块 CommonJS是一种规范,它定义了JavaScript 在服务端运行所必备的基础能力,比如:模块化.IO.进程管理等.其中,模块化方案影响深远,其对模块的定义如下: 1,模块引 ...
ubuntu20 python2 通过安装包安装mysql-python
前言众里寻他千百度,蓦然回首,那人却在灯火阑珊处. 最近要测试一个python2环境的代码,其中用到了MySQLdb, 查询网络,发现要安装mysql-python,于是就进行了一番艰难的探索,现在 ...
Sqlalchemy 连接SQL Server 登录失败
实验系统环境 Windows平台 Sqlalchemy 2.0.23 Python 3.10 SQL Server 2012 aioodbc 0.5.0 问题详情 sqlalchemy.exc.Int ...

最小二乘法的矩阵正则化改进——“岭回归”和“LASSO回归”算法

最小二乘法的矩阵正则化改进——“岭回归”和“LASSO回归”算法的更多相关文章

随机推荐

热门专题