L2范数惩罚项，高维线性回归

%matplotlib inline

import mxnet

from mxnet import nd,autograd

from mxnet import gluon,init

from mxnet.gluon import data as gdata,loss as gloss,nn

import gluonbook as gb

n_train, n_test, num_inputs = 20,100,200

true_w = nd.ones((num_inputs, 1)) * 0.01

true_b = 0.05

features = nd.random.normal(shape=(n_train+n_test, num_inputs))

labels = nd.dot(features,true_w) + true_b

labels += nd.random.normal(scale=0.01, shape=labels.shape)

train_feature = features[:n_train,:]

test_feature = features[n_train:,:]

train_labels = labels[:n_train]

test_labels = labels[n_train:]

#print(features,train_feature,test_feature)

# 初始化模型参数

def init_params():

    w = nd.random.normal(scale=1, shape=(num_inputs, 1))

    b = nd.zeros(shape=(1,))

    w.attach_grad()

    b.attach_grad()

    return [w,b]

# 定义，训练，测试

batch_size = 1

num_epochs = 100

lr = 0.03

train_iter = gdata.DataLoader(gdata.ArrayDataset(train_feature,train_labels),batch_size=batch_size,shuffle=True)

# 定义网络

def linreg(X, w, b):

    return nd.dot(X,w) + b

# 损失函数

def squared_loss(y_hat, y):

    """Squared loss."""

    return (y_hat - y.reshape(y_hat.shape)) ** 2 / 2

# L2 范数惩罚

def l2_penalty(w):

    return (w**2).sum() / 2

def sgd(params, lr, batch_size):

    for param in params:

        param[:] = param - lr * param.grad / batch_size

def fit_and_plot(lambd):

    w, b = init_params()

    train_ls, test_ls = [], []

    for _ in range(num_epochs):

        for X, y in train_iter:

            with autograd.record():

                # 添加了 L2 范数惩罚项。

                l = squared_loss(linreg(X, w, b), y) + lambd * l2_penalty(w)

            l.backward()

            sgd([w, b], lr, batch_size)

        train_ls.append(squared_loss(linreg(train_feature, w, b),

                             train_labels).mean().asscalar())

        test_ls.append(squared_loss(linreg(test_feature, w, b),

                            test_labels).mean().asscalar())

    gb.semilogy(range(1, num_epochs + 1), train_ls, 'epochs', 'loss',

                range(1, num_epochs + 1), test_ls, ['train', 'test'])

    print('L2 norm of w:', w.norm().asscalar())

fit_and_plot(0)
fit_and_plot(3)

训练集太少，容易出现过拟合，即训练集loss远小于测试集loss，解决方案，权重衰减——（L2范数正则化）

例如线性回归：

loss(w1,w2,b) = 1/n * sum(x1w1 + x2w2 + b - y)^2 /2 ，平方损失函数。

权重参数 w = [w1,w2]，

新损失函数 loss(w1,w2,b) += lambd / 2n *||w||^2

迭代方程：

L2范数惩罚项，高维线性回归的更多相关文章

小白学习之pytorch框架(6)-模型选择(K折交叉验证)、欠拟合、过拟合(权重衰减法(=L2范数正则化)、丢弃法)、正向传播、反向传播
下面要说的基本都是<动手学深度学习>这本花书上的内容,图也采用的书上的首先说的是训练误差(模型在训练数据集上表现出的误差)和泛化误差(模型在任意一个测试数据集样本上表现出的误差的期望) ...
机器学习中的范数规则化 L0、L1与L2范数核范数与规则项参数选择
http://blog.csdn.net/zouxy09/article/details/24971995 机器学习中的范数规则化之(一)L0.L1与L2范数 zouxy09@qq.com http: ...
机器学习中的范数规则化之 L0、L1与L2范数、核范数与规则项参数选择
装载自:https://blog.csdn.net/u012467880/article/details/52852242 今天我们聊聊机器学习中出现的非常频繁的问题:过拟合与规则化.我们先简单的来理 ...
《机器学习实战》学习笔记第八章 —— 线性回归、L1、L2范数正则项
相关笔记: 吴恩达机器学习笔记(一) —— 线性回归吴恩达机器学习笔记(三) —— Regularization正则化 ( 问题遗留: 小可只知道引入正则项能降低参数的取值,但为什么能保证 Σθ2 ...
deep learning （五）线性回归中L2范数的应用
cost function 加一个正则项的原因是防止产生过拟合现象.正则项有L1,L2 等范数,我看过讲的最好的是这个博客上的:机器学习中的范数规则化之(一)L0.L1与L2范数.看完应该就答题明白了 ...
paper 126：[转载] 机器学习中的范数规则化之（一）L0、L1与L2范数
机器学习中的范数规则化之(一)L0.L1与L2范数 zouxy09@qq.com http://blog.csdn.net/zouxy09 今天我们聊聊机器学习中出现的非常频繁的问题:过拟合与规则化. ...
机器学习中的范数规则化之（一）L0、L1与L2范数（转）
http://blog.csdn.net/zouxy09/article/details/24971995 机器学习中的范数规则化之(一)L0.L1与L2范数 zouxy09@qq.com http: ...
L0、L1与L2范数、核范数（转）
L0.L1与L2范数.核范数今天我们聊聊机器学习中出现的非常频繁的问题:过拟合与规则化.我们先简单的来理解下常用的L0.L1.L2和核范数规则化.最后聊下规则化项参数的选择问题.这里因为篇幅比较庞大 ...
机器学习中的范数规则化之（一）L0、L1与L2范数非常好，必看
机器学习中的范数规则化之(一)L0.L1与L2范数 zouxy09@qq.com http://blog.csdn.net/zouxy09 今天我们聊聊机器学习中出现的非常频繁的问题:过拟合与规则化. ...

随机推荐

python 生成嵌套字典
import collections import json tree=lambda:collections.defaultdict(tree) some_dict=tree() some_dict[ ...
tgz 文件解压
使用命令:tar zxvf ×××.tgz 即可进行解压留作备忘
PHP unlink删除本地中文名称的文件
由于编码不一样,用unlink()方法删除本地中文名称的材料之前,必须先转码,才能删除成功. 核心代码如下: //删除本地的议题材料(本地上传的材料) if($local_ma ...
Git~分支真的很轻
轻,让人觉得很爽所有源代码管理工具都有管理分支的功能,git当然也不例外,而且git的分支是非常轻的,不像tfs,svn那样,复制一大堆代码,git只记录变化的内容,有本地分支与远程分支之分,原则上 ...
手指静脉细化算法过程原理解析　以及python实现细化算法
原文作者:aircraft 原文地址:https://www.cnblogs.com/DOMLX/p/8672489.html 文中的一些图片以及思想很多都是参考https://www.cnblogs ...
解决下载额外数据文件失败以下软件包要求安装后下载附加数据，但其数据无法下载或无法处理 ttf-mscorefonts-installer
ubuntu 14.04 今天安装完 wine,之后会出现这个问题原因应该是需要的字体无法下载那你需要手动下载, 到这个地址下载 http://sourceforge.net/projects/c ...
linux_api之信号
本片索引: 1.引言 2.信号 3.程序启动 4.signal函数 5.系统调用的中断和系统调用的重启(了解) 6.可再入与不可再入函数(了解) 7.kill函数和raise函数 8.alarm函数和 ...
【Linux相识相知】bash的特性
命令历史 shell进程会记录用户提交执行过的命令可以是用history查看: [root@localhost dev]# history ss -tnl ifconfig vi /etc/sysc ...
SpringSecurity 3.2入门（5）自定义登录页面
增加spring-security.xml文件配置如下  <security:http auto-config=& ...
vue分页
1.依赖文件 <link href="/css/index.css" rel="stylesheet" type="text/css" ...

L2范数惩罚项，高维线性回归

L2范数惩罚项，高维线性回归的更多相关文章

随机推荐

热门专题