构建数据集

# -*- coding: utf-8 -*-

from mxnet import init

from mxnet import ndarray as nd

from mxnet.gluon import loss as gloss

import gb

n_train = 20

n_test = 100

num_inputs = 200

true_w = nd.ones((num_inputs, 1)) * 0.01

true_b = 0.05

features = nd.random.normal(shape=(n_train+n_test, num_inputs))

labels = nd.dot(features, true_w) + true_b

labels += nd.random.normal(scale=0.01, shape=labels.shape)

train_features, test_features = features[:n_train, :], features[n_train:, :]

train_labels, test_labels = labels[:n_train], labels[n_train:]

数据迭代器

from mxnet import autograd

from mxnet.gluon import data as gdata

batch_size = 1

num_epochs = 10

learning_rate = 0.003

train_iter = gdata.DataLoader(gdata.ArrayDataset(

    train_features, train_labels), batch_size, shuffle=True)

loss = gloss.L2Loss()

训练并展示结果

gb.semilogy函数：绘制训练和测试数据的loss

from mxnet import gluon

from mxnet.gluon import nn

def fit_and_plot(weight_decay):

    net = nn.Sequential()

    net.add(nn.Dense(1))

    net.initialize(init.Normal(sigma=1))

    # 对权重参数做 L2 范数正则化，即权重衰减。

    trainer_w = gluon.Trainer(net.collect_params('.*weight'), 'sgd', {

        'learning_rate': learning_rate, 'wd': weight_decay})

    # 不对偏差参数做 L2 范数正则化。

    trainer_b = gluon.Trainer(net.collect_params('.*bias'), 'sgd', {

        'learning_rate': learning_rate})

    train_ls = []

    test_ls = []

    for _ in range(num_epochs):

        for X, y in train_iter:

            with autograd.record():

                l = loss(net(X), y)

            l.backward()

            # 对两个 Trainer 实例分别调用 step 函数。

            trainer_w.step(batch_size)

            trainer_b.step(batch_size)

        train_ls.append(loss(net(train_features),

                             train_labels).mean().asscalar())

        test_ls.append(loss(net(test_features),

                            test_labels).mean().asscalar())

    gb.semilogy(range(1, num_epochs + 1), train_ls, 'epochs', 'loss',

                range(1, num_epochs + 1), test_ls, ['train', 'test'])

    return 'w[:10]:', net[0].weight.data()[:, :10], 'b:', net[0].bias.data()

print fit_and_plot(5)

使用 Gluon 的 wd 超参数可以使用权重衰减来应对过拟合问题。
我们可以定义多个 Trainer 实例对不同的模型参数使用不同的迭代方法。

MXNET：权重衰减-gluon实现的更多相关文章

MXNET：权重衰减
权重衰减是应对过拟合问题的常用方法. \(L_2\)范数正则化在深度学习中,我们常使用L2范数正则化,也就是在模型原先损失函数基础上添加L2范数惩罚项,从而得到训练所需要最小化的函数. L2范数惩罚 ...
调参过程中的参数学习率，权重衰减，冲量(learning_rate , weight_decay , momentum)
无论是深度学习还是机器学习,大多情况下训练中都会遇到这几个参数,今天依据我自己的理解具体的总结一下,可能会存在错误,还请指正. learning_rate , weight_decay , momen ...
权重衰减（weight decay）与学习率衰减（learning rate decay）
本文链接:https://blog.csdn.net/program_developer/article/details/80867468“微信公众号” 1. 权重衰减(weight decay)L2 ...
从头学pytorch(六):权重衰减
深度学习中常常会存在过拟合现象,比如当训练数据过少时,训练得到的模型很可能在训练集上表现非常好,但是在测试集上表现不好. 应对过拟合,可以通过数据增强,增大训练集数量.我们这里先不介绍数据增强,先从模 ...
MxNet新前端Gluon模型转换到Symbol
1. 导入各种包 from mxnet import gluon from mxnet.gluon import nn import matplotlib.pyplot as plt from mxn ...
使用MxNet新接口Gluon提供的预训练模型进行微调
1. 导入各种包 from mxnet import gluon import mxnet as mx from mxnet.gluon import nn from mxnet import nda ...
MXNET：丢弃法
除了前面介绍的权重衰减以外,深度学习模型常常使用丢弃法(dropout)来应对过拟合问题. 方法与原理为了确保测试模型的确定性,丢弃法的使用只发生在训练模型时,并非测试模型时.当神经网络中的某一层使 ...
MXNET：监督学习
线性回归给定一个数据点集合 X 和对应的目标值 y,线性模型的目标就是找到一条使用向量 w 和位移 b 描述的线,来尽可能地近似每个样本X[i] 和 y[i]. 数学公式表示为\(\hat{y}=X ...
mxnet深度学习实战学习笔记-9-目标检测
1.介绍目标检测是指任意给定一张图像,判断图像中是否存在指定类别的目标,如果存在,则返回目标的位置和类别置信度如下图检测人和自行车这两个目标,检测结果包括目标的位置.目标的类别和置信度因为目标检 ...

随机推荐

hdu 1106 去5排序
题目链接:https://vjudge.net/problem/HDU-1106 题目大意: 输入一行数字,如果我们把这行数字中的‘5’都看成空格,那么就得到一行用空格分割的若干非负整数(可能有些整数 ...
Chameleon
# -*- coding: utf-8 -*- """ Created on Tue Dec 18 09:55:16 2018 @author: Mark,LI &quo ...
jooq实践
用法 sql语句 SELECT AUTHOR.FIRST_NAME, AUTHOR.LAST_NAME, COUNT(*) FROM AUTHOR JOIN BOOK ON AUTHOR.ID = B ...
ClassLoader如何加载class？
ClassLoader一个经常出现又让很多人望而却步的词,本文将试图以最浅显易懂的方式来讲解 ClassLoader,希望能对不了解该机制的朋友起到一点点作用. 要深入了解ClassLoader,首先 ...
C memset
//#include "stdafx.h" #include <iostream> #include <memory.h> using namespace ...
MIRUO面试题
1.c#可以继承string类吗?2.接口可以实现接口吗?抽象类可以实现接口吗?抽象类可以实现实体类吗?3.用C#计算2.5的3次方的方法.4.什么是协同程序?5.GC是什么,如何减少内存,如何加快性 ...
Python 库/模块/工具收集
1 算法 1.1 字符串处理 re 正则表达式的标准库. StringIO / cStringIO 以读写文件的方式来操作字符串(有点类似于内存文件). cStringIO 是 C 语言实现的,提供高 ...
WinPcap权威指南（一）
WinPcap是一个开源的网络抓包模块,顾名思义,它只能工作在Windows下,但本文介绍的知识并不局限于任何操作系统和开发语言,因为网络协议本身是没有这些区别的.阅读本指南之前,请先下载WinPca ...
C# windows 桌面控件的扩展
今天一同事需要一个Windows from下 GridView的嵌套的控件,于是就去找了以前自己写的一些form 控件,发现居然没有人下载.同时查找以前的下载包也比较费时,于是乎就搞一个文章. 运行 ...
centos7 使用rsync 实现文件同步
一.服务端(192.168.8.81): 安装软件: yum -y install rsync 创建需同步的目录: mkdir -p /home/root/rsync 编辑配置文件:vim /etc/ ...

MXNET：权重衰减-gluon实现

构建数据集

数据迭代器

训练并展示结果

MXNET：权重衰减-gluon实现的更多相关文章

随机推荐

热门专题