mxnet（gluon）—— 模型、数据集、损失函数、优化子等类、接口大全

1. 数据集

dataset_train = gluon.data.ArrayDataset(X_train, y_train)

data_iter = gluon.data.DataLoader(dataset_train, batch_size, shuffle=True)

for data, label in data_iter:

    ...

2. 模型

gluon.nn：神经网络

gluon.nn.Sequential()，可添加：
- gluon.nn.Flatten() ⇒ Flattens the input to two dimensional，将输入平坦为 2 维矩阵，是一种操作，而非添加进新的层
```
net = gluon.nn.Sequencial()

with net.name_scope():

    net.add(gluon.nn.Flatten())
```
- gluon.nn.Dense：全连接
- gluon.nn.Dropout(drop_prob1)



# 序列化神经网络模型

net = gluon.nn.Sequential()

with net.name_scope():

    net.add(gluon.nn.Dense(1))

        # Dense(1)：表示输出值的维度，

    # 一层的神经网络相当于线性回归

# 参数初始化

net.collect_params().initialize(mxnet.init.Normal(sigma=1))

3. 训练器（Trainer）

仅保存参数及超参，以及根据 batch size 进行参数更新：

trainer = gluon.Trainer(net.collect_params(), optimizer='sgd',

        optimizer_params={'learning_rate': learning_rate, 'weight_decay': weight_decay})

....

for data, label in data_iter:

    ...

    trainer.step(batch_size)

4. 自动求导：autograd

autograd.is_training() ⇒ 训练过程还是测试预测过程：

对于 dropout 型网络，训练过程因为 dropout 随机性的存在，模型是变化的，测试过程中节点全部参与，没有dropout；

mxnet（gluon）—— 模型、数据集、损失函数、优化子等类、接口大全的更多相关文章

MxNet新前端Gluon模型转换到Symbol
1. 导入各种包 from mxnet import gluon from mxnet.gluon import nn import matplotlib.pyplot as plt from mxn ...
从损失函数优化角度：讨论“线性回归（linear regression）”与”线性分类（linear classification）“的联系与区别
1. 主要观点线性模型是线性回归和线性分类的基础线性回归和线性分类模型的差异主要在于损失函数形式上,我们可以将其看做是线性模型在多维空间中“不同方向”和“不同位置”的两种表现形式损失函数是一种优 ...
机器学习与Tensorflow（3）—— 机器学习及MNIST数据集分类优化
一.二次代价函数 1. 形式: 其中,C为代价函数,X表示样本,Y表示实际值,a表示输出值,n为样本总数 2. 利用梯度下降法调整权值参数大小,推导过程如下图所示: 根据结果可得,权重w和偏置b的梯度 ...
MXNet/Gluon 中网络和参数的存取方式
https://blog.csdn.net/caroline_wendy/article/details/80494120 Gluon是MXNet的高层封装,网络设计简单易用,与Keras类似.随着深 ...
CUDA上的量化深度学习模型的自动化优化
CUDA上的量化深度学习模型的自动化优化深度学习已成功应用于各种任务.在诸如自动驾驶汽车推理之类的实时场景中,模型的推理速度至关重要.网络量化是加速深度学习模型的有效方法.在量化模型中,数据和模型参 ...
JVM内存模型和性能优化转
JVM内存模型和性能优化 JVM内存模型优点内置基于内存的并发模型: 多线程机制同步锁Synchronization 大量线程安全型库包支持基于内存的并发机制,粒度灵活控制,灵活度高于 ...
在Docker容器中搭建MXNet/Gluon开发环境
在这篇文章中没有直接使用MXNet官方提供的docker image,而是从一个干净的nvidia/cuda镜像开始,一步一步部署mxnet需要的相关软件环境,这样做是为了更加细致的了解mxnet的运 ...
mxnet(gluon) 实现DQN简单小例子
参考文献莫凡系列课程视频增强学习入门之Q-Learning 关于增强学习的基本知识可以参考第二个链接,讲的挺有意思的.DQN的东西可以看第一个链接相关视频.课程中实现了Tensorflow和pyt ...
jvm-java内存模型与锁优化
java内存模型与锁优化参考: https://blog.csdn.net/xiaoxiaoyusheng2012/article/details/53143355 https://blog.csd ...

随机推荐

djange数据库优化操作
一.all()命令分析 1.user_list = models.UserInfo.objects.all() #查询表一次可以得到该表的所有信息注释:user_list.query可以查询到 ...
C# 调用VS自带程序WebDev.WebServer40.EXE 源代码
通过Process.Start启动,VS自带程序WebDev.WebServer40.EXE 在内网架设网站时,为安装IIS条件下用VS自带的小程序来测试效果非常不错! using System; u ...
Linux Shell基础单引号、双引号、反引号、小括号和大括号
单引号和双引号单引号和双引号用于变量值出现空格时将字符用引号括起来. 二者的主要区别在于, 被单引号括起来的字符都是普通字符,就算特殊字符也不再有特殊含义: 被双引号括起来的字符中,"$& ...
最长公共子序列的C++实现---附二维指针的使用方法
想了挺久到底第一篇在这儿的博客写什么好,刚好这两天又一次看到动态规划的LCS算法觉得还是有点意思的,就拿来写了写,第一篇博客就发它吧. #include<iostream> #includ ...
用nodejs实现读取文件操作
//如果不是全局就得引入fs成员 const fs = require("fs"); //fs 核心模块中提供了一个 fs.readFile方法,来读取指定目录下的文件 //fs. ...
INSPIRED启示录读书笔记 - 第41章产品经理的反省清单
十大问题 1.产品能吸引目标消费者的关注吗? 2.产品的设计是否人性化,是否易于操作? 3.产品能在竞争中取胜吗?即使是面对未来风云变化的市场,依旧有取胜的把握吗? 4.我了解目标用户吗?产品(不是理 ...
高通平台Bootloader启动流程【转】
本文转载自:http://blog.csdn.net/fang_first/article/details/49615631 ====================基本知识============= ...
linux基础（2）-网卡配置
常用网卡配置参数 DEVICE=eth0 #指出设备名称 HWADDR=00:0C:29:3C:D2:CA #网卡的mac地址TYPE=Ethernet #网络类型为Ether ...
Linux Ctrl+Z VS Ctrl+C 以及+Z的使用方法
问题及处理: Ctrl+Z是将任务中断,但是此任务并没有结束,他仍然在进程中他只是维持挂起的状态,用户可以使用fg/bg操作继续前台或后台的任务,fg命令重新启动前台被中断的任务,bg命令把被中断的任 ...
手机APP和微信小程序能否取代域名？
有人说现在App是主流,手机上装几个App就可以了,以后域名的重要性会越来越低,直至App完全取代域名的域名无用论.真的是这样吗? 关于这个话题已经有很多先人前辈探讨过,这次誉名网从另外一个角度给各位 ...

mxnet（gluon）—— 模型、数据集、损失函数、优化子等类、接口大全

1. 数据集

2. 模型

3. 训练器（Trainer）

4. 自动求导：autograd

mxnet（gluon）—— 模型、数据集、损失函数、优化子等类、接口大全的更多相关文章

随机推荐

热门专题