mxnet（gluon）—— 模型、数据集、损失函数、优化子等类、接口大全

1. 数据集

dataset_train = gluon.data.ArrayDataset(X_train, y_train)

data_iter = gluon.data.DataLoader(dataset_train, batch_size, shuffle=True)

for data, label in data_iter:

    ...

2. 模型

gluon.nn：神经网络

gluon.nn.Sequential()，可添加：
- gluon.nn.Flatten() ⇒ Flattens the input to two dimensional，将输入平坦为 2 维矩阵，是一种操作，而非添加进新的层
```
net = gluon.nn.Sequencial()

with net.name_scope():

    net.add(gluon.nn.Flatten())
```
- gluon.nn.Dense：全连接
- gluon.nn.Dropout(drop_prob1)



# 序列化神经网络模型

net = gluon.nn.Sequential()

with net.name_scope():

    net.add(gluon.nn.Dense(1))

        # Dense(1)：表示输出值的维度，

    # 一层的神经网络相当于线性回归

# 参数初始化

net.collect_params().initialize(mxnet.init.Normal(sigma=1))

3. 训练器（Trainer）

仅保存参数及超参，以及根据 batch size 进行参数更新：

trainer = gluon.Trainer(net.collect_params(), optimizer='sgd',

        optimizer_params={'learning_rate': learning_rate, 'weight_decay': weight_decay})

....

for data, label in data_iter:

    ...

    trainer.step(batch_size)

4. 自动求导：autograd

autograd.is_training() ⇒ 训练过程还是测试预测过程：

对于 dropout 型网络，训练过程因为 dropout 随机性的存在，模型是变化的，测试过程中节点全部参与，没有dropout；

mxnet（gluon）—— 模型、数据集、损失函数、优化子等类、接口大全的更多相关文章

MxNet新前端Gluon模型转换到Symbol
1. 导入各种包 from mxnet import gluon from mxnet.gluon import nn import matplotlib.pyplot as plt from mxn ...
从损失函数优化角度：讨论“线性回归（linear regression）”与”线性分类（linear classification）“的联系与区别
1. 主要观点线性模型是线性回归和线性分类的基础线性回归和线性分类模型的差异主要在于损失函数形式上,我们可以将其看做是线性模型在多维空间中“不同方向”和“不同位置”的两种表现形式损失函数是一种优 ...
机器学习与Tensorflow（3）—— 机器学习及MNIST数据集分类优化
一.二次代价函数 1. 形式: 其中,C为代价函数,X表示样本,Y表示实际值,a表示输出值,n为样本总数 2. 利用梯度下降法调整权值参数大小,推导过程如下图所示: 根据结果可得,权重w和偏置b的梯度 ...
MXNet/Gluon 中网络和参数的存取方式
https://blog.csdn.net/caroline_wendy/article/details/80494120 Gluon是MXNet的高层封装,网络设计简单易用,与Keras类似.随着深 ...
CUDA上的量化深度学习模型的自动化优化
CUDA上的量化深度学习模型的自动化优化深度学习已成功应用于各种任务.在诸如自动驾驶汽车推理之类的实时场景中,模型的推理速度至关重要.网络量化是加速深度学习模型的有效方法.在量化模型中,数据和模型参 ...
JVM内存模型和性能优化转
JVM内存模型和性能优化 JVM内存模型优点内置基于内存的并发模型: 多线程机制同步锁Synchronization 大量线程安全型库包支持基于内存的并发机制,粒度灵活控制,灵活度高于 ...
在Docker容器中搭建MXNet/Gluon开发环境
在这篇文章中没有直接使用MXNet官方提供的docker image,而是从一个干净的nvidia/cuda镜像开始,一步一步部署mxnet需要的相关软件环境,这样做是为了更加细致的了解mxnet的运 ...
mxnet(gluon) 实现DQN简单小例子
参考文献莫凡系列课程视频增强学习入门之Q-Learning 关于增强学习的基本知识可以参考第二个链接,讲的挺有意思的.DQN的东西可以看第一个链接相关视频.课程中实现了Tensorflow和pyt ...
jvm-java内存模型与锁优化
java内存模型与锁优化参考: https://blog.csdn.net/xiaoxiaoyusheng2012/article/details/53143355 https://blog.csd ...

随机推荐

python面向对象之封装（Day25）
封装: 隐藏对象的属性和实现细节,仅对外提供公共访问方式好处:1.将变化隔离 2.便于使用 3.提高复用性 4.提高安全性封装原则: 1.将不需要对外提供的内容隐藏起来 2.把属性都隐藏,提供公共 ...
echarts3.8.4实现城市空气质量(结合百度地图bmap.js，小航哥)
(小航哥自己实现的)为了事先地图效果,需要以下准备: 用百度地图作为地图,需要 1.bmap.min.js(下载地址https://github.com/ecomfe/echarts ,GitHub上 ...
用matlab将nc数据读出来，写成二进制文件，然后用grads画图
clear,clc nt=735;ny=73; %2.5*2.5格点的nx=144; %2.5*2.5格点的f=netcdf('air.mon.mean.nc','nowrite');tt ...
【Tech】CAS多机部署Server和Java Client端
昨天尝试把cas的java client端部署到另外一台机器,结果就有问题了.(localhost部署cas server和java client端参见:http://www.cnblogs.com/ ...
【CodeChef】Small factorials（BigInteger笔记）
You are asked to calculate factorials of some small positive integers. Input An integer t, 1<=t&l ...
Docker容器技术-优化Docker镜像
一.优化Docker镜像 1.降低部署时间一个大的Docker应用是如何影响在新Docker宿主机上的部署时间. (1)编写Dockerfile创建一个大Docker镜像 [root@bogon ~ ...
主攻ASP.NET MVC4.0之重生:Jquery Mobile 列表
代码: <!DOCTYPE html> <html> <head> <meta charset="utf-8"> <title ...
如何通过http接口使用f12b实现批量提交链接
这里我们分别叙述了如何在浏览器直接使用此接口,以及通过java和python如何使用此接口. 一.以浏览器为例 (一)提交一个指令 serverURL=http://120.79.247.23/f12 ...
关于Pytorch的二维tensor的gather和scatter_操作用法分析
看得不明不白(我在下一篇中写了如何理解gather的用法) gather是一个比较复杂的操作,对一个2维tensor,输出的每个元素如下: out[i][j] = input[index[i][j]] ...
kubernetes liveness readiness
Liveness Probe(存活探针):用于判断容器是否存货(running状态),如果LivenessProbe探测到容器不健康,则kubelet将杀掉该容器,并根据容器的重启策略做相应的处理.如 ...

mxnet（gluon）—— 模型、数据集、损失函数、优化子等类、接口大全

1. 数据集

2. 模型

3. 训练器（Trainer）

4. 自动求导：autograd

mxnet（gluon）—— 模型、数据集、损失函数、优化子等类、接口大全的更多相关文章

随机推荐

热门专题