mxnet(gluon)—— 模型、数据集、损失函数、优化子等类、接口大全
1. 数据集
dataset_train = gluon.data.ArrayDataset(X_train, y_train)
data_iter = gluon.data.DataLoader(dataset_train, batch_size, shuffle=True)
for data, label in data_iter:
    ...2. 模型
- gluon.nn:神经网络 - gluon.nn.Sequential(),可添加: - gluon.nn.Flatten() ⇒ Flattens the input to two dimensional,将输入平坦为 2 维矩阵,是一种操作,而非添加进新的层 - net = gluon.nn.Sequencial()
 with net.name_scope():
 net.add(gluon.nn.Flatten())
- gluon.nn.Dense:全连接 
- gluon.nn.Dropout(drop_prob1)
 
 
 # 序列化神经网络模型 net = gluon.nn.Sequential() with net.name_scope():
 net.add(gluon.nn.Dense(1))
 # Dense(1):表示输出值的维度,
 # 一层的神经网络相当于线性回归 # 参数初始化 net.collect_params().initialize(mxnet.init.Normal(sigma=1))
3. 训练器(Trainer)
仅保存参数及超参,以及根据 batch size 进行参数更新:
trainer = gluon.Trainer(net.collect_params(), optimizer='sgd',
        optimizer_params={'learning_rate': learning_rate, 'weight_decay': weight_decay})
....
for data, label in data_iter:
    ...
    trainer.step(batch_size)
4. 自动求导:autograd
- autograd.is_training() ⇒ 训练过程还是测试预测过程: - 对于 dropout 型网络,训练过程因为 dropout 随机性的存在,模型是变化的,测试过程中节点全部参与,没有dropout; 
mxnet(gluon)—— 模型、数据集、损失函数、优化子等类、接口大全的更多相关文章
- MxNet新前端Gluon模型转换到Symbol
		1. 导入各种包 from mxnet import gluon from mxnet.gluon import nn import matplotlib.pyplot as plt from mxn ... 
- 从损失函数优化角度:讨论“线性回归(linear regression)”与”线性分类(linear classification)“的联系与区别
		1. 主要观点 线性模型是线性回归和线性分类的基础 线性回归和线性分类模型的差异主要在于损失函数形式上,我们可以将其看做是线性模型在多维空间中“不同方向”和“不同位置”的两种表现形式 损失函数是一种优 ... 
- 机器学习与Tensorflow(3)—— 机器学习及MNIST数据集分类优化
		一.二次代价函数 1. 形式: 其中,C为代价函数,X表示样本,Y表示实际值,a表示输出值,n为样本总数 2. 利用梯度下降法调整权值参数大小,推导过程如下图所示: 根据结果可得,权重w和偏置b的梯度 ... 
- MXNet/Gluon 中网络和参数的存取方式
		https://blog.csdn.net/caroline_wendy/article/details/80494120 Gluon是MXNet的高层封装,网络设计简单易用,与Keras类似.随着深 ... 
- CUDA上的量化深度学习模型的自动化优化
		CUDA上的量化深度学习模型的自动化优化 深度学习已成功应用于各种任务.在诸如自动驾驶汽车推理之类的实时场景中,模型的推理速度至关重要.网络量化是加速深度学习模型的有效方法.在量化模型中,数据和模型参 ... 
- JVM内存模型和性能优化 转
		JVM内存模型和性能优化 JVM内存模型优点 内置基于内存的并发模型: 多线程机制 同步锁Synchronization 大量线程安全型库包支持 基于内存的并发机制,粒度灵活控制,灵活度高于 ... 
- 在Docker容器中搭建MXNet/Gluon开发环境
		在这篇文章中没有直接使用MXNet官方提供的docker image,而是从一个干净的nvidia/cuda镜像开始,一步一步部署mxnet需要的相关软件环境,这样做是为了更加细致的了解mxnet的运 ... 
- mxnet(gluon) 实现DQN简单小例子
		参考文献 莫凡系列课程视频 增强学习入门之Q-Learning 关于增强学习的基本知识可以参考第二个链接,讲的挺有意思的.DQN的东西可以看第一个链接相关视频.课程中实现了Tensorflow和pyt ... 
- jvm-java内存模型与锁优化
		java内存模型与锁优化 参考: https://blog.csdn.net/xiaoxiaoyusheng2012/article/details/53143355 https://blog.csd ... 
随机推荐
- 剑指offer 面试20题
			面试20题: 题目:表示数值的字符串 题:请实现一个函数用来判断字符串是否表示数值(包括整数和小数).例如,字符串"+100","5e2","-123 ... 
- 剑指offer 面试39题
			面试39题: 题目:数组中出现次数超过一半的数字 题:数组中有一个数字出现的次数超过数组长度的一半,请找出这个数字.例如输入一个长度为9的数组{1,2,3,2,2,2,5,4,2}.由于数字2在数组中 ... 
- CuteEditor.Editor+a+a+c+a+a.a() System.RuntimeType.get_Assembly() 问题解决方法
			问题: Server Error in '/' Application. Attempt by method 'CuteEditor.Editor+a+a+c+a+a.a()' to access m ... 
- Centos(Yum源更改)
			第一步:备份你的原镜像文件,以免出错后可以恢复. [root@openstack yum.repos.d]#mv /etc/yum.repos.d/CentOS-Base.repo /etc/yum. ... 
- flex for循环
			//for ..in 循环中的迭代变量包含属性所保存的值和名称 //for each..in 循环中的迭代变量只包含属性所保存的值,而不包含属性的名称 //对象遍历,可以获取属性名称 private ... 
- @MarkFan 口语练习录音 20140406 [美女与野兽的口语练习录音]
			大家好,您现在收听的是美女与野兽的口语练习录音 敢于追求,不惧任何挑战,才是勇敢的人生.试想一下,世界上每天有多少人为了梦想,为了生活,甚至是为了别人在不停地奔跑.假若你此刻心中装有梦想,却碍于现实不 ... 
- 主攻ASP.NET MVC4.0之重生:ASP.NET MVC  Web API
			UserController代码: using GignSoft.Models; using System; using System.Collections.Generic; using Syste ... 
- Device Tree(一):背景介绍【转】
			本文转载自:http://www.wowotech.net/device_model/why-dt.html 一.前言 作为一个多年耕耘在linux 2.6.23内核的开发者,各个不同项目中各种不同周 ... 
- Bootstrap3组件--2
			目录 1. 分页 2. 标签 3. 徽章 4. 巨幕 5. 页头 6. 缩略图 7. 警告框 8. 进度条 9. 列表组 10. 面板 11.Well 1. 分页 <!doctype html& ... 
- Classloader机制
			1.概述? 类加载器:负责.class文件加载到内存中,并为之生成对应的Class对象,也就是字节码对象.这样就可以使用这个类中的成员变量和方法了.而被加载到内存中的class文件就会变成class对 ... 
