从零开始

前面了解了多层感知机的原理，我们来实现一个多层感知机。

# -*- coding: utf-8 -*-

from mxnet import init

from mxnet import ndarray as nd

from mxnet.gluon import loss as gloss

import gb

# 定义数据源

batch_size = 256

train_iter, test_iter = gb.load_data_fashion_mnist(batch_size)

# 定义模型参数

num_inputs = 784

num_outputs = 10

num_hiddens = 256

W1 = nd.random.normal(scale=0.01, shape=(num_inputs, num_hiddens))

b1 = nd.zeros(num_hiddens)

W2 = nd.random.normal(scale=0.01, shape=(num_hiddens, num_outputs))

b2 = nd.zeros(num_outputs)

params = [W1, b1, W2, b2]

for param in params:

    param.attach_grad()

# 定义激活函数

def relu(X):

    return nd.maximum(X, 0)

# 定义模型

def net(X):

    X = X.reshape((-1, num_inputs))

    H = relu(nd.dot(X, W1) + b1)

    return nd.dot(H, W2) + b2

# 定义损失函数

loss = gloss.SoftmaxCrossEntropyLoss()

# 训练模型

num_epochs = 5

lr = 0.5

gb.train_cpu(net, train_iter, test_iter, loss, num_epochs, batch_size,

             params, lr)

添加隐层后，模型的性能大幅提升

# output

epoch 1, loss 0.5029, train acc 0.852, test acc 0.934

epoch 2, loss 0.2000, train acc 0.943, test acc 0.956

epoch 3, loss 0.1431, train acc 0.959, test acc 0.964

epoch 4, loss 0.1138, train acc 0.967, test acc 0.968

epoch 5, loss 0.0939, train acc 0.973, test acc 0.973

在定义模型参数和定义模型步骤，仍然有一些繁琐。

使用Gluon

# -*- coding: utf-8 -*-

from mxnet import init

from mxnet import ndarray as nd

from mxnet.gluon import loss as gloss

import gb

# 定义数据源

batch_size = 256

train_iter, test_iter = gb.load_data_fashion_mnist(batch_size)

# 定义模型

from mxnet.gluon import nn

net = nn.Sequential()

net.add(nn.Dense(256, activation='relu'))

net.add(nn.Dense(10))

net.add(nn.Dense(10))

net.initialize(init.Normal(sigma=0.01))

# 定义损失函数

loss = gloss.SoftmaxCrossEntropyLoss()

# 训练模型

from mxnet import gluon

trainer = gluon.Trainer(net.collect_params(), 'sgd', {'learning_rate': 0.5})

num_epochs = 5

gb.train_cpu(net, train_iter, test_iter, loss, num_epochs, batch_size,

             None, None, trainer)

# output

epoch 1, loss 1.3065, train acc 0.525, test acc 0.814

epoch 2, loss 0.2480, train acc 0.928, test acc 0.950

epoch 3, loss 0.1442, train acc 0.958, test acc 0.961

epoch 4, loss 0.1060, train acc 0.969, test acc 0.971

epoch 5, loss 0.0807, train acc 0.976, test acc 0.973

MXNET：多层感知机的更多相关文章

动手学深度学习10- pytorch多层感知机从零实现
多层感知机定义模型的参数定义激活函数定义模型定义损失函数训练模型小结多层感知机 import torch import numpy as np import sys sys.path.a ...
DeepLearning学习（1）--多层感知机
想直接学习卷积神经网络,结果发现因为神经网络的基础较弱,学习起来比较困难,所以准备一步步学.并记录下来,其中会有很多摘抄. (一)什么是多层感知器和反向传播 1,单个神经元神经网络的基本单元就是神经 ...
Theano3.4-练习之多层感知机
来自http://deeplearning.net/tutorial/mlp.html#mlp Multilayer Perceptron note:这部分假设读者已经通读之前的一个练习 Classi ...
学习笔记TF026:多层感知机
隐含层,指除输入.输出层外,的中间层.输入.输出层对外可见.隐含层对外不可见.理论上,只要隐含层节点足够多,只有一个隐含层,神经网络可以拟合任意函数.隐含层越多,越容易拟合复杂函数.拟合复杂函数,所需 ...
『TensorFlow』读书笔记_多层感知机
多层感知机输入->线性变换->Relu激活->线性变换->Softmax分类多层感知机将mnist的结果提升到了98%左右的水平知识点过拟合:采用dropout解决,本 ...
基于theano的多层感知机的实现
1.引言一个多层感知机(Multi-Layer Perceptron,MLP)可以看做是,在逻辑回归分类器的中间加了非线性转换的隐层,这种转换把数据映射到一个线性可分的空间.一个单隐层的MLP就可以 ...
（数据科学学习手札44）在Keras中训练多层感知机
一.简介 Keras是有着自主的一套前端控制语法,后端基于tensorflow和theano的深度学习框架,因为其搭建神经网络简单快捷明了的语法风格,可以帮助使用者更快捷的搭建自己的神经网络,堪称深度 ...
（数据科学学习手札34）多层感知机原理详解&Python与R实现
一.简介机器学习分为很多个领域,其中的连接主义指的就是以神经元(neuron)为基本结构的各式各样的神经网络,规范的定义是:由具有适应性的简单单元组成的广泛并行互连的网络,它的组织能够模拟生物神经系 ...
DeepLearning tutorial（3）MLP多层感知机原理简介+代码详解
本文介绍多层感知机算法,特别是详细解读其代码实现,基于python theano,代码来自:Multilayer Perceptron,如果你想详细了解多层感知机算法,可以参考:UFLDL教程,或者参 ...

随机推荐

计蒜客-跳跃游戏二（简单dp）
题目链接:https://nanti.jisuanke.com/t/20 跳跃游戏二给定一个非负整数数组,假定你的初始 ...
【python学习-6】异常处理
最近在网上看到了一种学习方法名叫费曼学习法,说的是学习一个东西的时候,要尝试着给别人讲出来,就是一种备课式的学习. 第一步,选择一个你想要理解的概念, 然后拿出一张白纸, 把这个概念写在白纸的最上边. ...
SQLite中的运算符表达式
SQLite中的运算符表达式在SQLite中,运算符包括了一元运算符,二元运算符(二进制运算符)和三元元素符.图3.12中给出了这些运算符需要的参数以及优先级.其中,一元运算符的优先级最高,三元运算 ...
ruby那些事儿
为了学习sass,客串一下ruby,这是一个破案的过程,探索的过程. Ruby是日本人发明的一种类似于Python和Perl的服务器端脚本语言,它完全面向对象,适合于快速开发,一般开发效率是java的 ...
css 背景透明色，文字不透明。
[原]CSS实现背景透明,文字不透明,兼容所有浏览器 background-color: rgba(0,0,0,0.5); filter:Alpha(opacity=50);
git 快照及分支
分支介绍分支就是科幻电影里面的平行宇宙,当你正在电脑前努力学习Git的时候,另一个你正在另一个平行宇宙里努力学习SVN. 如果两个平行宇宙互不干扰,那对现在的你也没啥影响.不过,在某个时间点,两个平 ...
JVM Debugger Memory View for IntelliJ IDEA
Posted on August 19, 2016 by Andrey Cheptsov Every day we try to find new ways to improve developer ...
.net源码调试 http://referencesource.microsoft.com/
其实关于.net源码调试网上的资料已经很多了,我以前转载的文章有 VS2010下如何调试Framework源代码(即FCL) 和如何使你的应用程序调试进.NET Framework 4.5源代码内 ...
CentOS7 下 keepalived 的安装和配置
安装前准备:yum -y install gcc gcc-c++ autoconf automake make yum -y install zlib zlib-devel openssl opens ...
018-Go将磁盘目录实现简单的静态Web服务
package main import( "net/http" ) func main(){ http.Handle("/", http.FileServer( ...

MXNET：多层感知机

从零开始

使用Gluon

MXNET：多层感知机的更多相关文章

随机推荐

热门专题