『MXNet』第四弹_Gluon自定义层

一、不含参数层

通过继承Block自定义了一个将输入减掉均值的层：CenteredLayer类，并将层的计算放在forward函数里，

from mxnet import nd, gluon

from mxnet.gluon import nn

class CenteredLayer(nn.Block):

    def __init__(self, **kwargs):

        super(CenteredLayer, self).__init__(**kwargs)

    def forward(self, x):

        return x - x.mean()

# 直接使用这个层

layer = CenteredLayer()

# layer(nd.array([1, 2, 3, 4, 5]))

# 构建更复杂模型

net = nn.Sequential()

net.add(nn.Dense(128))

net.add(nn.Dense(10))

net.add(CenteredLayer())

# 初始化、运行……

net.initialize()

y = net(nd.random.uniform(shape=(4, 8)))

二、含参数层

注意，本节实现的自定义层不能自动推断输入尺寸，需要手动指定

见上节『MXNet』第三弹_Gluon模型参数在自定义层的时候我们常使用Block自带的ParameterDict类添加成员变量params，如下，

from mxnet import gluon

from mxnet.gluon import nn

class MyDense(nn.Block):

    def __init__(self, units, in_units, **kwargs):

        super(MyDense, self).__init__(**kwargs)

        self.weight = self.params.get('weight', shape=(in_units, units))

        self.bias = self.params.get('bias', shape=(units,))        

    def forward(self, x):

        linear = nd.dot(x, self.weight.data()) + self.bias.data()

        return nd.relu(linear)

# 实际运行

dense = MyDense(5, in_units=10)

如果不想使用ParameterDict类则需要一下操作

# self.weight = self.params.get('weight', shape=(in_units, units))

self.weight = gluon.Parameter('weight', shape=(in_units, units))

self.params.update({'weight':self.weight})

否则在net.initialize()初始化时是初始化不到ParameterDict外变量的。

有关这一点详见下面：

    def __init__(self, conv_arch, dropout_keep_prob, **kwargs):

        super(SSD, self).__init__(**kwargs)

        self.vgg_conv = nn.Sequential()

        self.vgg_conv.add(repeat(*conv_arch[0], pool=False))

        [self.vgg_conv.add(repeat(*conv_arch[i])) for i in range(1, len(conv_arch))]

        # 迭代器对象只能进行单次迭代，所以将之转化为tuple，否则识别参数处迭代后forward再次迭代直接跳出循环

        # self.vgg_conv = tuple([repeat(*conv_arch[i])

        #                       for i in range(len(conv_arch))])

        # 只能识别实例属性直接为mx层函数或者mx序列对象的参数，如果使用其他容器，需要将参数收集进参数字典

        # _ = [self.params.update(block.collect_params()) for block in self.vgg_conv]

    def forward(self, x, feat_layers):

        end_points = {'block0': x}

        for (index, block) in enumerate(self.vgg_conv):

            end_points.update({'block{:d}'.format(index+1): block(end_points['block{:d}'.format(index)])})

        return end_points

属性对象是mxnet的对象时才能默认识别层中的参数，否则需要显式收集进self.params中。

测试代码：

if __name__ == '__main__':

    ssd = SSD(conv_arch=((2, 64), (2, 128), (3, 256), (3, 512), (3, 512)),

              dropout_keep_prob=0.5)

    ssd.initialize()

    X = mx.ndarray.random.uniform(shape=(1, 1, 304, 304))

    import pprint as pp

    pp.pprint([x[1].shape for x in ssd(X).items()])

自行验证即可。

『MXNet』第四弹_Gluon自定义层的更多相关文章

『MXNet』第三弹_Gluon模型参数
MXNet中含有init包,它包含了多种模型初始化方法. from mxnet import init, nd from mxnet.gluon import nn net = nn.Sequenti ...
『MXNet』第六弹_Gluon性能提升
一.符号式编程 1.命令式编程和符号式编程命令式: def add(a, b): return a + b def fancy_func(a, b, c, d): e = add(a, b) f = ...
『MXNet』第六弹_Gluon性能提升静态图动态图符号式编程命令式编程
https://www.cnblogs.com/hellcat/p/9084894.html 目录一.符号式编程 1.命令式编程和符号式编程 2.MXNet的符号式编程二.惰性计算用同步函数实际 ...
『PyTorch』第四弹_通过LeNet初识pytorch神经网络_下
『PyTorch』第四弹_通过LeNet初识pytorch神经网络_上 # Author : Hellcat # Time : 2018/2/11 import torch as t import t ...
『MXNet』第十弹_物体检测SSD
全流程地址一.辅助API介绍 mxnet.image.ImageDetIter 图像检测迭代器, from mxnet import image from mxnet import nd data_ ...
『MXNet』第八弹_数据处理API_下_Image IO专题
想学习MXNet的同学建议看一看这位博主的博客,受益良多. 在本节中,我们将学习如何在MXNet中预处理和加载图像数据. 在MXNet中加载图像数据有4种方式. 使用 mx.image.imdecod ...
『MXNet』第八弹_数据处理API_上
一.Gluon数据加载下面的两个dataset处理类一般会成对出现,两个都可做预处理,但是由于后面还可能用到原始图片,.ImageFolderDataset不加预处理的话可以满足,所以建议在.Dat ...
『MXNet』第十一弹_符号式编程初探
一.符号分类符号对我们想要进行的计算进行了描述, 下图展示了符号如何对计算进行描述. 我们定义了符号变量A, 符号变量B, 生成了符号变量C, 其中, A, B为参数节点, C为内部节点! mxne ...
『MXNet』第七弹_多GPU并行程序设计
资料原文一.概述思路假设一台机器上有个GPU.给定需要训练的模型,每个GPU将分别独立维护一份完整的模型参数. 在模型训练的任意一次迭代中,给定一个小批量,我们将该批量中的样本划分成份并分给每个G ...

随机推荐

LuoguP1072 Hankson的趣味题
题目原题链接题解题意即为 \[ gcd(x,a0)=a1 \\ lcm(x,b0)=b1 \\ 求x个数 \] 根据$lcm$的求解方式$lcm(a,b)=a*b/gcd(a,b)$可以 ...
JavaScript获取星期几的几种方法
星期几的4种JS代码写法,有需要的朋友可以参考一下第一种写法代码如下: var str = ""; var week = new Date().getDay(); if ( ...
Linux下查看CPU信息
参考: Linux和Windows下查看cpu和core个数 Linux下查看CPU信息 1.查看完整CPU信息: $ cat /proc/cpuinfo 2.查看逻辑cpu个数: $ cat /p ...
HDU 2426 Interesting Housing Problem（二分图最佳匹配）
http://acm.hdu.edu.cn/showproblem.php?pid=2426 题意:每n个学生和m个房间,现在要为每个学生安排一个房间居住,每个学生对于一些房间有一些满意度,如果满意度 ...
《机器学习实战》之k-近邻算法（改进约会网站的配对效果）
示例背景: 我的朋友海伦一直使用在线约会网站寻找合适自己的约会对象.尽管约会网站会推荐不同的人选,但她并不是喜欢每一个人.经过一番总结,她发现曾交往过三种类型的人: (1)不喜欢的人: (2)魅力一般 ...
动态拼接SQL 语句
public T Get<T>(int id) { Type type = typeof(T); string columnStrings = string.Join(",&qu ...
_event_worldstate
EventId 事件ID ID WorldStateUI.dbc第10列数字部分 StartValue 起始值 Entry 更新世界状态需要击杀生物或摧毁物体的entry,正数为生物,负数为物体 St ...
Django中ORM简介与单表数据操作
一. ORM简介概念:.ORM框架是用于实现面向对象编程语言种不同类型系统的数据之间的转换构建模型的步骤:重点 (1).配置目标数据库信息,在seting.py中设置数据库信息 DATABASE ...
AjaxHandler
概要 AjaxHandler组件是在ASP.NET MVC Web应用程序中实现ajax功能的一系列扩展方法,该组件的最初的实现方法借鉴了网上流行的部分源代码, ,经过博主不断完善和改进后推出的比较成 ...
Oracle存储过程的异常处理
1.为了提高存储过程的健壮性,避免运行错误,当建立存储过程时应包含异常处理部分. 2.异常(EXCEPTION)是一种PL/SQL标识符,包括预定义异常.非预定义异常和自定义异常: 3.预定义异常是指 ...

『MXNet』第四弹_Gluon自定义层

一、不含参数层

二、含参数层

『MXNet』第四弹_Gluon自定义层的更多相关文章

随机推荐

热门专题