自定义layer

https://www.cnblogs.com/sdu20112013/p/12132786.html一文里说了怎么写自定义的模型.本篇说怎么自定义层.

分两种:

不含模型参数的layer
含模型参数的layer

核心都一样,自定义一个继承自nn.Module的类,在类的forward函数里实现该layer的计算,不同的是,带参数的layer需要用到nn.Parameter

不含模型参数的layer

直接继承nn.Module

import torch

from torch import nn

class CenteredLayer(nn.Module):

    def __init__(self, **kwargs):

        super(CenteredLayer, self).__init__(**kwargs)

    def forward(self, x):

        return x - x.mean()

layer = CenteredLayer()

layer(torch.tensor([1, 2, 3, 4, 5], dtype=torch.float))

net = nn.Sequential(nn.Linear(8, 128), CenteredLayer())

y = net(torch.rand(4, 8))

y.mean().item()

含模型参数的layer

Parameter
ParameterList
ParameterDict

Parameter类其实是Tensor的子类，如果一个Tensor是Parameter，那么它会自动被添加到模型的参数列表里。所以在自定义含模型参数的层时，我们应该将参数定义成Parameter，除了直接定义成Parameter类外，还可以使用ParameterList和ParameterDict分别定义参数的列表和字典。

ParameterList用法和list类似

class MyDense(nn.Module):

    def __init__(self):

        super(MyDense,self).__init__()

        self.params = nn.ParameterList([nn.Parameter(torch.randn(4,4)) for i in range(4)])

        self.params.append(nn.Parameter(torch.randn(4,1)))

    def forward(self,x):

        for i in range(len(self.params)):

            x = torch.mm(x,self.params[i])

        return x

net = MyDense()

print(net)

输出

MyDense(

  (params): ParameterList(

      (0): Parameter containing: [torch.FloatTensor of size 4x4]

      (1): Parameter containing: [torch.FloatTensor of size 4x4]

      (2): Parameter containing: [torch.FloatTensor of size 4x4]

      (3): Parameter containing: [torch.FloatTensor of size 4x4]

      (4): Parameter containing: [torch.FloatTensor of size 4x1]

  )

)

ParameterDict用法和python dict类似.也可以用.keys(),.items()

class MyDictDense(nn.Module):

    def __init__(self):

        super(MyDictDense, self).__init__()

        self.params = nn.ParameterDict({

                'linear1': nn.Parameter(torch.randn(4, 4)),

                'linear2': nn.Parameter(torch.randn(4, 1))

        })

        self.params.update({'linear3': nn.Parameter(torch.randn(4, 2))}) # 新增

    def forward(self, x, choice='linear1'):

        return torch.mm(x, self.params[choice])

net = MyDictDense()

print(net)

print(net.params.keys(),net.params.items())

x = torch.ones(1, 4)

net(x, 'linear1')

输出

MyDictDense(

  (params): ParameterDict(

      (linear1): Parameter containing: [torch.FloatTensor of size 4x4]

      (linear2): Parameter containing: [torch.FloatTensor of size 4x1]

      (linear3): Parameter containing: [torch.FloatTensor of size 4x2]

  )

)

odict_keys(['linear1', 'linear2', 'linear3']) odict_items([('linear1', Parameter containing:

tensor([[-0.2275, -1.0434, -1.6733, -1.8101],

        [ 1.7530,  0.0729, -0.2314, -1.9430],

        [-0.1399,  0.7093, -0.4628, -0.2244],

        [-1.6363,  1.2004,  1.4415, -0.1364]], requires_grad=True)), ('linear2', Parameter containing:

tensor([[ 0.5035],

        [-0.0171],

        [-0.8580],

        [-1.1064]], requires_grad=True)), ('linear3', Parameter containing:

tensor([[-1.2078,  0.4364],

        [-0.8203,  1.7443],

        [-1.7759,  2.1744],

        [-0.8799, -0.1479]], requires_grad=True))])

使用自定义的layer构造模型

layer1 = MyDense()

layer2 = MyDictDense()

net = nn.Sequential(layer2,layer1)

print(net)

print(net(x))

输出

Sequential(

  (0): MyDictDense(

    (params): ParameterDict(

        (linear1): Parameter containing: [torch.FloatTensor of size 4x4]

        (linear2): Parameter containing: [torch.FloatTensor of size 4x1]

        (linear3): Parameter containing: [torch.FloatTensor of size 4x2]

    )

  )

  (1): MyDense(

    (params): ParameterList(

        (0): Parameter containing: [torch.FloatTensor of size 4x4]

        (1): Parameter containing: [torch.FloatTensor of size 4x4]

        (2): Parameter containing: [torch.FloatTensor of size 4x4]

        (3): Parameter containing: [torch.FloatTensor of size 4x4]

        (4): Parameter containing: [torch.FloatTensor of size 4x1]

    )

  )

)

tensor([[-4.7566]], grad_fn=<MmBackward>)

从头学pytorch(十一):自定义层的更多相关文章

从头学pytorch(一):数据操作
跟着Dive-into-DL-PyTorch.pdf从头开始学pytorch,夯实基础． Tensor创建创建未初始化的tensor import torch x = torch.empty(5,3 ...
从头学pytorch(三) 线性回归
关于什么是线性回归,不多做介绍了.可以参考我以前的博客https://www.cnblogs.com/sdu20112013/p/10186516.html 实现线性回归分为以下几个部分: 生成数据 ...
从头学pytorch(九):模型构造
模型构造 nn.Module nn.Module是pytorch中提供的一个类,是所有神经网络模块的基类.我们自定义的模块要继承这个基类. import torch from torch import ...
从头学pytorch(六):权重衰减
深度学习中常常会存在过拟合现象,比如当训练数据过少时,训练得到的模型很可能在训练集上表现非常好,但是在测试集上表现不好. 应对过拟合,可以通过数据增强,增大训练集数量.我们这里先不介绍数据增强,先从模 ...
从头学pytorch(七):dropout防止过拟合
上一篇讲了防止过拟合的一种方式,权重衰减,也即在loss上加上一部分$\frac{\lambda}{2n} \|\boldsymbol{w}\|^2$,从而使得w不至于过大,即不过分偏向某个特征. ...
从头学pytorch(十二):模型保存和加载
模型读取和存储总结下来,就是几个函数 torch.load()/torch.save() 通过python的pickle完成序列化与反序列化.完成内存<-->磁盘转换. Module.s ...
从头学pytorch(十五):AlexNet
AlexNet AlexNet是2012年提出的一个模型,并且赢得了ImageNet图像识别挑战赛的冠军.首次证明了由计算机自动学习到的特征可以超越手工设计的特征,对计算机视觉的研究有着极其重要的意义 ...
从头学pytorch(十九):批量归一化batch normalization
批量归一化论文地址:https://arxiv.org/abs/1502.03167 批量归一化基本上是现在模型的标配了. 说实在的,到今天我也没搞明白batch normalize能够使得模型训练 ...
从头学pytorch(二十):残差网络resnet
残差网络ResNet resnet是何凯明大神在2015年提出的.并且获得了当年的ImageNet比赛的冠军. 残差网络具有里程碑的意义,为以后的网络设计提出了一个新的思路. googlenet的思路 ...

随机推荐

HZOJ Function
比较神仙的一道dp,考试的时候还以为是打表找规律啥的. 我们重新描述一下这道题:一个10 9 × n的网格,每个格子有一个权值,每一列格子的权值都是相同的.从一个起点开始,每次可以向上走一格或者向左上 ...
async/await运用-前端表单弹窗验证同步书写方式(React)
在前端项目中,我们经常会碰到这样的场景: 当前我们有一个表单需要填写,在完成表单填写后经过校验之后会弹出短信或者其他形式验证码,进行补充校验,然后一起提交给接口. 场景如下图: 当前为创建操作,编辑操 ...
[MySQL]获取当月每一天
常用使用场景: 统计某个月(某个时间区间)内每一天的数据量 select date_add(curdate(), interval(cast(help_topic_id as signed integ ...
ipykernel_launcher.py: error: unrecognized arguments: -f /Users/apple/Library/Jupyter/runtime/kernel
当在jupyter下使用parser.parse_args()出错则改换为parser.parse_known_args()[0]其效用是差不多的,至于为什么出现错误,我也不知道…
JavaScript 数组去重和对象相等判断
前几天电话面试问到了数组去重和两个对象相等判断,当时回答的不是特别好,都过去好几天了,总结下. 1.数组去重当时的问题是这样的有个简单的数组[1,1,2,3],去重后的结果是[1,2,3],怎么实现 ...
jq杂项方法/工具方法----trim() html() val() text() attr()
https://www.cnblogs.com/sandraryan/ $.trim() 函数用于去除字符串两端的空白字符.在中间的时候不会去掉. var str = ' 去除字符串左右两端的空格,换 ...
ajax上传文件基于jquery form表单上传文件
<script src="/static/js/jquery.js"></script><script> $("#reg-btn&qu ...
LRJ
//3-1 #define _CRT_SECURE_NO_WARNINGS #include <cstdio> int main() { int T; ]; scanf("%d& ...
JPA 一对多双向映射结果对象相互迭代造成堆栈溢出问题方法
问题: JPA 在双向映射时,会相互包含对方的实例,相互引用,造成递归迭代,堆栈溢出(java.lang.StackOverflowError). 分析: 在后端向前端传递的时候会将数据序列化,转为j ...
SQL2008 R2安装完成后开启services服务指引和 sa账号启用、数据类型

从头学pytorch(十一):自定义层

自定义layer

不含模型参数的layer

含模型参数的layer

从头学pytorch(十一):自定义层的更多相关文章

随机推荐

热门专题