『PyTorch』第十四弹_torch.nn.Module类属性

nn.Module基类的构造函数：

def __init__(self):

    self._parameters = OrderedDict()

    self._modules = OrderedDict()

    self._buffers = OrderedDict()

    self._backward_hooks = OrderedDict()

    self._forward_hooks = OrderedDict()

    self.training = True

其中每个属性的解释如下：

_parameters：字典，保存用户直接设置的parameter，self.param1 = nn.Parameter(t.randn(3, 3))会被检测到，在字典中加入一个key为'param'，value为对应parameter的item。而self.submodule = nn.Linear(3, 4)中的parameter则不会存于此。
_modules：子module，通过self.submodel = nn.Linear(3, 4)指定的子module会保存于此。
_buffers：缓存。如batchnorm使用momentum机制，每次前向传播需用到上一次前向传播的结果。
_backward_hooks与_forward_hooks：钩子技术，用来提取中间变量，类似variable的hook。
training：BatchNorm与Dropout层在训练阶段和测试阶段中采取的策略不同，通过判断training值来决定前向传播策略。

上述几个属性中，_parameters、_modules和_buffers这三个字典中的键值，都可以通过self.key方式获得，效果等价于self._parameters['key'].

定义一个Module，这个Module即包含自己的Parameters有包含子Module及其Parameters，

import torch as t

from torch import nn

from torch.autograd import Variable as V

class Net(nn.Module):

    def __init__(self):

        super(Net, self).__init__()

        # 等价与self.register_parameter('param1' ,nn.Parameter(t.randn(3, 3)))

        self.param1 = nn.Parameter(t.rand(3, 3))

        self.submodel1 = nn.Linear(3, 4)

    def forward(self, input):

        x = self.param1.mm(input)

        x = self.submodel11(x)

        return x

net = Net()

`一、_modules`

# 打印网络对象的话会输出子module结构
print(net)
Net(

  (submodel1): Linear(in_features=3, out_features=4)

)
# ._modules输出的也是子module结构，不过数据结构和上面的有所不同
print(net.submodel1)
print(net._modules) # 字典子类
Linear(in_features=3, out_features=4)

OrderedDict([('submodel1', Linear(in_features=3, out_features=4))])
for name, submodel in net.named_modules():
print(name, submodel)
 Net(

  (submodel1): Linear(in_features=3, out_features=4)

)

submodel1 Linear(in_features=3, out_features=4)
print(list(net.named_modules())) # named_modules其实是包含了本层的module集合
[('', Net(

  (submodel1): Linear(in_features=3, out_features=4)

)), ('submodel1', Linear(in_features=3, out_features=4))]

`二、_parameters`

# ._parameters存储的也是这个结构
print(net.param1)
print(net._parameters) # 字典子类，仅仅包含直接定义的nn.Parameters参数
Parameter containing:

 0.6135  0.8082  0.4519

 0.9052  0.5929  0.2810

 0.6825  0.4437  0.3874

[torch.FloatTensor of size 3x3]

OrderedDict([('param1', Parameter containing:

 0.6135  0.8082  0.4519

 0.9052  0.5929  0.2810

 0.6825  0.4437  0.3874

[torch.FloatTensor of size 3x3]

)])
for name, param in net.named_parameters():
print(name, param.size())
param1 torch.Size([3, 3])

submodel1.weight torch.Size([4, 3])

submodel1.bias torch.Size([4])

`三、_buffers`

bn = nn.BatchNorm1d(2)

input = V(t.rand(3, 2), requires_grad=True)

output = bn(input)

bn._buffers

OrderedDict([('running_mean',

              1.00000e-02 *

                9.1559

                1.9914

              [torch.FloatTensor of size 2]), ('running_var',

               0.9003

               0.9019

              [torch.FloatTensor of size 2])])

`四、training`

input = V(t.arange(0, 12).view(3, 4))

model = nn.Dropout()

# 在训练阶段，会有一半左右的数被随机置为0

model(input)

Variable containing:

  0   2   4   0

  8  10   0   0

  0  18   0  22

[torch.FloatTensor of size 3x4]

model.training  = False

# 在测试阶段，dropout什么都不做

model(input)

Variable containing:

  0   1   2   3

  4   5   6   7

  8   9  10  11

[torch.FloatTensor of size 3x4]

Module.train()、Module.eval() 方法和 Module.training属性的关系

print(net.training, net.submodel1.training)

net.train() # 将本层及子层的training设定为True

net.eval() # 将本层及子层的training设定为False

net.training = True # 注意，对module的设置仅仅影响本层，子module不受影响

net.training, net.submodel1.training

True True

(True, False)

『PyTorch』第十四弹_torch.nn.Module类属性的更多相关文章

『PyTorch』第十五弹_torch.nn.Module的属性设置&查询
一.背景知识 python中两个属相相关方法 result = obj.name 会调用builtin函数getattr(obj,'name')查找对应属性,如果没有name属性则调用obj.__ge ...
『PyTorch』第十二弹_nn.Module和nn.functional
大部分nn中的层class都有nn.function对应,其区别是: nn.Module实现的layer是由class Layer(nn.Module)定义的特殊类,会自动提取可学习参数nn.Para ...
『PyTorch』第十六弹_hook技术
由于pytorch会自动舍弃图计算的中间结果,所以想要获取这些数值就需要使用钩子函数. 钩子函数包括Variable的钩子和nn.Module钩子,用法相似. 一.register_hook impo ...
『PyTorch』第十弹_循环神经网络
RNN基础: 『cs231n』作业3问题1选讲_通过代码理解RNN&图像标注训练 TensorFlow RNN: 『TensotFlow』基础RNN网络分类问题『TensotFlow』基础R ...
『MXNet』第十二弹_再谈新建计算节点
上一节我们已经谈到了计算节点,但是即使是官方文档介绍里面相关内容也过于简略,我们使用Faster-RCNN代码中的新建节点为例,重新介绍一下新建节点的调用栈. 1.调用新建节点参数分为三部分,op_ ...
『PyTorch』第四弹_通过LeNet初识pytorch神经网络_下
『PyTorch』第四弹_通过LeNet初识pytorch神经网络_上 # Author : Hellcat # Time : 2018/2/11 import torch as t import t ...
『PyTorch』第九弹_前馈网络简化写法
『PyTorch』第四弹_通过LeNet初识pytorch神经网络_上『PyTorch』第四弹_通过LeNet初识pytorch神经网络_下在前面的例子中,基本上都是将每一层的输出直接作为下一层的 ...
『PyTorch』第三弹重置_Variable对象
『PyTorch』第三弹_自动求导 torch.autograd.Variable是Autograd的核心类,它封装了Tensor,并整合了反向传播的相关实现 Varibale包含三个属性: data ...
『PyTorch』第二弹重置_Tensor对象
『PyTorch』第二弹_张量 Tensor基础操作简单的初始化 import torch as t Tensor基础操作 # 构建张量空间,不初始化 x = t.Tensor(5,3) x -2. ...

随机推荐

tomcat启动失败问题排除及解决办法 Server Tomcat v7.0 Server at localhost failed to start.
tomcat启动失败问题排除及解决办法 Server Tomcat v7.0 Server at localhost failed to start. 导致上面问题的原因可能有很多种,每种的解决办法都 ...
mysql5.7密码设置
mysql5.7版本引入了强制更改密码的举措,只能吐槽一句,shit!mysql5.7安装安装完mysql之后,mysql已经随机指定了一个初始化密码,可以在mysql的错误日志中找到初始化密码: c ...
scrapy运行方式
1,在cmd 命令行下执行 scrapy crawl demo (爬虫主逻辑的 name= 'demo '的名字) 2, 也可以在spider目录下添加一个py文件,加入以下代码 from scra ...
P4336 [SHOI2016]黑暗前的幻想乡
P4336 [SHOI2016]黑暗前的幻想乡矩阵树定理(高斯消元+乘法逆元)+容斥 ans=总方案数 -(公司1未参加方案数 ∪ 公司2未参加方案数 ∪ 公司3未参加方案数 ∪ ...... ∪ ...
JWT（Json web token）认证详解
JWT(Json web token)认证详解什么是JWT Json web token (JWT), 是为了在网络应用环境间传递声明而执行的一种基于JSON的开放标准((RFC 7519).该to ...
认识epoll
linux下的epoll(7)函数,其有着良好的就绪事件通知机制.Epoll 是被linux2.6开始引进的,但是不被其他的类UNIX系统支持,它提供了一种类似select或poll函数的机制:a. ...
自定义鼠标右键（层叠式菜单：cascading menu）(文件系统右键、文件夹系统右键和桌面鼠标右键)
转载:http://www.cnblogs.com/killerlegend/p/3575391.html 转载:http://www.cnblogs.com/shouce/p/5101001.htm ...
BZOJ 1503 郁闷的出纳员（splay）
题目链接:http://www.lydsy.com/JudgeOnline/problem.php?id=1503 题意:给出一个数列(初始为空),给出一个最小值Min,当数列中的数字小于Min时自动 ...
cmd命令分类
1.系统功能类 AT:计划在计算机上运行的命令和程序.ATTRIB:显示或更改文件属性.BREAK:设置或清除扩展式 CTRL+C 检查.CACLS:显示或修改文件的访问控制列表(ACLs).CALL ...
常用模块之hashlib,subprocess,logging,re,collections
hashlib 什么是hashlib 什么叫hash:hash是一种算法(3.x里代替了md5模块和sha模块,主要提供 SHA1, SHA224, SHA256, SHA384, SHA512 ,M ...

『PyTorch』第十四弹_torch.nn.Module类属性

一、_modules

二、_parameters

三、_buffers

四、training

Module.train()、Module.eval() 方法和 Module.training属性的关系

『PyTorch』第十四弹_torch.nn.Module类属性的更多相关文章

随机推荐

热门专题

`一、_modules`

`二、_parameters`

`三、_buffers`

`四、training`