在前面的例子中，基本上都是将每一层的输出直接作为下一层的输入，这种网络称为前馈传播网络（feedforward neural network）。对于此类网络如果每次都写复杂的forward函数会有些麻烦，在此就有两种简化方式，ModuleList和Sequential。其中Sequential是一个特殊的module，它包含几个子Module，前向传播时会将输入一层接一层的传递下去。ModuleList也是一个特殊的module，可以包含几个子module，可以像用list一样使用它，但不能直接把输入传给ModuleList。下面举例说明。

一、nn.Sequential()对象

nn.Sequential()对象是类似keras的前馈模型的对象，可以为之添加层实现前馈神经网络。

1、模型建立方式

第一种写法：

nn.Sequential()对象.add_module(层名，层class的实例）

net1 = nn.Sequential()

net1.add_module('conv', nn.Conv2d(3, 3, 3))

net1.add_module('batchnorm', nn.BatchNorm2d(3))

net1.add_module('activation_layer', nn.ReLU())

第二种写法：

nn.Sequential(*多个层class的实例)

net2 = nn.Sequential(

        nn.Conv2d(3, 3, 3),

        nn.BatchNorm2d(3),

        nn.ReLU()

        )

第三种写法：

nn.Sequential(OrderedDict([*多个(层名，层class的实例)]))

from collections import OrderedDict

net3= nn.Sequential(OrderedDict([

          ('conv', nn.Conv2d(3, 3, 3)),

          ('batchnorm', nn.BatchNorm2d(3)),

          ('activation_layer', nn.ReLU())

        ]))

2、检查以及调用模型

查看模型

print对象即可

print('net1:', net1)

print('net2:', net2)

print('net3:', net3)

net1: Sequential(

  (conv): Conv2d (3, 3, kernel_size=(3, 3), stride=(1, 1))

  (batchnorm): BatchNorm2d(3, eps=1e-05, momentum=0.1, affine=True)

  (activation_layer): ReLU()

)

net2: Sequential(

  (0): Conv2d (3, 3, kernel_size=(3, 3), stride=(1, 1))

  (1): BatchNorm2d(3, eps=1e-05, momentum=0.1, affine=True)

  (2): ReLU()

)

net3: Sequential(

  (conv): Conv2d (3, 3, kernel_size=(3, 3), stride=(1, 1))

  (batchnorm): BatchNorm2d(3, eps=1e-05, momentum=0.1, affine=True)

  (activation_layer): ReLU()

)

提取子Module对象

# 可根据名字或序号取出子module

net1.conv, net2[0], net3.conv

(Conv2d (3, 3, kernel_size=(3, 3), stride=(1, 1)),

 Conv2d (3, 3, kernel_size=(3, 3), stride=(1, 1)),

 Conv2d (3, 3, kernel_size=(3, 3), stride=(1, 1)))

调用模型

可以直接网络对象(输入数据)，也可以使用上面的Module子对象分别传入(input)。

input = V(t.rand(1, 3, 4, 4))

output = net1(input)

output = net2(input)

output = net3(input)

output = net3.activation_layer(net1.batchnorm(net1.conv(input)))

二、nn.ModuleList()对象

ModuleList是Module的子类，当在Module中使用它的时候，就能自动识别为子module。

建立以及使用方法如下，

modellist = nn.ModuleList([nn.Linear(3,4), nn.ReLU(), nn.Linear(4,2)])

input = V(t.randn(1, 3))

for model in modellist:

    input = model(input)

# 下面会报错,因为modellist没有实现forward方法

# output = modelist(input)

和普通list不一样，它和torch的其他机制结合紧密，继承了nn.Module的网络模型class可以使用nn.ModuleList并识别其中的parameters，当然这只是个list，不会自动实现forward方法，

class MyModule(nn.Module):

    def __init__(self):

        super(MyModule, self).__init__()

        self.list = [nn.Linear(3, 4), nn.ReLU()]

        self.module_list = nn.ModuleList([nn.Conv2d(3, 3, 3), nn.ReLU()])

    def forward(self):

        pass

model = MyModule()

print(model)

MyModule(

  (module_list): ModuleList(

    (0): Conv2d (3, 3, kernel_size=(3, 3), stride=(1, 1))

    (1): ReLU()

  )

)

for name, param in model.named_parameters():

    print(name, param.size())

('module_list.0.weight', torch.Size([3, 3, 3, 3]))

('module_list.0.bias', torch.Size([3]))

可见，list中的子module并不能被主module所识别，而ModuleList中的子module能够被主module所识别。这意味着如果用list保存子module，将无法调整其参数，因其未加入到主module的参数中。

除ModuleList之外还有ParameterList，其是一个可以包含多个parameter的类list对象。在实际应用中，使用方式与ModuleList类似。如果在构造函数__init__中用到list、tuple、dict等对象时，一定要思考是否应该用ModuleList或ParameterList代替。

『PyTorch』第九弹_前馈网络简化写法的更多相关文章

『MXNet』第九弹_分类器以及迁移学习DEMO
解压文件命令: with zipfile.ZipFile('../data/kaggle_cifar10/' + fin, 'r') as zin: zin.extractall('../data/k ...
『TensorFlow』第九弹_图像预处理_不爱红妆爱武装
部分代码单独测试: 这里实践了图像大小调整的代码,值得注意的是格式问题: 输入输出图像时一定要使用uint8编码, 但是数据处理过程中TF会自动把编码方式调整为float32,所以输入时没问题,输出时 ...
『PyTorch』第二弹_张量
参考:http://www.jianshu.com/p/5ae644748f21# 几个数学概念: 标量(Scalar)是只有大小,没有方向的量,如1,2,3等向量(Vector)是有大小和方向的量 ...
『PyTorch』第一弹_静动态图构建if逻辑对比
对比TensorFlow和Pytorch的动静态图构建上的差异静态图框架设计好了不能够修改,且定义静态图时需要使用新的特殊语法,这也意味着图设定时无法使用if.while.for-loop等结构,而 ...
『PyTorch』第二弹重置_Tensor对象
『PyTorch』第二弹_张量 Tensor基础操作简单的初始化 import torch as t Tensor基础操作 # 构建张量空间,不初始化 x = t.Tensor(5,3) x -2. ...
『MXNet』第一弹_基础架构及API
MXNet是基础,Gluon是封装,两者犹如TensorFlow和Keras,不过得益于动态图机制,两者交互比TensorFlow和Keras要方便得多,其基础操作和pytorch极为相似,但是方便不 ...
『TensorFlow』第二弹_线性拟合&神经网络拟合_恰是故人归
Step1: 目标: 使用线性模拟器模拟指定的直线:y = 0.1*x + 0.3 代码: import tensorflow as tf import numpy as np import matp ...
『PyTorch』第四弹_通过LeNet初识pytorch神经网络_下
『PyTorch』第四弹_通过LeNet初识pytorch神经网络_上 # Author : Hellcat # Time : 2018/2/11 import torch as t import t ...
『PyTorch』第十二弹_nn.Module和nn.functional
大部分nn中的层class都有nn.function对应,其区别是: nn.Module实现的layer是由class Layer(nn.Module)定义的特殊类,会自动提取可学习参数nn.Para ...

随机推荐

python之路----钻石继承
钻石继承继承顺序 class A(object): def test(self): print('from A') class B(A): def test(self): print('from B ...
python中的property
提示:这篇博文参考了两个博客,第一篇博文地址为:https://www.cnblogs.com/Lambda721/p/6132206.html,另一篇博文地址如下:关于python的property ...
ELK学习笔记之Logstash和Filebeat解析对java异常堆栈下多行日志配置支持
0x00 概述 logstash官方最新文档.假设有几十台服务器,每台服务器要监控系统日志syslog.tomcat日志.nginx日志.mysql日志等等,监控OOM.内存低下进程被kill.ngi ...
pythoy的configparser模块
生成配置文件的模块 DEFAULT块,在以块为单位取块的值时,都会出现 import configparser config = configparser.ConfigParser() #相当于生成了 ...
（GO_GTD_3)基于OpenCV和QT，建立Android图像处理程序
一.解决权限问题图片采集了,处理了,如何保存?最直接的方法是使用imwrite,但是如果现在直接使用的话,比如会出现这样或那样的错误,因为我们现在是在android的环境下进行图像处理,所以 ...
20145302张薇《网络对抗技术》 web基础
20145302张薇 <网络对抗> web基础实验问题回答 1.什么是表单表单在网页中主要负责数据采集功能:一般网页上需要用户输入.选择的地方都会用到表单表单标签:即,用于确定表单所 ...
P4879 ycz的妹子
思路让你干啥你就干啥呗查询第x个妹子就get一下再修改这里稳一点就维护了三个东西,也许两个也可以代码 #include <iostream> #include <cstdio ...
[BZOJ4244]邮戳拉力赛
Description IOI铁路是由N+2个站点构成的直线线路.这条线路的车站从某一端的车站开始顺次标号为0...N+1. 这条路线上行驶的电车分为上行电车和下行电车两种,上行电车沿编号增大方向行驶 ...
java代码实现highchart与数据库数据结合完整案例分析（一）---饼状图
作者原创:转载请注明出处在做项目的过程中,经常会用到统计数据,同时会用到highchart或echart进行数据展示,highchart是外国开发的数据统计图插件, echart是我们国家开发的数据 ...
substring（）的用法和注意事项
作者原创:转载请注明出处 substring()方法的作用为截取字符串,其有两种用法: 分别如下: substring(int beginIndex);这个的作用为截取从beginindex位置处的元 ...

『PyTorch』第九弹_前馈网络简化写法