[深度学习] pytorch学习笔记（4）(Module类、实现Flatten类、Module类作用、数据增强)

一、继承nn.Module类并自定义层

我们要利用pytorch提供的很多便利的方法，则需要将很多自定义操作封装成nn.Module类。

首先，简单实现一个Mylinear类：

from torch import nn

# Mylinear继承Module

class Mylinear(nn.Module):

    # 传入输入维度和输出维度

    def __init__(self,in_d,out_d):

        # 调用父类构造函数

        super(Mylinear,self).__init__()

        # 使用Parameter类将w和b封装，这样可以通过nn.Module直接管理，并提供给优化器优化

        self.w = nn.Parameter(torch.randn(out_d,in_d))

        self.b = nn.Parameter(torch.randn(out_d))

    # 实现forward函数，该函数为默认执行的函数，即计算过程，并将输出返回

    def forward(self, x):

        x = x@self.w.t() + self.b

        return x

这样就可以将我们自定义的Mylinear加入整个网络：

# 网络结构

class MLP(nn.Module):

    def __init__(self):

        super(MLP, self).__init__()

        self.model = nn.Sequential(

            #nn.Linear(784, 200),

            Mylinear(784,200),

            nn.BatchNorm1d(200, eps=1e-8),

            nn.LeakyReLU(inplace=True),

            #nn.Linear(200, 200),

            Mylinear(200, 200),

            nn.BatchNorm1d(200, eps=1e-8),

            nn.LeakyReLU(inplace=True),

            #nn.Linear(200, 10),

            Mylinear(200,10),

            nn.LeakyReLU(inplace=True)

        )

我们可以看出，MLP网络实际上也是继承自Module，这就说明了，nn.Module实际上可以实现一个嵌套的结构，我们的整个网络就是由一个嵌套的树形结构组成的。例如：

# Mylinear继承Module

class Mylinear(nn.Module):

    # 传入输入维度和输出维度

    def __init__(self, in_d, out_d):

        # 调用父类构造函数

        super(Mylinear, self).__init__()

        # 使用Parameter类将w和b封装，这样可以通过nn.Module直接管理，并提供给优化器优化

        self.w = nn.Parameter(torch.randn(out_d, in_d))

        self.b = nn.Parameter(torch.randn(out_d))

    # 实现forward函数，该函数为默认执行的函数，即计算过程，并将输出返回

    def forward(self, x):

        x = x @ self.w.t() + self.b

        return x

# 将几个nn.Module组件综合成一个

class Mylayer(nn.Module):

    def __init__(self, in_d, out_d):

        super(Mylayer, self).__init__()

        # 包含一个全连接层，一个BN层，一个Leaky Relu层

        self.lin = Mylinear(in_d, out_d)

        self.bn = nn.BatchNorm1d(out_d, eps=1e-8)

        self.lrelu = nn.LeakyReLU(inplace=True)

    # 按顺序跑一遍3种网络，返回最终结果

    def forward(self, x):

        x = self.lin(x)

        x = self.bn(x)

        x = self.lrelu(x)

        return x

# 网络结构

class MLP(nn.Module):

    def __init__(self):

        super(MLP, self).__init__()

        self.model = nn.Sequential(

            Mylayer(784, 200),

            Mylayer(200, 200),

            # nn.Linear(200, 10),

            Mylinear(200, 10),

            nn.LeakyReLU(inplace=True)

        )

上述代表表示的结构如下图所示：

其中所有的类都继承自nn.Module，从前往后是嵌套的关系。在上述代码中，真正做计算的是橙色部分1-8，而其他的都只是作为封装。其中nn.Sequential、nn.BatchNorm1d、nn.LeakyReLU是pytorch提供的类，Mylinear和Mylayer是我们自己封装的类。

二、实现一个常用类Flatten类

Flatten就是将2D的特征图压扁为1D的特征向量，用于全连接层的输入。

# Flatten继承Module

class Flatten(nn.Module):

    # 构造函数，没有什么要做的

    def __init__(self):

        # 调用父类构造函数

        super(Flatten, self).__init__()

    # 实现forward函数

    def forward(self, input):

        # 保存batch维度，后面的维度全部压平，例如输入是28*28的特征图，压平后为784的向量

        return input.view(input.size(0), -1)

三、nn.Module类的作用

1.便于保存模型：

# 每隔N epoch保存一次模型

torch.save(net.state_dict(),'ckpt_n_epoch.mdl')

# 下次训练时可以直接导入接着训练

net.load_state_dict(torch.load('ckpt_n_epoch.mdl'))

2.方便切换train和val模式

### 不同模式对于某些层的操作时不同的，例如BN，dropout层等

# 切换到train模式

net.train()

# 切换到validation模式

net.eval()

3.方便将网络转移到GPU上

# 定义GPU设备

device = torch.device('cuda')

# 将网络转移到GPU，注意to函数返回的是net的引用（引用是不变的）

# 不同的是net中的参数都转移到GPU上去了

net.to(device)

# 不同于参数直接转移，转移后的w2(在GPU上)和转移前的w(在CPU上)两者完全是不一样的

# 我们要使之在GPU上运行，则必须使用w2

#w2 = w.to(device)

4.方便查看各层参数

# 获取由每一层参数组成的列表

para_list = list(net.parameters())

# 获取一个(name,每层参数)的tuple组成的列表

para_named_list = list(net.named_parameters())

# 获取一个{'model.0.weight': 参数,'model.0.bias': 参数, 'model.1.weight': 参数}

para_named_dict = dict(net.named_parameters())

四、数据增强

torchvision提供了很方便的数据预处理工具，数据增强可以一次性搞定。

from torchvision import datasets, transforms

train_data_trans = datasets.MNIST('../data', train=True, download=True,

                            transform=transforms.Compose([

                                # 水平翻转，50%执行

                                transforms.RandomHorizontalFlip(),

                                # 垂直翻转，50%执行

                                transforms.RandomVerticalFlip(),

                                # 随机旋转范围在正负15°之间，也可以写(-15,15)

                                transforms.RandomRotation(15),

                                # 旋转范围在90-270之间

                                #transforms.RandomRotation([90,270]),

                                # 将图片方缩放到指定大小

                                transforms.Resize([32,32]),

                                # 随机剪裁图片到指定大小

                                transforms.RandomCrop([28,28]),

                                transforms.ToTensor(),

                                transforms.Normalize((0.1307,), (0.3081,))

                            ]))

如果pytorch没有提供需要的预处理类，我们可以参照源码仿造写一个自定义处理的类来进行处理。例如对图片添加白噪声，按通道变换颜色等等。