卷积神经网络

在之前的文章里,对28 X 28的图像,我们是通过把它展开为长度为784的一维向量,然后送进全连接层,训练出一个分类模型.这样做主要有两个问题

图像在同一列邻近的像素在这个向量中可能相距较远。它们构成的模式可能难以被模型识别。
对于大尺寸的输入图像，使用全连接层容易造成模型过大。假设输入是高和宽均为1000像素的彩色照片（含3个通道）。即使全连接层输出个数仍是256，该层权重参数的形状是\(3,000,000\times 256\),按照参数为float,占用4字节计算,它占用了大约3000000 X 256 X4bytes=3000000kb=3000M=3G的内存或显存。

很显然,通过使用卷积操作可以有效的改善这两个问题.关于卷积操作,池化操作等,参见置顶文章https://www.cnblogs.com/sdu20112013/p/10149529.html．

LENET

lenet是比较早期提出来的一个神经网络,其结构如下图所示.

　

LeNet的结构比较简单,就是2次重复的卷积激活池化后面接三个全连接层.卷积层的卷积核用的5 X 5,池化用的窗口大小为2 X 2,步幅为2．

对我们的输入(28 x 28)来说,卷积层得到的输出shape为[batch,16,4,4],在送入全连接层前,要reshape成[batch,16x4x4].可以理解为通过卷积,对没一个样本,我们

都提取出来了16x4x4=256个特征.这些特征用来识别图像里的空间模式，比如线条和物体局部.

全连接层块含3个全连接层。它们的输出个数分别是120、84和10，其中10为输出的类别个数。

net0 = nn.Sequential(

        nn.Conv2d(1, 6, 5), # in_channels, out_channels, kernel_size

        nn.Sigmoid(),

        nn.MaxPool2d(2, 2), # kernel_size, stride

        nn.Conv2d(6, 16, 5),

        nn.Sigmoid(),

        nn.MaxPool2d(2, 2)

    )

batch_size=64

X = torch.randn((batch_size,1,28,28))

out=net0(X)

print(out.shape)

输出

torch.Size([64, 16, 4, 4])

这就是上面我们说的"对我们的输入(28 x 28)来说,卷积层得到的输出shape为[batch,16,4,4]"的由来.

模型定义

至此,我们可以给出LeNet的定义：

class LeNet(nn.Module):

    def __init__(self):

        super(LeNet, self).__init__()

        self.conv = nn.Sequential(

            nn.Conv2d(1, 6, 5), # in_channels, out_channels, kernel_size

            nn.Sigmoid(),

            nn.MaxPool2d(2, 2), # kernel_size, stride

            nn.Conv2d(6, 16, 5),

            nn.Sigmoid(),

            nn.MaxPool2d(2, 2)

        )

        self.fc = nn.Sequential(

            nn.Linear(16*4*4, 120),

            nn.Sigmoid(),

            nn.Linear(120, 84),

            nn.Sigmoid(),

            nn.Linear(84, 10)

        )

    def forward(self, img):

        feature = self.conv(img)

        output = self.fc(feature.view(img.shape[0], -1))

        return output

在forward()中,在输入全连接层之前,要先feature.view(img.shape[0], -1)做一次reshape.

我们用gpu来做训练,所以要把net的参数都存储在显存上:

net = LeNet().cuda()

数据加载

import torch

from torch import nn

import sys

sys.path.append("..")

import learntorch_utils

batch_size,num_workers=64,4

train_iter,test_iter = learntorch_utils.load_data(batch_size,num_workers)

load_data定义于learntorch_utils.py,如下:

def load_data(batch_size,num_workers):

    mnist_train = torchvision.datasets.FashionMNIST(root='/home/sc/disk/keepgoing/learn_pytorch/Datasets/FashionMNIST',

                                                    train=True, download=True,

                                                    transform=transforms.ToTensor())

    mnist_test = torchvision.datasets.FashionMNIST(root='/home/sc/disk/keepgoing/learn_pytorch/Datasets/FashionMNIST',

                                                train=False, download=True,

                                                transform=transforms.ToTensor())

    train_iter = torch.utils.data.DataLoader(

        mnist_train, batch_size=batch_size, shuffle=True, num_workers=num_workers)

    test_iter = torch.utils.data.DataLoader(

        mnist_test, batch_size=batch_size, shuffle=False, num_workers=num_workers)

    return train_iter,test_iter

定义损失函数

l = nn.CrossEntropyLoss()

定义优化器

opt = torch.optim.Adam(net.parameters(),lr=0.01)

定义评估函数

def test():

    acc_sum = 0

    batch = 0

    for X,y in test_iter:

        X,y = X.cuda(),y.cuda()

        y_hat = net(X)

        acc_sum += (y_hat.argmax(dim=1) == y).float().sum().item()

        batch += 1

    print('acc:%f' % (acc_sum/(batch*batch_size)))

训练

前向传播
计算loss
梯度清空,反向传播
更新参数

num_epochs=5

def train():

    for epoch in range(num_epochs):

        train_l_sum,batch=0,0

        for X,y in train_iter:

            X,y = X.cuda(),y.cuda() #把tensor放到显存

            y_hat = net(X)  #前向传播

            loss = l(y_hat,y) #计算loss,nn.CrossEntropyLoss中会有softmax的操作

            opt.zero_grad()#梯度清空

            loss.backward()#反向传播,求出梯度

            opt.step()#根据梯度,更新参数

            train_l_sum += loss.item()

            batch += 1

        print('epoch %d,train_loss %f' % (epoch + 1,train_l_sum/(batch*batch_size)))

        test()

输出如下:

epoch 1,train_loss 0.011750

acc:0.799064

epoch 2,train_loss 0.006442

acc:0.855195

epoch 3,train_loss 0.005401

acc:0.857584

epoch 4,train_loss 0.004946

acc:0.874602

epoch 5,train_loss 0.004631

acc:0.874403

从头学pytorch(十四):lenet的更多相关文章

从头学pytorch(十五):AlexNet
AlexNet AlexNet是2012年提出的一个模型,并且赢得了ImageNet图像识别挑战赛的冠军.首次证明了由计算机自动学习到的特征可以超越手工设计的特征,对计算机视觉的研究有着极其重要的意义 ...
从头学pytorch(十九):批量归一化batch normalization
批量归一化论文地址:https://arxiv.org/abs/1502.03167 批量归一化基本上是现在模型的标配了. 说实在的,到今天我也没搞明白batch normalize能够使得模型训练 ...
从头学pytorch(十二):模型保存和加载
模型读取和存储总结下来,就是几个函数 torch.load()/torch.save() 通过python的pickle完成序列化与反序列化.完成内存<-->磁盘转换. Module.s ...
从头学pytorch(十六):VGG NET
VGG AlexNet在Lenet的基础上增加了几个卷积层,改变了卷积核大小,每一层输出通道数目等,并且取得了很好的效果.但是并没有提出一个简单有效的思路. VGG做到了这一点,提出了可以通过重复使⽤ ...
从头学pytorch(十八):GoogLeNet
GoogLeNet GoogLeNet和vgg分别是2014的ImageNet挑战赛的冠亚军.GoogLeNet则做了更加大胆的网络结构尝试,虽然深度只有22层,但大小却比AlexNet和VGG小很多 ...
HDU 6467 简单数学题【递推公式 && O(1)优化乘法】（广东工业大学第十四届程序设计竞赛）
传送门:http://acm.hdu.edu.cn/showproblem.php?pid=6467 简单数学题 Time Limit: 4000/2000 MS (Java/Others) M ...
HDU 6464 免费送气球【权值线段树】（广东工业大学第十四届程序设计竞赛）
传送门:http://acm.hdu.edu.cn/showproblem.php?pid=6464 免费送气球 Time Limit: 2000/1000 MS (Java/Others) M ...
HDU 6470 Count 【矩阵快速幂】（广东工业大学第十四届程序设计竞赛）
题目传送门:http://acm.hdu.edu.cn/showproblem.php?pid=6470 Count Time Limit: 6000/3000 MS (Java/Others) ...
HDU 6467.简单数学题-数学题 (“字节跳动-文远知行杯”广东工业大学第十四届程序设计竞赛)
简单数学题 Time Limit: 4000/2000 MS (Java/Others) Memory Limit: 65536/65536 K (Java/Others)Total Submi ...

随机推荐

linux服务器时间更新
yum install ntpdate ntpdate ntp1.aliyun.com(阿里云服务器时间)
ansible api 通过python 方式调用
pip3 install ansible Linux下面安装 Windows 安装没成功 from ansible.parsing.dataloader import DataLoader #读取ya ...
supersocket实现你的命令
现在, 如果你有一个命令行协议的服务器实例 "IronPythonServer", 而且我们要用 Python 创建一个 "ADD" 命令用于让两个整数相加,然 ...
Hammersley-Clifford定理证明
Proof of Hammersley-Clifford TheoremProof of Hammersley-Clifford Theorem依赖知识定义1定义2证明过程反向证明(吉布斯分布=> ...
JVM堆内存管理与自定义分配参数详解
堆内存模型: 在Java中,堆被划分成两个不同的区域:新生代(Young),老年代(Old).而Permanent属于永久代(方法区),不属于堆内存.新生代又被分为了三个区域:Eden,from s ...
SELECT command denied to user 'username'@'ip' for table 'user'错误处理
错误信息使用RDS for MySQL,程序执行查询SQL时报错如下: SELECT command denied to user 'username'@'ip' for table 'user' ...
PowerShell 通过 WMI 获取系统安装软件
本文告诉大家如何通过 WMI 获取系统安装的软件通过 Win32_Product 可以获取系统安装的软件 Get-WmiObject Win32_Product | Format-List Capt ...
NI LabVIEW 编程规范
LabVIEW程序编写应该遵循哪些规范? 遵循这些规范有什么好处? 具体细节是什么? 针对上面三个问题一一解答: 一．LabVIEW程序编写应该遵循哪些规范? (1)前面板.后面板控件整齐,尽可能在一 ...
LeetCode 1 Two Sum——在数组上遍历出花样
本文始发于个人公众号:TechFlow 今天是周末,和大家一起来看一道算法题.这道题是大名鼎鼎的LeetCode的第一题,也是面试当中非常常见的一道面试题.题目不难,但是对于初学者来说应该还是很有 ...
Kafka2.4发布——新特性介绍（附Java Api Demo代码）
新功能允许消费者从最近的副本进行获取为 Consumer Rebalance Protocol 增加对增量协同重新均衡(incremental cooperative rebalancing)的支 ...

从头学pytorch(十四):lenet