Pytorch-卷积神经网络CNN之lenet5的Pytorch代码实现

先说一个小知识，助于理解代码中各个层之间维度是怎么变换的。

卷积函数：一般只用来改变输入数据的维度，例如3维到16维。

`Conv2d()`

Conv2d(in_channels:int,out_channels:int,kernel_size:Union[int,tuple],stride=1,padding=o):

"""

:param in_channels: 输入的维度

:param out_channels: 通过卷积核之后，要输出的维度

:param kernel_size: 卷积核大小

:param stride: 移动步长

:param padding: 四周添多少个零

"""

一个小例子：

import torch

import torch.nn

# 定义一个16张照片，每个照片3个通道，大小是28*28

x= torch.randn(16,3,32,32)

# 改变照片的维度，从3维升到16维，卷积核大小是5

conv= torch.nn.Conv2d(3,16,kernel_size=5,stride=1,padding=0)

res=conv(x)

print(res.shape)

# torch.Size([16, 16, 28, 28])

# 维度升到16维，因为卷积核大小是5，步长是1，所以照片的大小缩小了，变成28

卷积神经网络实战之Lenet5：

下面放一个示例图，代码中的过程就是根据示例图进行的

1.经过一个卷积层，从刚开始的[b,3,32,32]-->[b,6,28,28]
2.经过一个池化层，从[b,6,28,28]-->[b,6,14,14]
3.再经过一个卷积层，从[b,6,14,14]-->[b,16,10,10]
4.再经过一个池化层，从[b,16,10,10]-->[b,16,5,5]
5.经过三个个全连接层，将数据[b,16,5,5]-->[b,120]-->[b,84]-->[b,10]

Lenet5的构造如下：

Lenet5(

  (conv_unit): Sequential(

    (0): Conv2d(3, 6, kernel_size=(5, 5), stride=(1, 1))

    (1): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)

    (2): Conv2d(6, 16, kernel_size=(5, 5), stride=(1, 1))

    (3): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)

  )

  (fc_unit): Sequential(

    (0): Linear(in_features=400, out_features=120, bias=True)

    (1): ReLU()

    (2): Linear(in_features=120, out_features=84, bias=True)

    (3): ReLU()

    (4): Linear(in_features=84, out_features=10, bias=True)

  )

)

程序运行前，先启动visdom,如果没有配置好visdom环境的，先百度安装好visdom环境

1.使用快捷键win+r,在输入框输出cmd,然后在命令行窗口里输入python -m visdom.server，启动visdom

代码实战

定义一个名为lenet5.py的文件，代码如下

import torch

from torch import nn

import torch.optim

import torch.nn

from torch.nn import functional as F

class Lenet5(nn.Module):

    # for cifar10 dataset.

    def __init__(self):

        super(Lenet5, self).__init__()

        # 卷积层 Convolutional

        self.conv_unit = nn.Sequential(

            # x:[b,3,32,32]==>[b,6,28,28]

            nn.Conv2d(3, 6, kernel_size=5, stride=1, padding=0),

            # x:[b,6,28,28]==>[b,6,14,14]

            nn.MaxPool2d(kernel_size=2, stride=2, padding=0),

            #[b,6,14,14]==>[b,16,10,10]

            nn.Conv2d(6,16,kernel_size=5,stride=1,padding=0),

            # x:[b,16,10,10]==>[b,16,5,5]

            nn.MaxPool2d(kernel_size=2,stride=2,padding=0),

        )

        # 全连接层fully connected

        self.fc_unit=nn.Sequential(

            nn.Linear(16*5*5,120),

            nn.ReLU(),

            nn.Linear(120,84),

            nn.ReLU(),

            nn.Linear(84,10)

        )

    def forward(self,x):

        """

        :param x:[b,3,32,32]

        :return:

        """

        batchsz=x.size(0)

        # 卷积层池化层运算 [b,3,32,32]==>[b,16,5,5]

        x=self.conv_unit(x)

        # 对数据进行打平，方便后边全连接层进行运算[b,16,5,5]==>[b,16*5*5]

        x=x.view(batchsz,16*5*5)

        # 全连接层[b,16*5*5]==>[b,10]

        logits=self.fc_unit(x)

        return logits

        # loss=self.criteon(logits,y)

def main():

    net=Lenet5()

    # [b,3,32,32]

    temp = torch.randn(2, 3, 32, 32)

    out = net(temp)

    # [b,16,5,5]

    print("lenet_out:", out.shape)

if __name__ == '__main__':

    main()

定义一个名为main.py的文件，代码如下

import torch

from torchvision import datasets

from torchvision import transforms

from torch.utils.data import DataLoader

from torch import nn,optim

from visdom import Visdom

from lenet5 import  Lenet5

def main():

    batch_siz=32

    cifar_train = datasets.CIFAR10('cifar',True,transform=transforms.Compose([

        transforms.Resize((32,32)),

        transforms.ToTensor(),

        transforms.Normalize(mean=[0.485, 0.456, 0.406],

                             std=[0.229, 0.224, 0.225])

    ]),download=True)

    cifar_train=DataLoader(cifar_train,batch_size=batch_siz,shuffle=True)

    cifar_test = datasets.CIFAR10('cifar',False,transform=transforms.Compose([

        transforms.Resize((32,32)),

        transforms.ToTensor(),

        transforms.Normalize(mean=[0.485, 0.456, 0.406],

                             std=[0.229, 0.224, 0.225])

    ]),download=True)

    cifar_test=DataLoader(cifar_test,batch_size=batch_siz,shuffle=True)

    x,label = iter(cifar_train).next()

    print('x:',x.shape,'label:',label.shape)

    # 指定运行到cpu //GPU

    device=torch.device('cpu')

    model = Lenet5().to(device)

    # 调用损失函数use Cross Entropy loss交叉熵

    # 分类问题使用CrossEntropyLoss比MSELoss更合适

    criteon = nn.CrossEntropyLoss().to(device)

    # 定义一个优化器

    optimizer=optim.Adam(model.parameters(),lr=1e-3)

    print(model)

    viz=Visdom()

    viz.line([0.],[0.],win="loss",opts=dict(title='Lenet5 Loss'))

    viz.line([0.],[0.],win="acc",opts=dict(title='Lenet5 Acc'))

    # 训练train

    for epoch in range(1000):

        # 变成train模式

        model.train()

        # barchidx:下标，x:[b,3,32,32],label:[b]

        for barchidx,(x,label) in enumerate(cifar_train):

            # 将x，label放在gpu上

            x,label=x.to(device),label.to(device)

            # logits:[b,10]

            # label:[b]

            logits = model(x)

            loss = criteon(logits,label)

            # viz.line([loss.item()],[barchidx],win='loss',update='append')

            # backprop

            optimizer.zero_grad()

            loss.backward()

            optimizer.step()

        viz.line([loss.item()],[epoch],win='loss',update='append')

        print(epoch,'loss:',loss.item())

        # 变成测试模式

        model.eval()

        with torch.no_grad():

            #  测试test

            # 正确的数目

            total_correct=0

            total_num=0

            for x,label in cifar_test:

                # 将x，label放在gpu上

                x,label=x.to(device),label.to(device)

                # [b,10]

                logits=model(x)

                # [b]

                pred=logits.argmax(dim=1)

                # [b] = [b'] 统计相等个数

                total_correct+=pred.eq(label).float().sum().item()

                total_num+=x.size(0)

            acc=total_correct/total_num

            print(epoch,'acc:',acc)

            viz.line([acc],[epoch],win='acc',update='append')

            # viz.images(x.view(-1, 3, 32, 32), win='x')

if __name__ == '__main__':

    main()

测试结果

准确率刚开始是有一定的上升的，最高可达64%，后来准确率就慢慢的下降。

Pytorch-卷积神经网络CNN之lenet5的Pytorch代码实现的更多相关文章

写给程序员的机器学习入门 (八) - 卷积神经网络 (CNN) - 图片分类和验证码识别
这一篇将会介绍卷积神经网络 (CNN),CNN 模型非常适合用来进行图片相关的学习,例如图片分类和验证码识别,也可以配合其他模型实现 OCR. 使用 Python 处理图片在具体介绍 CNN 之前, ...
卷积神经网络CNN总结
从神经网络到卷积神经网络(CNN)我们知道神经网络的结构是这样的: 那卷积神经网络跟它是什么关系呢?其实卷积神经网络依旧是层级网络,只是层的功能和形式做了变化,可以说是传统神经网络的一个改进.比如下图 ...
卷积神经网络(CNN)学习笔记1：基础入门
卷积神经网络(CNN)学习笔记1:基础入门 Posted on 2016-03-01 | In Machine Learning | 9 Comments | 14935 Vie ...
深度学习之卷积神经网络CNN
转自:https://blog.csdn.net/cxmscb/article/details/71023576 一.CNN的引入在人工的全连接神经网络中,每相邻两层之间的每个神经元之间都是有边相连 ...
深度学习之卷积神经网络CNN及tensorflow代码实例
深度学习之卷积神经网络CNN及tensorflow代码实例什么是卷积? 卷积的定义从数学上讲,卷积就是一种运算,是我们学习高等数学之后,新接触的一种运算,因为涉及到积分.级数,所以看起来觉得很复杂 ...
深度学习之卷积神经网络CNN及tensorflow代码实现示例
深度学习之卷积神经网络CNN及tensorflow代码实现示例 2017年05月01日 13:28:21 cxmscb 阅读数 151413更多分类专栏: 机器学习深度学习机器学习版权声明 ...
卷积神经网络(CNN)前向传播算法
在卷积神经网络(CNN)模型结构中,我们对CNN的模型结构做了总结,这里我们就在CNN的模型基础上,看看CNN的前向传播算法是什么样子的.重点会和传统的DNN比较讨论. 1. 回顾CNN的结构在上一 ...
卷积神经网络(CNN)反向传播算法
在卷积神经网络(CNN)前向传播算法中,我们对CNN的前向传播算法做了总结,基于CNN前向传播算法的基础,我们下面就对CNN的反向传播算法做一个总结.在阅读本文前,建议先研究DNN的反向传播算法:深度 ...
【深度学习系列】手写数字识别卷积神经--卷积神经网络CNN原理详解(一)
上篇文章我们给出了用paddlepaddle来做手写数字识别的示例,并对网络结构进行到了调整,提高了识别的精度.有的同学表示不是很理解原理,为什么传统的机器学习算法,简单的神经网络(如多层感知机)都可 ...
深度学习之卷积神经网络(CNN)详解与代码实现（二）
用Tensorflow实现卷积神经网络(CNN) 本文系作者原创,转载请注明出处:https://www.cnblogs.com/further-further-further/p/10737065. ...

随机推荐

使用内网nginx代理rancher
需求: rancher 部署在 192.168.188.167服务器上控制台访问地址 https://192.168.188.167:8443 在本地只有192.168.80.111有权限访问, 需 ...
crc16校验C语言源码实例解析
一概念: 循环冗余码校验英文名称为Cyclical Redundancy Check,简称CRC.它是利用除法及余数的原理来作错误侦测(Error Detecting)的.实际应用时,发送装置计算出 ...
K8S容器环境下资源限制与jvm内存回收
一.k8s中的java资源限制与可能的问题与以前单机跑单服务的情况相比,在k8s.docker容器化环境下的宿主机内存.cpu相对更大,所以当运行java类程序的时候,就必然有必要对容器进行内存限制 ...
libwebsockets支持外部eventloop变更
早些年还在使用2.4+版本,现在最新版已经到4.1+,centos 7也使用3.+版本.对于使用外部eventloop相关的接口发生了大的变更.libev也应为早早对iouring支持,4+版本亲睐l ...
MapStructPlus 1.4.0 发布，体积更轻量！性能更强！
MapStruct Plus 是 MapStruct 的增强工具,在 Mapstruct 的基础上,实现了自动生成 Mapper 接口的功能,并强化了部分功能,使 Java 类型转换更加便捷.优雅. ...
3DCAT为3D应用在云端构筑一个可靠的家
保护知识产权,一直是数字化长期关注的议题,如何保护应用内的数字化资产(文字.图片.音频.视频.模型)等,是当今行业的难题,只要运行在Windows环境的三维应用,都可能面临被破解提取出资产,为原创版权 ...
重新启动mysql
liu@liu-virtual-machine:~$ ps aux|grep mysqld mysql 5252 0.2 4.5 1496516 181200 ? Sl 11:01 0:01 /usr ...
Numpy 模块常用函数速查表
序号方法说明 1 array(object[, dtype, copy, order, subok, ndmin]) 创建一个数组 2 asarray(a[, dtype, o ...
DynamicHead：基于像素级路由机制的动态FPN | NIPS 2020
论文提出了细粒度动态detection head,能够基于路由机制动态地融合不同FPN层的像素级局部特征进行更好的特征表达.从设计的路由空间来看是一个十分耗时的操作,但是作者设计的高效路由器实际计算十 ...

Pytorch-卷积神经网络CNN之lenet5的Pytorch代码实现

Conv2d()

卷积神经网络实战之Lenet5：

代码实战

测试结果

Pytorch-卷积神经网络CNN之lenet5的Pytorch代码实现的更多相关文章

随机推荐

热门专题

`Conv2d()`