PyTorch入门-CIFAR10图像分类

CIFAR10数据集下载

CIFAR10数据集包含10个类别，图像尺寸为 3×32×32

官方下载地址很慢，这里给一个百度云：

https://pan.baidu.com/s/1oTvW8wNa-VOjhn0WE5Vmiw 提取码: me8s

下载后在项目目录新建一个data目录解压进去

导入相关包

import torch

import torch.nn as nn

import torch.optim as optim

import torchvision

import torchvision.transforms as transforms

import time

import copy

MINI_BATCH = 8      # 数据集的图片数量很大，无法一次性加载所有数据，所以一次加载一个mini-batch的图片

DEVICE = torch.device('cuda:0' if torch.cuda.is_available() else 'cpu')     # GPU可用则使用GPU

使用torchvision加载并且归一化训练和测试数据集

CIFAR10数据集的输出是范围在[0,1]之间的PILImage，我们将它转换并归一化范围在[-1,1]之间的Tensor：

# ToTensor(): 将ndarrray格式的图像转换为Tensor张量

# Normalize(mean, std) mean：每个通道颜色平均值，这里的平均值为0.5，私人数据集自己计算；std：每个通道颜色标准偏差，(原始数据 - mean) / std 得到归一化后的数据

transform = transforms.Compose([transforms.ToTensor(), transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))])

数据加载器：

# 训练数据加载

trainset = torchvision.datasets.CIFAR10(root='./data', train=True, download=False, transform=transform)

trainloader = torch.utils.data.DataLoader(trainset, batch_size=MINI_BATCH, shuffle=True, num_workers=4)

# 测试数据加载

testset = torchvision.datasets.CIFAR10(root='./data', train=False, download=False, transform=transform)

testloader = torch.utils.data.DataLoader(testset, batch_size=MINI_BATCH, shuffle=False, num_workers=4)

定义卷积神经网络

我们实现一个简单的神经网络 LeNet-5来进行分类：

这个网络具有两个卷积层，两个池化层，三个全连接层，原网络用于手写数字识别，输入为灰度图，这里我们输入图像是RGB所以修改输入数据为 3×32×32 的Tensorr数据，输出数据维度为 1*10 ，表示图片属于10个类别的概率，图中数据维度变化说明：

二维卷积层输出大小 out = (in - F + 2P) / S + 1 ，其中：

F：卷积核大小 F×F

P： Padding，默认为0

S：步长Stride，默认为1

如图中第一层卷积层 (32 - 5) / 1 + 1 = 28
池化层输出大小 out = (in - F) / S + 1 ，其中：

F：池化窗口大小 F×F

S：池化窗口移动的步长Stride，默认和池化窗口维度相同

如图中第二层池化层 (28 - 2) / 2 + 1 = 14

这部分可以写成一个独立的文件，在训练代码中引入此文件中的网络结构：

# net.py

import torch

import torch.nn as nn

import torch.nn.functional as F

class Net(nn.Module):

    def __init__(self):

        super(Net, self).__init__()

        self.conv1 = nn.Conv2d(3, 6, 5)				# 卷积层：3通道到6通道，卷积5*5

        self.conv2 = nn.Conv2d(6, 16, 5)			# 卷积层：6通道到16通道，卷积5*5

        self.pool = nn.MaxPool2d(2, 2)				# 池化层，在2*2窗口上进行下采样

		# 三个全连接层 ：16*5*5 -> 120 -> 84 -> 10

        self.fc1 = nn.Linear(16 * 5 * 5, 120)

        self.fc2 = nn.Linear(120, 84)

        self.fc3 = nn.Linear(84, 10)

	# 定义数据流向

    def forward(self, x):

        x = F.relu(self.conv1(x))        # F.relu 是一个常用的激活函数

        x = self.pool(x)

        x = F.relu(self.conv2(x))

        x = self.pool(x)

        x = x.view(-1, 16 * 5 * 5)			# 变换数据维度为 1*(16*5*5)，-1表示根据后面推测

        x = F.relu(self.fc1(x))

        x = F.relu(self.fc2(x))

        x = self.fc3(x)

        return x

定义一个通用的训练函数，得到最优参数

def train(model, criterion, optimizer, epochs):

    since = time.time()

    best_acc = 0.0      # 记录模型测试时的最高准确率

    best_model_wts = copy.deepcopy(model.state_dict())  # 记录模型测试出的最佳参数

    for epoch in range(epochs):

        print('-' * 30)

        print('Epoch {}/{}'.format(epoch+1, epochs))

        # 训练模型

        running_loss = 0.0

        for i, data in enumerate(trainloader):

            inputs, labels = data

            inputs, labels = inputs.to(DEVICE), labels.to(DEVICE)

            # 前向传播，计算损失

            outputs = net(inputs)

            loss = criterion(outputs, labels)

            # 反向传播+优化

            optimizer.zero_grad()

            loss.backward()

            optimizer.step()

            running_loss += loss.item()

            # 每1000批图片打印训练数据

            if (i != 0) and (i % 1000 == 0):

                print('step: {:d},  loss: {:.3f}'.format(i, running_loss/1000))

                running_loss = 0.0

        # 每个epoch以测试数据的整体准确率为标准测试一下模型

        correct = 0

        total = 0

        with torch.no_grad():

            for data in testloader:

                images, labels = data

                images, labels = images.to(DEVICE), labels.to(DEVICE)

                outputs = net(images)

                _, predicted = torch.max(outputs.data, 1)

                total += labels.size(0)

                correct += (predicted == labels).sum().item()

        acc = correct / total

        if acc > best_acc:      # 当前准确率更高时更新

            best_acc = acc

            best_model_wts = copy.deepcopy(model.state_dict())

    time_elapsed = time.time() - since

    print('-' * 30)

    print('训练用时： {:.0f}m {:.0f}s'.format(time_elapsed//60, time_elapsed%60))

    print('最高准确率: {}%'.format(100 * best_acc))

    # 返回测试出的最佳模型

    model.load_state_dict(best_model_wts)

    return model

定义好损失函数和优化器后训练模型

from net import Net

net = Net()

net.to(DEVICE)

# 使用分类交叉熵 Cross-Entropy 作损失函数，动量SGD做优化器

criterion = nn.CrossEntropyLoss()

optimizer = optim.SGD(net.parameters(), lr=0.001, momentum=0.9)

# 训练10个epoch

net = train(net, criterion, optimizer, 10)

# 保存模型参数

torch.save(net.state_dict(), 'net_dict.pt')

测试模型

# 图像类别

classes = ('plane', 'car', 'bird', 'cat', 'deer', 'dog', 'frog', 'horse', 'ship', 'truck')

net = Net()

net.load_state_dict(torch.load('net_dict.pt'))  # 加载各层参数

net.to(DEVICE)

# 整体正确率

correct = 0

total = 0

with torch.no_grad():

    for data in testloader:

        images, labels = data

        images, labels = images.to(DEVICE), labels.to(DEVICE)

        outputs = net(images)

        _, predicted = torch.max(outputs.data, 1)

        total += labels.size(0)

        correct += (predicted == labels).sum().item()

print('整体准确率: {}%'.format(100 * correct / total))

print('=' * 30)

# 每一个类别的正确率

class_correct = list(0. for i in range(10))

class_total = list(0. for i in range(10))

with torch.no_grad():

    for data in testloader:

        images, labels = data

        if torch.cuda.is_available():

            images, labels = images.cuda(), labels.cuda()

        outputs = net(images)

        _, predicted = torch.max(outputs, 1)

        c = (predicted == labels).squeeze()

        for i in range(labels.size(0)):

            label = labels[i]

            class_correct[label] += c[i].item()

            class_total[label] += 1

for i in range(10):

    print('{}的准确率 : {:.2f}%'.format(classes[i], 100 * class_correct[i] / class_total[i]))

模型对测试集图片的一些预测结果

import matplotlib.pyplot as plt

import numpy as np

# 定义一个显示图片的函数

def imshow(img):

    # 输入数据：torch.tensor[c, h, w]

    img = img * 0.5 + 0.5     # 反归一

    npimg = np.transpose(img.numpy(), (1, 2, 0))    # [c, h, w] -> [h, w, c]

    plt.imshow(npimg)

    plt.show()

# 取一批图片

testdata = iter(testloader)

images, labels = testdata.next()

imshow(torchvision.utils.make_grid(images))

print('真实类别: ', ' '.join('{}'.format(classes[labels[j]]) for j in range(labels.size(0))))

# 预测是10个标签的权重，一个类别的权重越大，神经网络越认为它是这个类别，所以输出最高权重的标签。

outputs = net(images)

_, predicted = torch.max(outputs, 1)

print('预测结果: ', ' '.join('{}'.format(classes[predicted[j]]) for j in range(labels.size(0))))

PyTorch入门-CIFAR10图像分类的更多相关文章

Pytorch和CNN图像分类
Pytorch和CNN图像分类 PyTorch是一个基于Torch的Python开源机器学习库,用于自然语言处理等应用程序.它主要由Facebookd的人工智能小组开发,不仅能够实现强大的GPU加速 ...
Theano入门——CIFAR-10和CIFAR-100数据集
Theano入门——CIFAR-10和CIFAR-100数据集 1.CIFAR-10数据集介绍 CIFAR-10数据集包含60000个32*32的彩色图像,共有10类.有50000个训练图像和1000 ...
Pytorch入门上 —— Dataset、Tensorboard、Transforms、Dataloader
本节内容参照小土堆的pytorch入门视频教程.学习时建议多读源码,通过源码中的注释可以快速弄清楚类或函数的作用以及输入输出类型. Dataset 借用Dataset可以快速访问深度学习需要的数据,例 ...
Pytorch入门中 —— 搭建网络模型
本节内容参照小土堆的pytorch入门视频教程,主要通过查询文档的方式讲解如何搭建卷积神经网络.学习时要学会查询文档,这样会比直接搜索良莠不齐的博客更快.更可靠.讲解的内容主要是pytorch核心包中 ...
Pytorch入门下 —— 其他
本节内容参照小土堆的pytorch入门视频教程. 现有模型使用和修改 pytorch框架提供了很多现有模型,其中torchvision.models包中有很多关于视觉(图像)领域的模型,如下图: 下面 ...
[pytorch] Pytorch入门
Pytorch入门简单容易上手,感觉比keras好理解多了,和mxnet很像(似乎mxnet有点借鉴pytorch),记一记. 直接从例子开始学,基础知识咱已经看了很多论文了... import t ...
Pytorch入门随手记
Pytorch入门随手记什么是Pytorch? Pytorch是Torch到Python上的移植(Torch原本是用Lua语言编写的) 是一个动态的过程,数据和图是一起建立的. tensor.dot ...
pytorch 入门指南
两类深度学习框架的优缺点动态图(PyTorch) 计算图的进行与代码的运行时同时进行的. 静态图(Tensorflow <2.0) 自建命名体系自建时序控制难以介入使用深度学习框架的优点 ...
超简单！pytorch入门教程（五）：训练和测试CNN
我们按照超简单!pytorch入门教程(四):准备图片数据集准备好了图片数据以后,就来训练一下识别这10类图片的cnn神经网络吧. 按照超简单!pytorch入门教程(三):构造一个小型CNN构建好一 ...

随机推荐

痞子衡嵌入式：MCUXpresso IDE下使用J-Link下载算法在Flash调试注意事项(i.MXRT500为例)
大家好,我是痞子衡,是正经搞技术的痞子.今天痞子衡给大家介绍的是MCUXpresso IDE下使用J-Link下载算法在Flash调试注意事项. 痞子衡前段时间写过一篇小文<为i.MXRT设计更 ...
4.28 省选模拟赛负环倍增矩阵乘法 dp
容易想到这个环一定是简单环. 考虑如果是复杂环那么显然对于其中的第一个简单环来说要么其权值为负如果为正没必要走一圈走一部分即可. 对于前者显然可以找到更小的对于第二部分是递归定义的. 综 ...
【新生学习】第二周：卷积神经网络_part_1
DEADLINE: 2020-08-01 22:00 写在最前面: 本周学习的是卷积神经网络,是本课程重点中的重点,大家务必要熟练掌握. 本周的学习任务包括视频学习 . 代码练习 .论文讲解三部分 ...
ubuntu18.04右键怎么添加新建空白文本文件
安装好ubuntu18.04发现右键菜单中没有新建空白文件了,这样工作的时候需要创建文本文件就不是很方便了,这里我们就可以通过以下的方式把新建空白文件添加到右键解决办法: 1.打开文件夹,在用户主目 ...
map,reduce和filter函数
numArray = [1, 2, 3, 4, 5] def ercifang(x): return x ** 2 def map_test(func, numArray): li = [] for ...
SkyWalking APM8.1.0 搭建与项目集成使用
SkyWalking介绍 SkyWalking是什么? SkyWalking是一个可观测性分析平台和应用性能管理系统,提供分布式跟踪.服务网格遥测分析.度量聚合和可视化一体化解决方案,并支持多种开发语 ...
解决 SQLException: Value '0000-00-00 00:00:00' can not be represented as java.sql.Timestamp的问题
连接数据库时设置:zeroDateTimeBehavior=convertToNull
JVM初探（三）：类加载机制
一.概述我们知道java代码会被编译为.class文件,这里class文件中的类信息最终还是需要jvm加载以后才能使用. 事实上,虚拟机把描述类的数据从Class文件加载到内存,并对数据进行校验,转 ...
JQuery的turn.js实现翻书效果
前言: hello大家好~好久没更博了……今天来和大家分享下JQ的turn.js,下面我先来简单介绍下我们今天的主角turn.js. Turn.js是一个JavaScript库,它集合了HTML5的所 ...
java 用集合完成随机点名器和库存管理案例
一随机点名器 1.案例需求随机点名器,即在全班同学中随机的找出一名同学,打印这名同学的个人信息. 我们来完成随机点名器,它具备以下3个内容: 存储所有同学姓名总览全班同学姓名随机点名其中一人, ...