参考：https://pytorch.org/tutorials/beginner/blitz/cifar10_tutorial.html#sphx-glr-beginner-blitz-cifar10-tutorial-py

TRAINING A CLASSIFIER

到这里，你已经知道怎么定义神经网络，计算损失和更新网络的权重

现在你应该考虑：

What about data?

通常，当你必须要处理一些图片、文本、音频或视频数据时，你可以使用标准的python包去下载数据到一个numpy数组中。然后你可以转换该数组为torch.*Tensor

对于图像，如Pillow、OpenCV这些包就很有用
对于音频，如scipy、librosa这些包
对于文本，要么是原始python，要么是基于下载的Cython,或者是NLTK和SpaCy也都很有用

尤其是对于视图，我们创建了一个名为torchvision的包，有着用于如Imagenet、CIFAR10、MNIST等普通数据库的数据下载器和用于图像的数据转换器,即torchvision.datasets和torch.utils.data.DataLoader

这提供了很大的便利，也防止编写样板代码

在这个教程中，我们将使用CIFAR10数据集，它有着 ‘airplane’, ‘automobile’, ‘bird’, ‘cat’, ‘deer’, ‘dog’, ‘frog’, ‘horse’, ‘ship’, ‘truck’等类别，下面是CIFAR-10中大小为3*32*32的图像,即32*32像素大小的3通道颜色的图像

Training an image classifier训练一个图像分类器

我们将会按顺序进行下面的操作：

1.使用torchvision下载和归一化训练和测试数据集

2.定义卷积神经网络

3.定义损失函数

4.在训练数据中训练网络

5.在测试数据中测试网络

1. Loading and normalizing CIFAR10

使用torchvision，它能很容易地去下载CIFAR10数据

import torch

import torchvision

import torchvision.transforms as transforms

torchvision数据集的输出是范围在[0,1]的PILImage图像。我们转换它们成有着标准化范围[-1,1]的张量

transform = transforms.Compose([

    transforms.ToTensor(),

    transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))

])

//获取训练数据

trainset = torchvision.datasets.CIFAR10(

    root='./data', #下载的数据存放的位置

    train=True, #说明下载的是训练数据而不是测试数据

    download=True, #确定要进行下载

    transform=transform #下载的数据要进行的格式转换

)

trainloader = torch.utils.data.DataLoader( #对数据进行批处理

    trainset,      #指明使用的数据集

    batch_size=,  #一批数据的大小，即一批数据有四张图片

    shuffle=True,  #是否随机打乱图片进行分批，是则为true

    num_workers=  #获取数据的线程为2

)

//获取测试数据

testset = torchvision.datasets.CIFAR10(root='./data', train=False,download=True, transform=transform)

testloader = torch.utils.data.DataLoader(testset, batch_size=,shuffle=False, num_workers=)

//指明数据的类别

classes = ('plane', 'car', 'bird', 'cat','deer', 'dog', 'frog', 'horse', 'ship', 'truck')

运行后首先进行数据的下载：

(deeplearning2) userdeMBP:classifier cifar user$ python cifar10_tutorial.py

Downloading https://www.cs.toronto.edu/~kriz/cifar-10-python.tar.gz to ./data/cifar-10-python.tar.gz

100.0%Files already downloaded and verified

下面展示一些训练图像：

import matplotlib.pyplot as plt

import numpy as np

# 用来展示图像的函数

def imshow(img):

    img = img /  + 0.5     # 非归一化

    npimg = img.numpy()

    plt.imshow(np.transpose(npimg, (, , ))) #是因为plt.imshow在显示时需要的输入是（imgsize,imgsieze,channels)，但是这里是（channels,imgsize,imgsieze)，所以需要将位置换换

    plt.show()

# 随机得到一些训练图像

dataiter = iter(trainloader) #生成迭代器

images, labels = dataiter.next() #每次运行next()就会调用trainloader，获得一个之前定义的batch_size=4的批处理图片集，即4张图片

# 展示图像

imshow(torchvision.utils.make_grid(images)) #make_grid的作用是将若干幅图像拼成一幅图像,在想要展示一批数据的时候十分有用

# 输出图像标签

print(' '.join('%5s' % classes[labels[j]] for j in range()))

然后点击关闭图片，就会继续向下运行，就能够得到预测的结果：

horse horse  bird   car

2. Define a Convolutional Neural Network定义一个卷积神经网络

从之前的神经网络部分复制神经网络，并修改其应用于3通道图片（而不是之前的1通道图片）

import torch.nn as nn

import torch.nn.functional as F

class Net(nn.Module): #自定义一个神经网络

    def __init__(self):

        super(Net, self).__init__() #声明继承

        self.conv1 = nn.Conv2d(, , ) #卷积层，参数为（inchannel,outchannel=number of filter,siza of filter,stride,padding）

        self.pool = nn.MaxPool2d(, )  #池化层

        self.conv2 = nn.Conv2d(, , ) #卷积层

        self.fc1 = nn.Linear( *  * , ) #全连接层

        self.fc2 = nn.Linear(, ) #全连接层

        self.fc3 = nn.Linear(, ) #全连接层，最后输出10个神经元，用于判断该图为哪个类别

    def forward(self, x): #实现前向传播

        x = self.pool(F.relu(self.conv1(x)))

        x = self.pool(F.relu(self.conv2(x)))

        x = x.view(-,  *  * ) #用来将x展平成16 *  * ，然后就可以进行下面的全连接层操作

        x = F.relu(self.fc1(x))

        x = F.relu(self.fc2(x))

        x = self.fc3(x)

        return x

net = Net()

3. Define a Loss function and optimizer定义一个损失函数和优化器

使用分类Cross-Entropy损失和带有动量的SGD优化

import torch.optim as optim

criterion = nn.CrossEntropyLoss()

optimizer = optim.SGD(net.parameters(), lr=0.001, momentum=0.9)

4. Train the network 训练网络

循环数据迭代，并输入到网络，然后进行优化

for epoch in range():  # 多次循环数据集，这里循环训练整个数据集两次

    running_loss = 0.0

    for i, data in enumerate(trainloader, ): #enumerate枚举数据并从下标0开始

        # 得到输入数据

        inputs, labels = data

        # 将参数的梯度都设为0

        optimizer.zero_grad()

        # forward + backward + optimize

        outputs = net(inputs) #forward

        loss = criterion(outputs, labels) #计算损失

        loss.backward() #后向传播

        optimizer.step() #将优化后的参数输入网络，再次进行训练

        #打印数据

        running_loss += loss.item() #用于从tensor中获取python数字

        if i %  == :    # 每处理2000次小批处理数据后打印一次结果

            print('[%d, %5d] loss: %.3f' %(epoch + , i + , running_loss / ))

            running_loss = 0.0 #然后清0

print('Finished Training')

然后返回输出为：

[,  ] loss: 2.195

[,  ] loss: 1.848

[,  ] loss: 1.654

[,  ] loss: 1.578

[, ] loss: 1.511

[, ] loss: 1.459

[,  ] loss: 1.382

[,  ] loss: 1.375

[,  ] loss: 1.344

[,  ] loss: 1.314

[, ] loss: 1.317

[, ] loss: 1.284

Finished Training

5. Test the network on the test data在测试数据中测试网络

我们对网络进行了两次遍历训练数据集的训练。但我们还是需要查看网络是否学习了所有的东西

我们将会通过预测神经网络输出的类型标签来检查它，并与事实相对照。如果预测是正确的，我们将样本添加到正确预测列表中。

好的,第一步，让我们从测试集中显示一个图像来熟悉它。

dataiter = iter(testloader)

images, labels = dataiter.next()

# 打印图片

imshow(torchvision.utils.make_grid(images))

print('GroundTruth: ', ' '.join('%5s' % classes[labels[j]] for j in range()))

然后出现四张图片：

然后点击关闭图片，就会返回实际该图片的标签：

('GroundTruth: ', '  cat  ship  ship plane')

然后让我们看看神经网络认为上面的例子是什么：

outputs = net(images)

输出是这10个类的能量。一个类的能量越高，网络越认为图像属于特定的类。所以，让我们得到最高能量的指数:

_, predicted = torch.max(outputs, )

print('Predicted: ', ' '.join('%5s' % classes[predicted[j]] for j in range()))

返回预测值：

('Predicted: ', '  cat plane truck plane')

让我们看看网络在整个数据集中表现得怎么样

correct =

total =

with torch.no_grad(): #设置为不计算梯度

    for data in testloader:

        images, labels = data

        outputs = net(images)

        _, predicted = torch.max(outputs.data, )

        total += labels.size()

        correct += (predicted == labels).sum().item() #相等

print('Accuracy of the network on the 10000 test images: %d %%' % ( * correct / total))

⚠️(predicted == labels).sum().item()作用：可见(predicted == labels).sum().item()作用

Accuracy of the network on the  test images:  %

这看起来比随机抽取10%的正确率(从10个类中随机抽取一个类)要好得多。看来网络学到了一些东西。
那么是哪些类执行得好，哪些类执行得不好呢？

class_correct = list(. for i in range())

class_total = list(. for i in range())

with torch.no_grad(): #设置在进行forward时不计算梯度

    for data in testloader:

        images, labels = data

        outputs = net(images)

        _, predicted = torch.max(outputs, )

        c = (predicted == labels).squeeze()

        for i in range():

            label = labels[i]

            class_correct[label] += c[i].item()

            class_total[label] += 

for i in range():

    print('Accuracy of %5s : %2d %%' % (

        classes[i],  * class_correct[i] / class_total[i]))

Accuracy of plane :  %

Accuracy of   car :  %

Accuracy of  bird :  %

Accuracy of   cat :  %

Accuracy of  deer :  %

Accuracy of   dog :  %

Accuracy of  frog :  %

Accuracy of horse :  %

Accuracy of  ship :  %

Accuracy of truck :  %

接下来就是设置运行在GPU上：

就像你把张量传输到GPU上一样，你把神经网络传输到GPU上。
让我们首先定义我们的设备为第一个可见的cuda设备，如果我们有cuda可用:

device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")

# Assuming that we are on a CUDA machine, this should print a CUDA device:

print(device)

因为我是在CPU上运行的，所以这里print(device)会返回cpu

本节的其余部分假设设备是CUDA设备。
然后这些方法递归遍历所有模块，将它们的参数和缓冲区转换为CUDA张量:

net.to(device)

记住，你必须在每一步都把输入和目标值的发送到GPU中：

inputs, labels = inputs.to(device), labels.to(device)

为什么我没有注意到GPU与CPU相比的巨大加速?因为你的网络实在是太小了。

练习:

尝试增加网络的宽度(即第一个nn.Conv2d卷积层的参数2)和第二个nn.Conv2d卷积层的参数1 — 他们需要相同的数字，看看你得到什么样的加速。
实现目标:

高层次地理解PyTorch张量库和神经网络。
训练一个小的神经网络对图像进行分类

pytorch例子学习——TRAINING A CLASSIFIER的更多相关文章

pytorch例子学习-DATA LOADING AND PROCESSING TUTORIAL
参考:https://pytorch.org/tutorials/beginner/data_loading_tutorial.html DATA LOADING AND PROCESSING TUT ...
PyTorch教程之Training a classifier
我们已经了解了如何定义神经网络,计算损失并对网络的权重进行更新. 接下来的问题就是: 一.What about data? 通常处理图像.文本.音频或视频数据时,可以使用标准的python包将数据加载 ...
pytorch例子学习——TRANSFER LEARNING TUTORIAL
参考:https://pytorch.org/tutorials/beginner/transfer_learning_tutorial.html 以下是两种主要的迁移学习场景微调convnet : ...
pytorch例子学习——NEURAL TRANSFER USING PYTORCH神经迁移
参考:https://pytorch.org/tutorials/advanced/neural_style_tutorial.html 具体的理论就不解释了,这里主要是解释代码: ⚠️使用的是pyt ...
训练一个图像分类器demo in PyTorch【学习笔记】
[学习源]Tutorials > Deep Learning with PyTorch: A 60 Minute Blitz > Training a Classifier 本文相当于 ...
PyTorch深度学习实践——反向传播
反向传播课程来源:PyTorch深度学习实践--河北工业大学 <PyTorch深度学习实践>完结合集_哔哩哔哩_bilibili 目录反向传播笔记作业笔记在之前课程中介绍的线性 ...
PyTorch深度学习实践——多分类问题
多分类问题目录多分类问题 Softmax 在Minist数据集上实现多分类问题作业课程来源:PyTorch深度学习实践--河北工业大学 <PyTorch深度学习实践>完结合集_哔哩 ...
PyTorch深度学习实践——处理多维特征的输入
处理多维特征的输入课程来源:PyTorch深度学习实践--河北工业大学 <PyTorch深度学习实践>完结合集_哔哩哔哩_bilibili 这一讲介绍输入为多维数据时的分类. 一个数据集 ...
数百个 HTML5 例子学习 HT 图形组件 – 3D建模篇
http://www.hightopo.com/demo/pipeline/index.html <数百个 HTML5 例子学习 HT 图形组件 – WebGL 3D 篇>里提到 HT 很 ...

随机推荐

C# 任务数据加载不影响其他操作
private void button1_Click(object sender, EventArgs e) { //this.timer1.Enabled = true; Task t1 = new ...
kubernetes认证和serviceaccount
Service Account 为 Pod 提供必要的身份认证.所有的 kubernetes 集群中账户分为两类,Kubernetes 管理的 serviceaccount(服务账户) 和 usera ...
51nod"省选"模测 A 树的双直径(树形dp)
题意题目链接 Sol 比赛结束后才调出来..不多说啥了,就是因为自己菜. 裸的up-down dp,维护一下一个点上下的直径就行,一开始还想了个假的思路写了半天.. 转移都在代码注释里毒瘤题目卡空 ...
MyBatis 返回主键
1,用于插入语句 2,传入对象 3,使用下面的属性即可 userGengratedKeys="true" keyProperty="orderId" keyCo ...
机器学习之EM算法（五）
摘要 EM算法全称为Expectation Maximization Algorithm,既最大期望算法.它是一种迭代的算法,用于含有隐变量的概率参数模型的最大似然估计和极大后验概率估计.EM算法经常 ...
Spring（mvc）思维导图
spring mvc简介与运行原理 Spring的模型-视图-控制器(MVC)框架是围绕一个DispatcherServlet来设计的,这个Servlet会把请求分发给各个处理器,并支持可配置的处理器 ...
Java笔记----字节流与字符的常见类型
字节流: InputStream |-- FileInputStream (基本文件流) |-- BufferedInputStream |-- DataInputStream |-- O ...
mssql 系统函数-字符串函数专题--字符串函数大全
mssql 系统函数字符串函数 substring 功能简介 mssql 系统函数字符串函数 stuff 功能简介 mssql 系统函数字符串函数 str 功能简介 mssql 系统函数字符串 ...
linux安装教程
一.安装准备工作虚拟机VMWARE10 镜像文件CentOs6.5 二.安装过程 1.启动VMWARE10,点击创建新的虚拟机. 2.选择典型安装即可 3.这里我们选择稍后再进行安装操作系统,因为这 ...
js 实现动态时间
<span id="timebox"></span> //承载时间的span $(function () { var o ...

pytorch例子学习——TRAINING A CLASSIFIER