神经网络架构PYTORCH－前馈神经网络

　　　首先要熟悉一下怎么使用PyTorch来实现前馈神经网络吧．为了方便理解，我们这里只拿只有一个隐藏层的前馈神经网络来举例：

一个前馈神经网络的源码和注释如下：比较简单，这里就不多介绍了．

 class NeuralNet(nn.Module):

     def __init__(self, input_size, hidden_size, num_classes):

         super(NeuralNet, self).__init__()

         self.fc1 = nn.Linear(input_size, hidden_size) //输入层

         self.relu = nn.ReLU()　//隐藏网络：elu的功能是将输入的feature的tensor所有的元素中如果小于零的就取零。

         self.fc2 = nn.Linear(hidden_size, num_classes) //输出层

     def forward(self, x):

         out = self.fc1(x)

         out = self.relu(out)

         out = self.fc2(out)

         return out

　　下面要看一下怎么调用和使用前馈神经网络的：为了提高运算效率，要把该网络优先使用GPU来进行运算．这里的输入尺寸和隐藏尺寸要和训练的图片保持一致的．

# Device configuration

device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')

model = NeuralNet(input_size, hidden_size, num_classes).to(device)

　　为了训练网络，都需要定义一个loss function来描述模型对问题的求解精度。loss越小，代表模型的结果和真实值偏差越小，这里使用CrossEntropyLoss()来计算．Adam，这是一种基于一阶梯度来优化随机目标函数的算法。详细的概念和推导我们后续再专门做分析．

criterion = nn.CrossEntropyLoss()　//针对单目标分类问题, 结合了 nn.LogSoftmax() 和 nn.NLLLoss() 来计算 loss.

optimizer = torch.optim.Adam(model.parameters(), lr=learning_rate) //优化器，设置学习的速度和使用的模型

　　接下来就是训练模型了，训练模型这部分是有点绕的，首先我们来看代码，后面再针对各个函数做说明：

 total_step = len(train_loader)

 for epoch in range(num_epochs):

     for i, (images, labels) in enumerate(train_loader):

         # Move tensors to the configured device

         images = images.reshape(-1, 28*28).to(device)

         labels = labels.to(device)

         # Forward pass

         outputs = model(images)

         loss = criterion(outputs, labels)　

         # Backward and optimize

         optimizer.zero_grad() //把梯度置零，也就是把loss关于weight的导数变成0.

         loss.backward()

         optimizer.step()

　　训练模型，首先把图片矩阵变换成25*25的矩阵单元．其次，把运算参数绑定到特定设备上．

　　然后就是网络的前向传播了：

outputs = model(inputs)

　　然后将输出的outputs和原来导入的labels作为loss函数的输入就可以得到损失了：

loss = criterion(outputs, labels)

　　计算得到loss后就要回传损失。要注意的是这是在训练的时候才会有的操作，测试时候只有forward过程。

loss.backward()

　　回传损失过程中会计算梯度，然后需要根据这些梯度更新参数，optimizer.step()就是用来更新参数的。optimizer.step()后，你就可以从optimizer.param_groups[0][‘params’]里面看到各个层的梯度和权值信息。

optimizer.step()

　　测试这个模型，没有梯度的模型，这样就大大大额减少了内存的使用量和运算效率，这个测试模型，其实只有一个关键的语句就可以预测模型了，那就是：_, predicted = torch.max(outputs.data, 1)．

with torch.no_grad():

correct = 0

total = 0

for images, labels in test_loader:

images = images.reshape(-1, 28*28).to(device)

labels = labels.to(device)

outputs = model(images)

_, predicted = torch.max(outputs.data, 1)

total += labels.size(0)

print(labels.size(0))

correct += (predicted == labels).sum().item()

　　这里有个问题．训练好的数据怎么和预测联系起来呢？
训练输出的outputs也是torch.autograd.Variable格式，得到输出后（网络的全连接层的输出）还希望能到到模型预测该样本属于哪个类别的信息，这里采用torch.max。torch.max()的第一个输入是tensor格式，所以用outputs.data而不是outputs作为输入；第二个参数1是代表dim的意思，也就是取每一行的最大值，其实就是我们常见的取概率最大的那个index；第三个参数loss也是torch.autograd.Variable格式。
　　总体源码：

 import torch

 import torch.nn as nn

 import torchvision

 import torchvision.transforms as transforms

 # Device configuration

 device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')

 # Hyper-parameters

 input_size = 784

 hidden_size = 500

 num_classes = 10

 #input_size = 84

 #hidden_size = 50

 #num_classes = 2

 num_epochs = 5

 batch_size = 100

 learning_rate = 0.001

 # MNIST dataset

 train_dataset = torchvision.datasets.MNIST(root='../../data',

                                            train=True,

                                            transform=transforms.ToTensor(),

                                            download=True)

 test_dataset = torchvision.datasets.MNIST(root='../../data',

                                           train=False,

                                           transform=transforms.ToTensor())

 # Data loader

 train_loader = torch.utils.data.DataLoader(dataset=train_dataset,

                                            batch_size=batch_size,

                                            shuffle=True)

 test_loader = torch.utils.data.DataLoader(dataset=test_dataset,

                                           batch_size=batch_size,

                                           shuffle=False)

 # Fully connected neural network with one hidden layer

 class NeuralNet(nn.Module):

     def __init__(self, input_size, hidden_size, num_classes):

         super(NeuralNet, self).__init__()

         self.fc1 = nn.Linear(input_size, hidden_size)

         self.relu = nn.ReLU()

         self.fc2 = nn.Linear(hidden_size, num_classes)

     def forward(self, x):

         out = self.fc1(x)

         out = self.relu(out)

         out = self.fc2(out)

         return out

 model = NeuralNet(input_size, hidden_size, num_classes).to(device)

 # Loss and optimizer

 criterion = nn.CrossEntropyLoss()

 optimizer = torch.optim.Adam(model.parameters(), lr=learning_rate)

 # Train the model

 total_step = len(train_loader)

 for epoch in range(num_epochs):

     for i, (images, labels) in enumerate(train_loader):

         # Move tensors to the configured device

         images = images.reshape(-1, 28*28).to(device)

         labels = labels.to(device)

         # Forward pass

         outputs = model(images)

         loss = criterion(outputs, labels)

         # Backward and optimize

         optimizer.zero_grad()

         loss.backward()

         optimizer.step()

         if (i+1) % 100 == 0:

             print ('Epoch [{}/{}], Step [{}/{}], Loss: {:.4f}'

                    .format(epoch+1, num_epochs, i+1, total_step, loss.item()))

 # Test the model

 # In test phase, we don't need to compute gradients (for memory efficiency)

 with torch.no_grad():

     correct = 0

     total = 0

     for images, labels in test_loader:

         images = images.reshape(-1, 28*28).to(device)

         labels = labels.to(device)

         outputs = model(images)

         _, predicted = torch.max(outputs.data, 1)

         total += labels.size(0)

         #print(predicted)

         correct += (predicted == labels).sum().item()

     print('Accuracy of the network on the 10000 test images: {} %'.format(100 * correct / total))

 # Save the model checkpoint

 torch.save(model.state_dict(), 'model.ckpt')

　　每日一言：人之所畏，不可不畏。

　　参考文档：

１　https://blog.csdn.net/fireflychh/article/details/75516165

２　https://blog.csdn.net/kgzhang/article/details/77479737

３　https://github.com/pytorch/tutorials

神经网络架构PYTORCH－前馈神经网络的更多相关文章

神经网络架构PYTORCH－几个概念
使用Pytorch之前,有几个概念需要弄清楚．什么是Tensors(张量)? 这个概念刚出来的时候,物理科班出身的我都感觉有点愣住了,好久没有接触过物理学的概念了．这个概念,在物理学中怎么解释呢? ...
Tensorflow系列专题（四）：神经网络篇之前馈神经网络综述
目录: 神经网络前言神经网络感知机模型多层神经网络激活函数 Logistic函数 Tanh函数 ReLu函数损失函数和输出单元损失函数的选择均方误差损失函数交叉熵损失函数输出单元的选 ...
神经网络架构PYTORCH－宏观分析
基本概念和功能: PyTorch是一个能够提供两种高级功能的python开发包,这两种高级功能分别是: 使用GPU做加速的矢量计算具有自动重放功能的深度神经网络从细的粒度来分,PyTorch是一个包 ...
神经网络架构PYTORCH－初相识（3W）
who? Python是基于Torch的一种使用Python作为开发语言的开源机器学习库．主要是应用领域是在自然语言的处理和图像的识别上．它主要的开发者是Facebook人工智能研究院(FAIR)团队 ...
神经网络架构pytorch－MSELoss损失函数
MSELoss损失函数中文名字就是:均方损失函数,公式如下所示: 这里 loss, x, y 的维度是一样的,可以是向量或者矩阵,i 是下标. 很多的 loss 函数都有 size_average 和 ...
深度学习基础-基于Numpy的多层前馈神经网络（FFN）的构建和反向传播训练
本文是深度学习入门: 基于Python的实现.神经网络与深度学习(NNDL)以及花书的读书笔记.本文将以多分类任务为例,介绍多层的前馈神经网络(Feed Forward Networks,FFN)加上 ...
怎样设计最优的卷积神经网络架构？| NAS原理剖析
虽然,深度学习在近几年发展迅速.但是,关于如何才能设计出最优的卷积神经网络架构这个问题仍在处于探索阶段. 其中一大部分原因是因为当前那些取得成功的神经网络的架构设计原理仍然是一个黑盒.虽然我们有着关于 ...
基于 PyTorch 和神经网络给 GirlFriend 制作漫画风头像
摘要:本文中我们介绍的 AnimeGAN 就是 GitHub 上一款爆火的二次元漫画风格迁移工具,可以实现快速的动画风格迁移. 本文分享自华为云社区<AnimeGANv2 照片动漫化:如何基于 ...
MINIST深度学习识别：python全连接神经网络和pytorch LeNet CNN网络训练实现及比较（三）
版权声明:本文为博主原创文章,欢迎转载,并请注明出处.联系方式:460356155@qq.com 在前两篇文章MINIST深度学习识别:python全连接神经网络和pytorch LeNet CNN网 ...

随机推荐

超简单的全新win10安装
1.准备工作! 这里说一下需要装系统的东西: 至少8G的U盘或内存卡一台Windows电脑在要安装的电脑上至少有16G的空间,最好至少64G. 2.现成电脑下载文件(已经有重装系统U盘跳过这一步) ...
table 的部分使用，固定行，固定列等
主要是用多张table表格实现 <!DOCTYPE html> <html lang="en"> <head> <meta charset ...
Java高级应用简笔
1. Annotation 使用范围: package, class, method, field 常用: @Override, @Deprecated, @SuppressWarnings 自定义注 ...
c语言01次作业--分支，顺序结构
C语言--第01次作业 1.1思维导图 1.2本章学习体会及代码量学习体会 1.2.1学习体会本章学习让我体会良多.首先,不得不承认自己是一个非常马虎的人.常见的问题就是输出格式上常因为没有与题目要 ...
win10与虚拟机fedora14使用samba文件共享
参考路径:http://blog.sina.com.cn/s/blog_ae9507be01017tyz.html 最近需要配置samba,试了好多次,终于搞定.奉上配置及共享文件的过程,以供参考. ...
洛谷[LnOI2019]长脖子鹿省选模拟赛简要题解
传送门听说比赛的时候T4T4T4标程锅了??? WTF换我时间我要写T3啊于是在T4T4T4调半天无果的情况下260pts260pts260pts收场真的是tcltcltcl. T1 快速多项式变 ...
temp--内蒙农信出差
============================2018.09.18~~~20181001================================== -------住宿----黎明花 ...
Ubuntu搭建Anki服务器
Ubuntu搭建Anki服务器第一步安装Anki 阿里云的服务器,xshell远程登录上 #以root用户进行操作 #安装Akni服务 easy_install AnkiServer #添加名为an ...
配置wildfly10为linux的服务，并开机启动
1.在opt路径下下载 wildfly ,并解压下载下的压缩包 cd /opt sudo wget -c http://download.jboss.org/wildfly/10.0.0.Final ...
最近一个dish项目的建设思考
系统通用能力的沉淀:a.核心模型的数据沉淀 b.通用服务能力的沉淀 ps1:以前重心主要放在了业务的抽象和通过设计模式来增加可复用的扩展性.局限在于,抽象的范围会被单个业务或者当前的业务所束缚,在更大 ...

神经网络架构PYTORCH－前馈神经网络

神经网络架构PYTORCH－前馈神经网络的更多相关文章

随机推荐

热门专题