pytorch 入门指南

两类深度学习框架的优缺点

动态图（PyTorch）

计算图的进行与代码的运行时同时进行的。

静态图（Tensorflow <2.0）

自建命名体系

自建时序控制

难以介入

使用深度学习框架的优点

GPU 加速  (cuda)

自动求导

常用网络层的API

PyTorch 的特点

支持 GPU

动态神经网络

Python 优先

命令式体验

轻松扩展

.Pytorch简介

Pytorch是Facebook 的 AI 研究团队发布了一个基于 Python的科学计算包，旨在服务两类场合：

替代numpy发挥GPU潜能(在线环境暂时不支持GPU)

一个提供了高度灵活性和效率的深度学习实验性平台

.Pytorch特点及优势

2.1 Pytorch特点

PyTorch 提供了运行在 GPU/CPU 之上、基础的张量操作库;

可以内置的神经网络库；

提供模型训练功能；

支持共享内存的多进程并发（multiprocessing ）库等；

2.2 Pytorch特点

处于机器学习第一大语言 Python 的生态圈之中，使得开发者能使用广大的 Python 库和软件；如 NumPy、SciPy 和 Cython（为了速度把 Python 编译成 C 语言）；

（最大优势）改进现有的神经网络，提供了更快速的方法——不需要从头重新构建整个网络，这是由于 PyTorch 采用了动态计算图（dynamic computational graph）结构，而不是大多数开源框架（TensorFlow、Caffe、CNTK、Theano 等）采用的静态计算图；

提供工具包，如torch 、torch.nn、torch.optim等；

.Pytorch常用工具包

torch ：类似 NumPy 的张量库，强 GPU 支持 ；

torch.autograd ：基于 tape 的自动区别库，支持 torch 之中的所有可区分张量运行；

torch.nn ：为最大化灵活性未涉及、与 autograd 深度整合的神经网络库；

torch.optim：与 torch.nn 一起使用的优化包，包含 SGD、RMSProp、LBFGS、Adam 等标准优化方式；

torch.multiprocessing： python 多进程并发，进程之间 torch Tensors 的内存共享；

torch.utils：数据载入器。具有训练器和其他便利功能；

torch.legacy(.nn/.optim) ：处于向后兼容性考虑，从 Torch 移植来的 legacy 代码；

pytorch 入门指南

1. pytorch 概述

pytorch是facebook 开发的torch（Lua语言）的python版本，于2017年引爆学术界
官方宣传pytorch侧重两类用户：numpy的gpu版、深度学习研究平台
pytorch使用动态图机制，相比于tensorflow最开始的静态图，更为灵活
当前pytorch支持的系统包括：win，linux，macos

2. pytorch基本库

常用的pytorch基本库主要包括：

torch：内含一些常用方法，与numpy比较像
torch.Tensor：内含一些操作tensor的方法，可通过tensor.xx()进行调用
torch.nn：内含一些常用模型，如rnn，cnn等
torch.nn.functional：内含一些常用方法，如sigmoid，softmax等
torch.optim：内含一些优化算法，如sgd，adam等
torch.utils.data：内含一些数据迭代方法

3. 基本操作

a. tensor操作

# 初始化空向量
torch.empty(3,4)

# 随机初始化数组
torch.rand(4,3)

# 初始化零向量
torch.zeros(4,3, dtype=torch.int)

# 从数据构建数组
x = torch.tensor([3,4],dtype=torch.float)
x = torch.IntTensor([3,4])

# 获取tensor的尺寸，元组
x.shape
x.size()

# _在方法中的意义：表示对自身的改变
x = torch.ones(3,4)
# 以下三个式子含义相同
x = x + x
x = torch.add(x, x)
x.add_(x)

# 索引,像操作numpy一样
x[:,1]

# 改变形状
x.view(-1)
x.view(4,3)

# 如果只包含一个元素值，获取
x = torch.randn(1)
x.item()

# 增加一维
input = torch.randn(32, 32)
input = input.unsqueeze(0)
input.size()

# tensor的data还是tensor，但是requires_grad=False
x.data.requires_grad

# 改变类型
x.type(torch.LongTensor)123456789101112131415161718192021222324252627282930313233343536373839404142434445

b. numpy 与 tensor的转换

# 转换, 共享内存
a= numpy.array([1,2,3])
a = torch.from_numpy(a)
a.numpy()1234

c. 调用gpu

# gpu是否可用
torch.cuda.is_available()
# 调用设备
device = torch.device('cpu') # cuda or cpu
a = torch.tensor([1,2,3], device='cuda') # 直接在gpu上创建
a = a.to(device) # 上传
a = a.to('cpu') # 上传, cpu or cuda
a = a.cuda() # 上传cuda12345678

d. 梯度

.requires_grad ，决定是否可微（梯度）
.backward(), 计算梯度；如果单独一个值则不需指定参数，否则需传入权重（尺寸与tensor的size同）
.grad, 用于存储梯度累计值。只有tensor有梯度值，计算节点没有
.detach(), 相当于新建了一个变量，历史的计算图无效
with torch.no_grad():, 评估模型时可用到，不计算梯度
.grad_fn, 节点是如何产生的；用户创造的tensor([1,2,3]).grad_fn 为None
.data(), tensor值，requires_grad=False

# 创建可微的tensor
x = torch.ones(2,3,requires_grad=True)

# 改变可微性
x.requires_grad_(False)

# 获得梯度值
x = torch.ones(2, 2, requires_grad=True)
y = x +2
z = y * y *3
out = torch.sum(z)
out.backward()
x.grad

# 无梯度，报错
with torch.no_grad():
    x = torch.ones(2, 2, requires_grad=True)
    y = x +2
    z = y * y *3
    out = torch.sum(z)
    out.backward()
    x.grad12345678910111213141516171819202122

e. 定义模型

两种定义方式

class定义
Sequential定义

# 通过class定义
class Net(nn.Module):
    def __init__(self):
        super(Net, self).__init__()
        # 下面通过实例变量的形式声明模型内需要学习的参数
        self.fc1 = nn.Linear(5, 10)
        self.fc2 = nn.Linear(10,20)

    def forward(self, x):
        # 下面定义计算图
        x = self.fc1(x)
        x = nn.functional.relu(x)
        x = self.fc2(x)
        return x
net = Net()

# 通过Sequential定义
net = Sequential(
    nn.Linear(5, 10),
    nn.Relu(),
    nn.Linear(10, 20)
)12345678910111213141516171819202122

f. 模型参数操作

# 获取模型参数
net.parameters() #可用for 迭代

# 模型内参数梯度清零
net.zero_grad()12345

g. 定义损失函数

loss = nn.CrossEntropyLoss()1

h. 定义优化算子

optimizer = optim.SGD(net.parameters(), lr=0.01)1

i. 训练

optimizer.zero_grad() # zero the gradient buffers
output = net(input)
loss = criterion(output, target)
loss.backward()
optimizer.step() 12345

j. 测试

# 测试
with torch.no_grad():
output = net(input)123

k. 保存与载入

# 模型
torch.save(net, file)
net = torch.load(file)

# 参数
torch.save(model.state_dict(), file)
net = Model()
net.load_state_dict(file)12345678

4. 一个完整的机器学习流程

数据
载入数据
数据处理
构建迭代器
模型
loss
optimizer
新建/载入模型
新建
载入
直接载入模型
载入参数
新建模型
载入模型参数（对于adam等优化器，其参数也需载入)
训练

batch训练

for i, batch in enumerate(dataloader):
     x_batch, y_batch = batch
     outputs = net(x_batch)
     loss = criterion(output, target)
     optimizer.zero_grad()
     loss.backward()
     optimizer.step()1234567
每隔一段时间，打印验证集loss
每隔一段时间，存储模型
测试

载入测试数据
数据处理
构建迭代器（可选）
放入模型，输出结果
计算accuracy

pytorch 入门指南的更多相关文章

NLP新手入门指南|北大-TANGENT
开源的学习资源:<NLP 新手入门指南>,项目作者为北京大学 TANGENT 实验室成员. 该指南主要提供了 NLP 学习入门引导.常见任务的开发实现.各大技术教程与文献的相关推荐等内容, ...
Web API 入门指南 - 闲话安全
Web API入门指南有些朋友回复问了些安全方面的问题,安全方面可以写的东西实在太多了,这里尽量围绕着Web API的安全性来展开,介绍一些安全的基本概念,常见安全隐患.相关的防御技巧以及Web AP ...
Vue.js 入门指南之“前传”（含sublime text 3 配置）
题记:关注Vue.js 很久了,但就是没有动手写过一行代码,今天准备入手,却发现自己比菜鸟还菜,于是四方寻找大牛指点,才终于找到了入门的“入门”,就算是“入门指南”的“前传”吧.此文献给跟我一样“白痴 ...
yii2实战教程之新手入门指南-简单博客管理系统
作者:白狼出处:http://www.manks.top/document/easy_blog_manage_system.html 本文版权归作者,欢迎转载,但未经作者同意必须保留此段声明,且在文 ...
【翻译】Fluent NHibernate介绍和入门指南
英文原文地址:https://github.com/jagregory/fluent-nhibernate/wiki/Getting-started 翻译原文地址:http://www.cnblogs ...
ASP.NET MVC 5 入门指南汇总
经过前一段时间的翻译和编辑,我们陆续发出12篇ASP.NET MVC 5的入门文章.其中大部分翻译自ASP.NET MVC 5 官方教程,由于本系列文章言简意赅,篇幅适中,从一个web网站示例开始讲解 ...
一起学微软Power BI系列-官方文档-入门指南(1)Power BI初步介绍
我们在前一篇文章微软新神器-Power BI,一个简单易用,还用得起的BI产品中,我们初步介绍了Power BI的基本知识.由于Power BI是去年开始微软新发布的一个产品,虽然已经可以企业级应用, ...
一起学微软Power BI系列-官方文档-入门指南(2)获取源数据
我们在文章: 一起学微软Power BI系列-官方文档-入门指南(1)Power BI初步介绍中,我们介绍了官方入门文档的第一章.今天继续给大家介绍官方文档中,如何获取数据源的相关内容.虽然是英文,但 ...
一起学微软Power BI系列-官方文档-入门指南(3)Power BI建模
我们前2篇文章:一起学微软Power BI系列-官方文档-入门指南(1)Power BI初步介绍和一起学微软Power BI系列-官方文档-入门指南(2)获取源数据中,我们介绍了官方入门文档与获取 ...

随机推荐

ps-使用通道抠图为XX换背景
第一步先载入图片点击通道,复制蓝色通道然后点击新的蓝色通道,图像-调整-曲线-改变输入输出, 然后用历史画笔全部填黑. 然后载入选区,复制.在图层中新建蒙版黏贴,反向(CTRL+I)就可以了. ...
7-MySQL高级-主从-1
1. 主从同步的定义主从同步使得数据可以从一个数据库服务器复制到其他服务器上,在复制数据时,一个服务器充当主服务器(master),其余的服务器充当从服务器(slave). 因为复制是异步进行的,所 ...
Activiti学习笔记8 — UserTask私有任务的使用
每一个UserTask都会在Execution表和Task表中各产生一条记录一.创建流程引擎对象 /** * 1.创建流程引擎对象 */ private ProcessEngine processE ...
CentOS 7 下配置 Nginx + PHP7.1 + MariaDB 以及 Laravel 框架
<!doctype html> CentOS 7 下配置 Nginx + PHP7.1 + MariaDB 以及 Laravel 框架.mdhtml {overflow-x: initia ...
C 自己实现strcpy，strcmp，strlen，strcat等函数
// mystrlen() 测试字符长度方法 int mystrlen(char *str) { int cnt = 0; char *p= str; while(*p++ != '\0') { cn ...
DataList做一个相册,并可以上传图片
1.前台代码 <%@ Page Language="C#" AutoEventWireup="true" CodeBehind="DataLis ...
offset系列属性
offset系列:获取元素的相关的样式属性的值 offsetwidth:获取元素的宽 offsetheight:获取元素的高 offsetleft:获取元素距离左边位置的值 offsettop;获取元 ...
leetcode-11-盛水最多的容器
题目描述: 方法一:双指针 class Solution: def maxArea(self, height: List[int]) -> int: left = 0 right = len(h ...
分享安装Apache、MySQL、PHP、LAMP的完整教程
Operation timed out after 30000 milliseconds with 0 out of -1 bytes received请注意,在Linux中输入密码时,不会显示您输入 ...
Vue+Iview+Node 登录demo
1.相关组件安装 axios iview js-cookie crypto-js 2.子父组件传值.监听窗体大小改变.记住密码 .自定义组件(事件 .props) created:实例已经创建完 ...

pytorch 入门指南

pytorch 入门指南的更多相关文章

随机推荐

热门专题