两类深度学习框架的优缺点

动态图(PyTorch)
计算图的进行与代码的运行时同时进行的。
静态图(Tensorflow <2.0) 自建命名体系
自建时序控制
难以介入 使用深度学习框架的优点 GPU 加速 (cuda)
自动求导
常用网络层的API PyTorch 的特点 支持 GPU
动态神经网络
Python 优先
命令式体验
轻松扩展
.Pytorch简介
Pytorch是Facebook 的 AI 研究团队发布了一个基于 Python的科学计算包,旨在服务两类场合: 替代numpy发挥GPU潜能(在线环境暂时不支持GPU)
一个提供了高度灵活性和效率的深度学习实验性平台
.Pytorch特点及优势
2.1 Pytorch特点
PyTorch 提供了运行在 GPU/CPU 之上、基础的张量操作库;
可以内置的神经网络库;
提供模型训练功能;
支持共享内存的多进程并发(multiprocessing )库等;
2.2 Pytorch特点
处于机器学习第一大语言 Python 的生态圈之中,使得开发者能使用广大的 Python 库和软件;如 NumPy、SciPy 和 Cython(为了速度把 Python 编译成 C 语言);
(最大优势)改进现有的神经网络,提供了更快速的方法——不需要从头重新构建整个网络,这是由于 PyTorch 采用了动态计算图(dynamic computational graph)结构,而不是大多数开源框架(TensorFlow、Caffe、CNTK、Theano 等)采用的静态计算图;
提供工具包,如torch 、torch.nn、torch.optim等;
.Pytorch常用工具包
torch :类似 NumPy 的张量库,强 GPU 支持 ;
torch.autograd :基于 tape 的自动区别库,支持 torch 之中的所有可区分张量运行;
torch.nn :为最大化灵活性未涉及、与 autograd 深度整合的神经网络库;
torch.optim:与 torch.nn 一起使用的优化包,包含 SGD、RMSProp、LBFGS、Adam 等标准优化方式;
torch.multiprocessing: python 多进程并发,进程之间 torch Tensors 的内存共享;
torch.utils:数据载入器。具有训练器和其他便利功能;
torch.legacy(.nn/.optim) :处于向后兼容性考虑,从 Torch 移植来的 legacy 代码;
pytorch 入门指南
 
1. pytorch 概述
pytorch是facebook 开发的torch(Lua语言)的python版本,于2017年引爆学术界
官方宣传pytorch侧重两类用户:numpy的gpu版、深度学习研究平台
pytorch使用动态图机制,相比于tensorflow最开始的静态图,更为灵活
当前pytorch支持的系统包括:win,linux,macos
 
2. pytorch基本库
常用的pytorch基本库主要包括:
torch: 内含一些常用方法,与numpy比较像
torch.Tensor:内含一些操作tensor的方法,可通过tensor.xx()进行调用
torch.nn:内含一些常用模型,如rnn,cnn等
torch.nn.functional:内含一些常用方法,如sigmoid,softmax等
torch.optim:内含一些优化算法,如sgd,adam等
torch.utils.data:内含一些数据迭代方法
3. 基本操作
 
a. tensor操作
 
# 初始化空向量
torch.empty(3,4)
# 随机初始化数组
torch.rand(4,3)
# 初始化零向量
torch.zeros(4,3, dtype=torch.int)
# 从数据构建数组
x = torch.tensor([3,4],dtype=torch.float)
x = torch.IntTensor([3,4])
# 获取tensor的尺寸,元组
x.shape
x.size()
# _在方法中的意义:表示对自身的改变
x = torch.ones(3,4)
# 以下三个式子 含义相同
x = x + x
x = torch.add(x, x)
x.add_(x)
# 索引,像操作numpy一样
x[:,1]
# 改变形状
x.view(-1)
x.view(4,3)
# 如果只包含一个元素值,获取
x = torch.randn(1)
x.item()
# 增加一维
input = torch.randn(32, 32)
input = input.unsqueeze(0)
input.size()
# tensor的data还是tensor,但是requires_grad=False
x.data.requires_grad
# 改变类型
x.type(torch.LongTensor)123456789101112131415161718192021222324252627282930313233343536373839404142434445
 
b. numpy 与 tensor的转换
 
# 转换, 共享内存
a= numpy.array([1,2,3])
a = torch.from_numpy(a)
a.numpy()1234
 
c. 调用gpu
 
# gpu是否可用
torch.cuda.is_available()
# 调用设备
device = torch.device('cpu') # cuda or cpu
a = torch.tensor([1,2,3], device='cuda')  # 直接在gpu上创建
a = a.to(device) # 上传
a = a.to('cpu') # 上传, cpu or cuda
a = a.cuda()  # 上传cuda12345678
 
d. 梯度
.requires_grad ,决定是否可微(梯度)
.backward(), 计算梯度;如果单独一个值则不需指定参数,否则需传入权重(尺寸与tensor的size同)
.grad, 用于存储梯度累计值。 只有tensor有梯度值,计算节点没有
.detach(), 相当于新建了一个变量,历史的计算图无效
with torch.no_grad():, 评估模型时可用到,不计算梯度
.grad_fn, 节点是如何产生的;用户创造的tensor([1,2,3]).grad_fn 为None
.data(), tensor值,requires_grad=False
 
# 创建可微的tensor
x = torch.ones(2,3,requires_grad=True)
# 改变可微性
x.requires_grad_(False)
# 获得梯度值
x = torch.ones(2, 2, requires_grad=True)
y = x +2
z = y * y *3
out = torch.sum(z)
out.backward()
x.grad
# 无梯度, 报错
with torch.no_grad():
    x = torch.ones(2, 2, requires_grad=True)
    y = x +2
    z = y * y *3
    out = torch.sum(z)
    out.backward()
    x.grad12345678910111213141516171819202122
 
e. 定义模型
两种定义方式
class定义
Sequential定义
# 通过class定义
class Net(nn.Module):
    def __init__(self):
        super(Net, self).__init__()
        # 下面通过实例变量的形式声明模型内需要学习的参数
        self.fc1 = nn.Linear(5, 10)
        self.fc2 = nn.Linear(10,20)
    def forward(self, x):
        # 下面定义计算图
        x = self.fc1(x)
        x = nn.functional.relu(x)
        x = self.fc2(x)
        return x
net = Net()
# 通过Sequential定义
net = Sequential(
    nn.Linear(5, 10),
    nn.Relu(),
    nn.Linear(10, 20)
)12345678910111213141516171819202122
 
f. 模型参数操作
 
# 获取模型参数
net.parameters() #可用for 迭代
# 模型内参数梯度清零
net.zero_grad()12345
 
g. 定义损失函数
 
loss = nn.CrossEntropyLoss()1
 
h. 定义优化算子
 
optimizer = optim.SGD(net.parameters(), lr=0.01)1
 
i. 训练
 
optimizer.zero_grad()   # zero the gradient buffers
output = net(input)
loss = criterion(output, target)
loss.backward()
optimizer.step() 12345
 
j. 测试
 
# 测试
with torch.no_grad():
    output = net(input)123
 
k. 保存与载入
 
# 模型
torch.save(net, file)
net = torch.load(file)
# 参数
torch.save(model.state_dict(), file)
net = Model()
net.load_state_dict(file)12345678
 
4. 一个完整的机器学习流程
数据
载入数据
数据处理
构建迭代器
模型
loss
optimizer
新建/载入模型
新建
载入
直接载入模型
载入参数
新建模型
载入模型参数(对于adam等优化器,其参数也需载入)
训练
batch训练
for i, batch in enumerate(dataloader):
     x_batch, y_batch = batch
     outputs = net(x_batch)
     loss = criterion(output, target)
     optimizer.zero_grad()
     loss.backward()
     optimizer.step()1234567
每隔一段时间,打印验证集loss
每隔一段时间,存储模型
测试
载入测试数据
数据处理
构建迭代器(可选)
放入模型,输出结果
计算accuracy

pytorch 入门指南的更多相关文章

  1. NLP新手入门指南|北大-TANGENT

    开源的学习资源:<NLP 新手入门指南>,项目作者为北京大学 TANGENT 实验室成员. 该指南主要提供了 NLP 学习入门引导.常见任务的开发实现.各大技术教程与文献的相关推荐等内容, ...

  2. Web API 入门指南 - 闲话安全

    Web API入门指南有些朋友回复问了些安全方面的问题,安全方面可以写的东西实在太多了,这里尽量围绕着Web API的安全性来展开,介绍一些安全的基本概念,常见安全隐患.相关的防御技巧以及Web AP ...

  3. Vue.js 入门指南之“前传”(含sublime text 3 配置)

    题记:关注Vue.js 很久了,但就是没有动手写过一行代码,今天准备入手,却发现自己比菜鸟还菜,于是四方寻找大牛指点,才终于找到了入门的“入门”,就算是“入门指南”的“前传”吧.此文献给跟我一样“白痴 ...

  4. yii2实战教程之新手入门指南-简单博客管理系统

    作者:白狼 出处:http://www.manks.top/document/easy_blog_manage_system.html 本文版权归作者,欢迎转载,但未经作者同意必须保留此段声明,且在文 ...

  5. 【翻译】Fluent NHibernate介绍和入门指南

    英文原文地址:https://github.com/jagregory/fluent-nhibernate/wiki/Getting-started 翻译原文地址:http://www.cnblogs ...

  6. ASP.NET MVC 5 入门指南汇总

    经过前一段时间的翻译和编辑,我们陆续发出12篇ASP.NET MVC 5的入门文章.其中大部分翻译自ASP.NET MVC 5 官方教程,由于本系列文章言简意赅,篇幅适中,从一个web网站示例开始讲解 ...

  7. 一起学微软Power BI系列-官方文档-入门指南(1)Power BI初步介绍

    我们在前一篇文章微软新神器-Power BI,一个简单易用,还用得起的BI产品中,我们初步介绍了Power BI的基本知识.由于Power BI是去年开始微软新发布的一个产品,虽然已经可以企业级应用, ...

  8. 一起学微软Power BI系列-官方文档-入门指南(2)获取源数据

    我们在文章: 一起学微软Power BI系列-官方文档-入门指南(1)Power BI初步介绍中,我们介绍了官方入门文档的第一章.今天继续给大家介绍官方文档中,如何获取数据源的相关内容.虽然是英文,但 ...

  9. 一起学微软Power BI系列-官方文档-入门指南(3)Power BI建模

    我们前2篇文章:一起学微软Power BI系列-官方文档-入门指南(1)Power BI初步介绍 和一起学微软Power BI系列-官方文档-入门指南(2)获取源数据 中,我们介绍了官方入门文档与获取 ...

随机推荐

  1. Metasploit 如何使用Exploits(漏洞)

    在Metasploit中选择一个漏洞利用程序将'exploit'和'check'命令添加到msfconsole. msf > use exploit/windows/smb/ms09_050_s ...

  2. 剑指offer——26树的子结构

    题目描述 输入两棵二叉树A,B,判断B是不是A的子结构.(ps:我们约定空树不是任意一个树的子结构)   题解: 注意,所谓的子结构,是树的形状和值相同,并非判断B是不是A的一部分[如果是这样,那就是 ...

  3. python3没有urllib2 出现报错:语法错误

    我的代码:import sklearn.datasets bug: 法错误. 我的原因:Python3运行的时候的运行了你下载的urllib2.py文件,而这个文件是不属于Python3的. 解决办法 ...

  4. IOS中input光标跑偏问题的解决方法

    ios端兼容input光标高度处理 在最近的项目中遇到一个问题,input输入框光标,在安卓手机上显示没有问题,但是在苹果手机上 当点击输入的时候,光标的高度和父盒子的高度一样.造成的原因就是给父盒子 ...

  5. vue axios springBoot 跨域session丢失

    前端: 在引入axios的地方配置 axios.defaults.withCredentials=true,就可以允许跨域携带cookie信息了,这样每次发送ajax请求后,只要不关闭浏览器,得到的s ...

  6. 打包的@font-face包

    在网页中使用 @font-face 规则嵌入字体,前提是可以从你的网站或第三方 Web 服务器下载到相应的字体.以这种方式提供的字体,会在使用该字体的页面第一次加载时被浏览器下载并缓存起来,以后就不用 ...

  7. codis 使用

    1:Jedis与Redisson对比 2.1. 概况对比 Jedis是Redis的Java实现的客户端,其API提供了比较全面的Redis命令的支持:Redisson实现了分布式和可扩展的Java数据 ...

  8. ASP.NET MVC easyUI-datagrid 的当前页合计and总合计

    一.HTML代码 <table id="dg" class="easyui-datagrid" style="width: 100%; heig ...

  9. Centos6 安装完之后,没有网络

    Virtualbox安装的centos 6.10的虚拟机,安装时,网络是NAT网络,安装完之后,将网络改为桥接网卡,启动虚拟机之后,使用 ifconfig 命令查看没有到eth0的信息,只有127.0 ...

  10. C(n,m)的奇偶性判断

    C(n,m)的奇偶性判断奇数:当且仅当(n&m)==m偶数:否则为偶数证明:根据卢卡斯定理,c(n,m)%2=c(n%2,m%2)*c((n>>1),(m>>1))%2 ...