现在对 CNN 有了一定的了解，同时在 GitHub 上找了几个 examples 来学习，对网络的搭建有了笼统地认识，但是发现有好多基础 pytorch 的知识需要补习，所以慢慢从官网 API进行学习吧。

AUTOGRAD MECHANICS(自动求导机制)

　　这一部分做了解处理，不需要完全理解的明明白白的。

Excluding subgraphs from backward

　　每一个 Tensor 变量都可以设置一个属性：requires_grad（默认参数 False），可以设置此参数排除向后梯度求导时排除子图，提高运行效率。

 import torch

 x = torch.randn(3, 3) # requires_grad=False by default

 y = torch.randn(3, 3)

 z = torch.randn(3, 3, requires_grad= True)

 a = x + y

 print(a.requires_grad) # False

 b = z + a

 print(b.requires_grad) # True

　　这个设置在如下情况很好用：你提前知道你不需要某个参数的梯度。例如，你需要微调网络的时候，你只需要在最后一层将变量的 requires_grad 属性切换一下，因为仿射装换需要使用通过梯度调整的权重，而且输出结果也需要它。

 model = torchvision.models.resnet18(pretrained=True)

 for param in model.parameters():

     param.requires_grad = False  # 切换模式

 # Replace the last fully-connected layer

 # Parameters of newly constructed modules have requires_grad=True by default

 model.fc = nn.Linear(512, 100)

 # Optimize only the classifier

 optimizer = optim.SGD(model.fc.parameters(), lr=1e-2, momentum=0.9)

How autograd encodes the history（自动求导如何编码历史信息）

　　Autograd is reverse automatic (反向自动) differentiation system.....（这段话有点难翻译）。

　　个人觉得关键是：When computing the forwards pass, autograd simultaneously performs the requested computations and builds up a graph representing the function that computes the gradient (the .grad_fn attribute of each torch.Tensor is an entry point into this graph)

In-place operations with autograd(自动求导中使用 in-place)

　　在自动求导中支持 in-place 是件困难的事，在多数场合下我们并不鼓励你使用。

In-place correctness checks(in-place 的正确性检擦)

　　每一个 tensor 变量都拥有版本计数器，每次被调用都会加一，当一个 Function 保留 tensor 用来向后计算时，也会保存这个版本计数器。当你访问 self.saved_tensors 的时候，就会检查版本计数器的值，如果大于计数器的值，就会报错。

Pytorch学习（一）—— 自动求导机制的更多相关文章

Pytorch Autograd (自动求导机制)
Pytorch Autograd (自动求导机制) Introduce Pytorch Autograd库 (自动求导机制) 是训练神经网络时,反向误差传播(BP)算法的核心. 本文通过logisti ...
PyTorch官方中文文档：自动求导机制
自动求导机制本说明将概述Autograd如何工作并记录操作.了解这些并不是绝对必要的,但我们建议您熟悉它,因为它将帮助您编写更高效,更简洁的程序,并可帮助您进行调试. 从后向中排除子图每个变量都有 ...
Pytorch中的自动求梯度机制和Variable类
自动求导机制是每一个深度学习框架中重要的性质,免去了手动计算导数,下面用代码介绍并举例说明Pytorch的自动求导机制. 首先介绍Variable,Variable是对Tensor的一个封装,操作和T ...
pytorch的自动求导机制 - 计算图的建立
一.计算图简介在pytorch的官网上,可以看到一个简单的计算图示意图, 如下. import torchfrom torch.autograd import Variable x = Variab ...
什么是pytorch（2Autograd:自动求导）(翻译)
Autograd: 自动求导 pyTorch里神经网络能够训练就是靠autograd包.我们来看下这个包,然后我们使用它来训练我们的第一个神经网络. autograd 包提供了对张量的所有运算自动求导 ...
Pytorch Tensor, Variable, 自动求导
2018.4.25,Facebook 推出了 PyTorch 0.4.0 版本,在该版本及之后的版本中,torch.autograd.Variable 和 torch.Tensor 同属一类.更确切地 ...
『PyTorch x TensorFlow』第六弹_从最小二乘法看自动求导
TensoFlow自动求导机制『TensorFlow』第二弹_线性拟合&神经网络拟合_恰是故人归下面做了三个简单尝试, 利用包含gradients.assign等tf函数直接构建图进行自动 ...
Pytorch之Variable求导机制
自动求导机制是pytorch中非常重要的性质,免去了手动计算导数,为构建模型节省了时间.下面介绍自动求导机制的基本用法. #自动求导机制 import torch from torch.autogra ...
[深度学习] pytorch学习笔记（1）(数据类型、基础使用、自动求导、矩阵操作、维度变换、广播、拼接拆分、基本运算、范数、argmax、矩阵比较、where、gather)
一.Pytorch安装安装cuda和cudnn,例如cuda10,cudnn7.5 官网下载torch:https://pytorch.org/ 选择下载相应版本的torch 和torchvisio ...

随机推荐

牛客网Java刷题知识点之为什么static成员方法不能是抽象方法，其必须实现
不多说,直接上干货! static修饰的方法我们称之为静态方法,我们通过类名对其进行直接调用.由于它在类加载的时候就存在了,它不依赖于任何实例,所以static方法必须实现,也就是说它不能是抽象方法.
DialogHelper
//require ScrollHelper.js function DialogHelper() { var _this = this; var doc = window.document; _th ...
return void ajax
public class UserInfo { private String name; private Integer age; public String getName() { return n ...
Java并发(二):基础概念
并发编程的第二部分,先来谈谈发布(Publish)与逸出(Escape); 发布是指:对象能够在当前作用域之外的代码中使用,例如:将对象的引用传递到其他类的方法中,对象的引用保存在其他类可以访问的地方 ...
剑指offer课外两道习题解法
1.定义一个函数,删除字符串中所有重复出现的字符,例如输入“google”,删除重复的字符之后的结果为“gole”. 解题思路:像这种求字符串的重复字符,并且去掉重复字符,我们一般可以用哈希 ...
selenium +python之Page Obiect设计模式
PageObject是selenium自动化测试项目开发实践的最佳设计模式之一,它主要体现对界面交互细节的封装,这样可以使测试案例更关注于业务而非界面细节,从而提高测试案例的可读性. 1.认识Page ...
pod install Pull is not possible because you have unmerged files.
http://stackoverflow.com/questions/21474536/podfile-gives-an-error-on-install A bug was found in lib ...
Uva 10635 Prince and Princess （LCS变形LIS）
直接LCS是时间复杂度是O(p*q)的,但是序列元素各不相同,只要把其中一个序列映射成有序的, 另外一个序列再做相同的映射,没有的直接删掉,就变成了求另一个序列LIS. #include<bit ...
[论文理解]Selective Search for Object Recognition
Selective Search for Object Recognition 简介 Selective Search是现在目标检测里面非常常用的方法,rcnn.frcnn等就是通过selective ...
HTML之基本语法（表单）
一.表单的基本介绍表单:就是互联网上用于收集用户信息的一种结构,在HTML当中事先定义好了一种标签来完成此事,标签名称为form,它是一个双标签<form action="" ...

Pytorch学习（一）—— 自动求导机制