深入Pytorch微分传参

导数

这段代码揭示了多个变量的微分以及如何求解loss为向量的导数

m1 = Variable(torch.ones((3,2)), requires_grad=True)

m2 = Variable(torch.ones((3,2))*2, requires_grad=True)

m3 = Variable(torch.ones((3,2))*4, requires_grad=True)

x1 = m1*m2

x2 = x1 *m3

y = x1  + x2

gradients= torch.ones((3,2))

y.backward(gradients)

print(f"m1 grad:{m1.grad}, \n m2 grad:{m2.grad}, \n m3 grad:{m3.grad}, \n x1 grad:{x1.grad}, \n x2 grad:{x2.grad}, \n y grad:{y.grad}")

深入导数--hook机制

hook机制的详细解释

这段代码解释了导数是如何自动计算保存的，

import torch

from torch.autograd import Variable

def register_hook(self, hook):

        r"""Registers a backward hook.

        The hook will be called every time a gradient with respect to the

        Tensor is computed. The hook should have the following signature::

            hook(grad) -> Tensor or None

        The hook should not modify its argument, but it can optionally return

        a new gradient which will be used in place of :attr:`grad`.

        This function returns a handle with a method ``handle.remove()``

        that removes the hook from the module.

        Example::

            >>> v = torch.tensor([0., 0., 0.], requires_grad=True)

            >>> h = v.register_hook(lambda grad: grad * 2)  # double the gradient

            >>> v.backward(torch.tensor([1., 2., 3.]))

            >>> v.grad

             2

             4

             6

            [torch.FloatTensor of size (3,)]

            >>> h.remove()  # removes the hook

        """

        if not self.requires_grad:

            raise RuntimeError("cannot register a hook on a tensor that "

                               "doesn't require gradient")

        if self._backward_hooks is None:

            self._backward_hooks = OrderedDict()

            if self.grad_fn is not None:

                self.grad_fn._register_hook_dict(self)

        handle = hooks.RemovableHandle(self._backward_hooks)

        self._backward_hooks[handle.id] = hook

        return handle

v = Variable(torch.Tensor([2, 2, 2]), requires_grad=True)

h = v.register_hook(lambda grad: grad * grad)  # double the gradient

v.backward(torch.Tensor([1, 1, 2]))

#先计算原始梯度，再进hook，获得一个新梯度。

print(v.grad.data)

# print(v.data)

# v.grad.data=torch.Tensor([0, 0, 0]) 梯度不置0就会根据hook自动累加

v.backward(torch.Tensor([1, 1, 1]))

print(v.grad.data)

# print(v.data)

h.remove()  # removes the hook

使用`with torch.no_grad()`

with torch.no_grad():

        train_l = loss(net(features, w, b), labels)

        print('epoch %d, loss %f' % (epoch + 1, train_l.mean().numpy()))

SGD

这段代码揭示了一个最简单运用梯度下降的模型

import torch

from torch.autograd import Variable

from torch.distributions import normal

NUMBER = 100

# X = normal.Normal(loc = 0, scale = 1).sample((1, NUMBER))

X = torch.ones((1, NUMBER))*NUMBER

X= Variable(X, requires_grad=False)

b = torch.ones(X.shape[0])

b.requires_grad=True

epoch = 200

for i in range(epoch):

    loss = torch.sum((b-X) ** 2)

    b.grad = Variable(torch.zeros(X.shape[0])) #梯度置0

    loss.backward()

    b.data = b.data- b.grad * (1/NUMBER)/10

    if not i%10:

        print(f" {i} b is: {b}, b.grad is: {b.grad}")

深入Pytorch微分传参的更多相关文章

Oracle 用Drapper进行like模糊传参查询需要在参数值前后带%符合
Oracle 用Drapper进行like模糊传参查询需要在参数值前后带%符合 string sqlstr="select * from tblname where name like ...
Angular页面传参的四种方法
1. 基于ui-router的页面跳转传参 (1)在Angular的app.js中用ui-route定义路由,比如有两个页面, 一个页面(producers.html)放置了多个producers,点 ...
使用java传参调用exe并且获取程序进度和返回结果的一种方法
文章版权由作者李晓晖和博客园共有,若转载请于明显处标明出处:http://www.cnblogs.com/naaoveGIS/ 1.背景在某个项目中需要考虑使用java后台调用由C#编写的切图程序( ...
Oracle Sales Cloud：报告和分析（BIEE）小细节2——利用变量和过滤器传参（例如，根据提示展示不同部门的数据）
在上一篇随笔中,我们建立了部门和子部门的双提示,并将部门和子部门做了关联.那么,本篇随笔我们重点介绍利用建好的双提示进行传参. 在操作之前,我们来看一个报告和分析的具体需求: [1] 两个有关联的提示 ...
js动态绑定click事件时function传参问题
今天碰到了这样一个问题,我在javascript中动态创建了一个button, 然后我想给改button添加click事件,绑定的function想要传入一个变量参数, 一开始我想直接通过函数传参传进 ...
C#进阶系列——WebApi 接口参数不再困惑：传参详解
前言:还记得刚使用WebApi那会儿,被它的传参机制折腾了好久,查阅了半天资料.如今,使用WebApi也有段时间了,今天就记录下API接口传参的一些方式方法,算是一个笔记,也希望能帮初学者少走弯路.本 ...
点击div 跳转并通过URL传参
点击div前要先给div绑定要传的参数: //给panel绑定自定义属性,方便在跳转时传带参数,键/值对排列 panel.attr("user_age",user_age); pa ...
纯html页面之间传参
//页面引入//传参方法,可解析url参数 (function($){ $.getUrlParam = function(name) { var reg = new RegExp("(^|& ...
★★★Oracle sql 传参特别注意★★★
最近遇到一个非常烦人的问题,用传参的方式执行sql语句结果老是报 Oracle ORA-01722: 无效数字一直无法找到原因. 表结构大致如下: table test_station ( tblR ...

随机推荐

Caused by: com.rabbitmq.client.ShutdownSignalException: channel error; protocol method: #method<channel.close>(reply-code=406, reply-text=PRECONDITION_FAILED - inequivalent arg 'type' for exchange 'me
在启动RabbitMQ消费端的时候报错:Caused by: com.rabbitmq.client.ShutdownSignalException: channel error; protocol ...
VMware虚拟机Linux配置
1.设置时区和时间打开虚拟机,设置好用户名和密码,就可以进入了. 进入之后,可以先设置时区和时间在CentOS桌面右上角,点击时间,然后进行设置 2.添加用户使用root权限安装虚拟机之后,登录 ...
Linux发行版的系统目录名称命名规则以及用途
linux各种发行版都遵循LSB(Linux Stadards Base)规则,使用一致的相关的基础目录名称,使用根目录系统结构(root filesystem),使用FHS(Files Hierar ...
python 基础学习笔记（6）--函数（2）
...
Appium(四)：真实机第一个appium程序、模拟器第一个appium程序、查看元素
1. 真实机第一个appium程序学完了前面的知识,也将环境搭建好了,接下来我们就正式开始appium的学习了. 在做app自动化的时候,我们肯定是针对某个产品.某个软件进行测试,那么我们一定是先让 ...
JavaScript-双层for循环打印九九乘法表
<!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8&quo ...
STM32基本GPIO操作：点灯（库函数+寄存器）
社团作业=_= 开发版上的LED灯负极连接在PB5口,正极串联一510Ω电阻后与3.3V相连若开发板不带LED灯则需要自行连接,务必串联一个合适的电阻防止LED灯烧坏零.一个有趣的延时函数来自于 ...
(绿色)修正版gooflow流程解决方案(源码分享+在线演示+UI地址下载)
gooflow出现挖矿机木马,请勿随意去其他网站下载!!! 一.功能简介 gooflow功能清单1.自定义流程绘制2.自定义属性添加3.支持3种步骤类型普通审批步骤自动决策步骤手动决策步骤 4.决策方 ...
记一次排查jacoco的过程：java.lang.NoSuchMethodException:ApplyOrderdetail.get$jacocoData()
一.事件: 公司BA今日在st2环境提测试单,添加产品时候一直过不去,找我帮忙看,因为关系比较熟,正好也不是非常忙,我就帮忙定位了下.首先,我在生产环境重现了下,没有问题,在dev环境重现,也没有问题 ...
np.array()和np.dot()的区别
1.生成数组的方式不同 2.乘法计算方式不同 array生成数组,np.dot()表示矩阵乘积,(*)号或np.multiply()表示点乘 mat生成数组,(*)和np.dot()表示矩阵相乘,点乘 ...

深入Pytorch微分传参

导数

深入导数--hook机制

使用with torch.no_grad()

SGD

深入Pytorch微分传参的更多相关文章

随机推荐

热门专题

使用`with torch.no_grad()`