pytorch hook学习

register_hook

import torch

x = torch.Tensor([0,1,2,3]).requires_grad_()

y = torch.Tensor([4,5,6,7]).requires_grad_()

w = torch.Tensor([1,2,3,4]).requires_grad_()

z = x+y;

o = w.matmul(z) # o = w(x+y) 中间变量z

o.backward()

print(x.grad,y.grad,z.grad,w.grad,o.grad)

这里的o和z都是中间变量，不是通过指定值来定义的变量，所以是中间变量，所以pytorch并不存储这些变量的梯度。

对于中间变量z，hook的使用方式为: z.register_hook(hook_fn),其中 hook_fn为一个用户自定义的函数，其签名为：hook_fn(grad) -> Tensor or None。

它的输入为变量 z 的梯度，输出为一个 Tensor 或者是 None （None 一般用于直接打印梯度）。反向传播时，梯度传播到变量 z，再继续向前传播之前，将会传入 hook_fn。如果 hook_fn的返回值是 None，那么梯度将不改变，继续向前传播，如果 hook_fn的返回值是 Tensor 类型，则该 Tensor 将取代 z 原有的梯度，向前传播。

import torch

x = torch.Tensor([0,1,2,3]).requires_grad_()

y = torch.Tensor([4,5,6,7]).requires_grad_()

w = torch.Tensor([1,2,3,4]).requires_grad_()

z = x+y;

def hook_fn(grad):

    print(grad)

    return None

z.register_hook(hook_fn)

o = w.matmul(z) # o = w(x+y) 中间变量z

o.backward()

print(x.grad,y.grad,w.grad,z.grad,o.grad)

register_forward_hook

register_forward_hook的作用是获取前向传播过程中，各个网络模块的输入和输出。对于模块 module，其使用方式为：module.register_forward_hook(hook_fn) 。其中 hook_fn的签名为：

hook_fn(module, input, output) -> None

import torch

from torch import nn

class Model(nn.Module):

    def __init__(self):

        super(Model,self).__init__()

        self.fc1 = nn.Linear(3,4) # WT * X + bias

        self.relu1 = nn.ReLU()

        self.fc2 = nn.Linear(4,1)

        self.init()

    def init(self):

        with torch.no_grad():

            # WT * X + bias，所以W为4*3的矩阵，bias为1*4

            self.fc1.weight = torch.nn.Parameter(

                torch.Tensor([[1., 2., 3.],

                              [-4., -5., -6.],

                              [7., 8., 9.],

                              [-10., -11., -12.]]))

            self.fc1.bias = torch.nn.Parameter(torch.Tensor([1.0, 2.0, 3.0, 4.0]))

            self.fc2.weight = torch.nn.Parameter(torch.Tensor([[1.0, 2.0, 3.0, 4.0]]))

            self.fc2.bias = torch.nn.Parameter(torch.Tensor([1.0]))

    def forward(self,x):

        o = self.fc1(x)

        o = self.relu1(o)

        o = self.fc2(o)

        return o

def hook_fn_forward(module,input,output):

    print(module)

    print(input)

    print(output)

model = Model()

modules = model.named_children()

'''

named_children()

Returns an iterator over immediate children modules, yielding both the name of the module as well as the module itself.

'''

for name,module in modules:

    # 这里的name就是自己定义的self.xx的xx。如上面的fc1，fc2.

    # module代指的就是fc1代表的module等等

    module.register_forward_hook(hook_fn_forward)

x = torch.Tensor([[1.0,1.0,1.0]]).requires_grad_()

o = model(x)

o.backward()

 '''

 Linear(in_features=3, out_features=4, bias=True)

(tensor([[1., 1., 1.]], requires_grad=True),)

tensor([[  7., -13.,  27., -29.]], grad_fn=<AddmmBackward>)

ReLU()

(tensor([[  7., -13.,  27., -29.]], grad_fn=<AddmmBackward>),)

tensor([[ 7.,  0., 27.,  0.]], grad_fn=<ReluBackward0>)

Linear(in_features=4, out_features=1, bias=True)

(tensor([[ 7.,  0., 27.,  0.]], grad_fn=<ReluBackward0>),)

tensor([[89.]], grad_fn=<AddmmBackward>)

 '''

register_backward_hook

理同前者。得到梯度值。

hook_fn(module, grad_input, grad_output) -> Tensor or None

上面的代码forward全部替换为backward，结果为：

'''

Linear(in_features=4, out_features=1, bias=True)

(tensor([1.]), tensor([[1., 2., 3., 4.]]), tensor([[ 7.],

        [ 0.],

        [27.],

        [ 0.]]))

(tensor([[1.]]),)

ReLU()

(tensor([[1., 0., 3., 0.]]),)

(tensor([[1., 2., 3., 4.]]),)

Linear(in_features=3, out_features=4, bias=True)

(tensor([1., 0., 3., 0.]), tensor([[22., 26., 30.]]), tensor([[1., 0., 3., 0.],

        [1., 0., 3., 0.],

        [1., 0., 3., 0.]]))

(tensor([[1., 0., 3., 0.]]),)

'''

register_backward_hook只能操作简单模块，而不能操作包含多个子模块的复杂模块。如果对复杂模块用了 backward hook，那么我们只能得到该模块最后一次简单操作的梯度信息。

可以这么用,可以得到一个模块的梯度。

class Mymodel(nn.Module):

	......

model = Mymodel()

model.register_backward_hook(hook_fn_backward)

[torch] pytorch hook学习的更多相关文章

pytorch例子学习-DATA LOADING AND PROCESSING TUTORIAL
参考:https://pytorch.org/tutorials/beginner/data_loading_tutorial.html DATA LOADING AND PROCESSING TUT ...
[pytorch] PyTorch Hook
PyTorch Hook¶ 为什么要引入hook? -> hook可以做什么? 都有哪些hook? 如何使用hook? 1. 为什么引入hook?¶ 参考:Pytorch中autogra ...
【pytorch】学习笔记（三）-激励函数
[pytorch]学习笔记-激励函数学习自:莫烦python 什么是激励函数一句话概括 Activation: 就是让神经网络可以描述非线性问题的步骤, 是神经网络变得更强大 1.激活函数是用来加 ...
【pytorch】学习笔记（二）- Variable
[pytorch]学习笔记(二)- Variable 学习链接自莫烦python 什么是Variable Variable就好像一个篮子,里面装着鸡蛋(Torch 的 Tensor),里面的鸡蛋数不断 ...
PyTorch迁移学习-私人数据集上的蚂蚁蜜蜂分类
迁移学习的两个主要场景微调CNN:使用预训练的网络来初始化自己的网络,而不是随机初始化,然后训练即可将CNN看成固定的特征提取器:固定前面的层,重写最后的全连接层,只有这个新的层会被训练下面修改 ...
PyTorch深度学习实践——反向传播
反向传播课程来源:PyTorch深度学习实践--河北工业大学 <PyTorch深度学习实践>完结合集_哔哩哔哩_bilibili 目录反向传播笔记作业笔记在之前课程中介绍的线性 ...
PyTorch深度学习实践——多分类问题
多分类问题目录多分类问题 Softmax 在Minist数据集上实现多分类问题作业课程来源:PyTorch深度学习实践--河北工业大学 <PyTorch深度学习实践>完结合集_哔哩 ...
PyTorch深度学习实践——处理多维特征的输入
处理多维特征的输入课程来源:PyTorch深度学习实践--河北工业大学 <PyTorch深度学习实践>完结合集_哔哩哔哩_bilibili 这一讲介绍输入为多维数据时的分类. 一个数据集 ...
对比学习:《深度学习之Pytorch》《PyTorch深度学习实战》+代码
PyTorch是一个基于Python的深度学习平台,该平台简单易用上手快,从计算机视觉.自然语言处理再到强化学习,PyTorch的功能强大,支持PyTorch的工具包有用于自然语言处理的Allen N ...

随机推荐

Jade学习（三）之语法规则下
jade可以自动识别单双标签 // 1.jade内容: input(type="button", value="点击") div // 此时输出❌error:i ...
枚举java语言中的修饰符组合
package model; /*22:37 2019/7/20*/ /* top class的修饰符组合 abstract final public 2 * 2 * 2 warning: abstr ...
java 判断5张牌的组成
题目: 一副牌中发五张扑克牌给你,判断是四条,三带二.三带一加一.两对.一对.顺子.还是什么都不是. 控制台输入: 1,1,1,1,2 示例输出: 四条 Java方法的代码: static Strin ...
python日志汇总
1. 文件头在Linux下推荐文件头: #! /usr/bin/env python # -*- coding: utf-8 -*- 2.import导入语句 import: 一般导入第三包可以直接使 ...
状态码是canceled
timeout : 1000 给ajax配置如上属性 $.ajax({ type:"post", url:"pro/savePro", timeout : 10 ...
U-boot工作流程分析
bootloader的作用 bootloader就好比是航天飞机升天轨道上的助推器程序入口:在_start这里第一阶段程序分析: 1.设置中断向量表 2.设置处理器位SVC模式 3.0.刷新I/D ...
Linux-定时任务排查
前段时间,哥们的服务器被人反弹了shell,由于反弹的地址不可达,系统总是会发送一条mail邮件到root账户,导致入侵行为被发现,由于反弹的动作是通过crontab来定时执行的,所以来梳理下cron ...
Access数据库删除重复记录，只保留一条记录的做法
Access数据库删除重复记录,只保留一条记录的做法: 只保留id最小的记录方法: delete from [表名] where id not in (select min(id) from [表名] ...
vs2017 mvc 启动时经常出现调用的目标发生异常
1.vs 2017 调试web 程序时老是出现调用的目标发生异常本人眼拙,基本上看了网站说的一些方法,设置环境变量是无效的,只有一个办法,卸载重装. 1.0 卸载过程打开计算机-卸载或更改软件- ...
java面向对象2-封装
2 封装封装:是指隐藏对象的属性和实现细节,仅对外提供公共访问方式,面向对象三大特点之一.好处: 防止数据被任意篡改,提高安全性隐藏了实现细节,仅暴露方法如何实现封装? 使用private关键字 ...