一、register_hook

import torch

from torch.autograd import Variable

grad_list = []

def print_grad(grad):

    grad_list.append(grad)

x = Variable(torch.randn(2, 1), requires_grad=True)

y = x+2

z = torch.mean(torch.pow(y, 2))

lr = 1e-3

y.register_hook(print_grad)

z.backward()

x.data -= lr*x.grad.data

print(grad_list)

[Variable containing:

 1.5653

 3.5175

[torch.FloatTensor of size 2x1]

]

`二、register_forward_hook` & `register_backward_hook`

这两个函数的功能类似于variable函数的register_hook，可在module前向传播或反向传播时注册钩子。

每次前向传播执行结束后会执行钩子函数（hook）。前向传播的钩子函数具有如下形式：hook(module, input, output) -> None，而反向传播则具有如下形式：hook(module, grad_input, grad_output) -> Tensor or None。

钩子函数不应修改输入和输出，并且在使用后应及时删除，以避免每次都运行钩子增加运行负载。钩子函数主要用在获取某些中间结果的情景，如中间某一层的输出或某一层的梯度。这些结果本应写在forward函数中，但如果在forward函数中专门加上这些处理，可能会使处理逻辑比较复杂，这时候使用钩子技术就更合适一些。下面考虑一种场景，有一个预训练好的模型，需要提取模型的某一层（不是最后一层）的输出作为特征进行分类，但又不希望修改其原有的模型定义文件，这时就可以利用钩子函数。下面给出实现的伪代码。

model = VGG()

features = t.Tensor()

def hook(module, input, output):

    '''把这层的输出拷贝到features中'''

    features.copy_(output.data)

handle = model.layer8.register_forward_hook(hook)

_ = model(input)

# 用完hook后删除

handle.remove()

测试LeNet网络

import torch as t

import torch.nn as nn

import torch.nn.functional as F

class LeNet(nn.Module):

    def __init__(self):

        super(LeNet,self).__init__()

        self.conv1 = nn.Conv2d(1, 6, 5)

        self.conv2 = nn.Conv2d(6,16,5)

        self.fc1 = nn.Linear(16*5*5,120)

        self.fc2 = nn.Linear(120,84)

        self.fc3 = nn.Linear(84,10)

    def forward(self,x):

        x = F.max_pool2d(F.relu(self.conv1(x)),(2,2))

        x = F.max_pool2d(F.relu(self.conv2(x)),2)

        x = x.view(x.size()[0], -1)

        x = F.relu(self.fc1(x))

        x = F.relu(self.fc2(x))

        x = self.fc3(x)

        return x

先模拟一下单次的向前传播，

net = LeNet()

img = t.autograd.Variable((t.arange(32*32*1).view(1,1,32,32)))

net(img)

Variable containing:

Columns 0 to 7

 27.6373 -13.4590  23.0988 -16.4491  -8.8454 -15.6934  -4.8512   1.3490

Columns 8 to 9

  3.7801 -15.9396

[torch.FloatTensor of size 1x10]

仿照上面示意，进行钩子注册，获取第一卷积层输出结果，

def hook(module, inputdata, output):

    '''把这层的输出拷贝到features中'''

    print(output.data)

handle = net.conv2.register_forward_hook(hook)

net(img)

# 用完hook后删除

handle.remove()

……

……

[torch.FloatTensor of size 1x16x10x10]

看看hook能识别什么

import torch

from torch import nn

import torch.functional as F

from torch.autograd import Variable

def for_hook(module, input, output):

    print(module)

    for val in input:

        print("input val:",val)

    for out_val in output:

        print("output val:", out_val)

class Model(nn.Module):

    def __init__(self):

        super(Model, self).__init__()

    def forward(self, x):

        return x+1

model = Model()

x = Variable(torch.FloatTensor([1]), requires_grad=True)

handle = model.register_forward_hook(for_hook)

print(model(x))

handle.remove()

可见对于目标层，其输入输出都可以获取到，

Model(

)

input val: Variable containing:

           1

          [torch.FloatTensor of size 1]

output val: Variable containing:

            2

           [torch.FloatTensor of size 1]

Variable containing:

 2

[torch.FloatTensor of size 1]

『PyTorch』第十六弹_hook技术的更多相关文章

『PyTorch』第十二弹_nn.Module和nn.functional
大部分nn中的层class都有nn.function对应,其区别是: nn.Module实现的layer是由class Layer(nn.Module)定义的特殊类,会自动提取可学习参数nn.Para ...
『PyTorch』第十五弹_torch.nn.Module的属性设置&查询
一.背景知识 python中两个属相相关方法 result = obj.name 会调用builtin函数getattr(obj,'name')查找对应属性,如果没有name属性则调用obj.__ge ...
『PyTorch』第十四弹_torch.nn.Module类属性
nn.Module基类的构造函数: def __init__(self): self._parameters = OrderedDict() self._modules = OrderedDict() ...
『PyTorch』第十弹_循环神经网络
RNN基础: 『cs231n』作业3问题1选讲_通过代码理解RNN&图像标注训练 TensorFlow RNN: 『TensotFlow』基础RNN网络分类问题『TensotFlow』基础R ...
『MXNet』第十二弹_再谈新建计算节点
上一节我们已经谈到了计算节点,但是即使是官方文档介绍里面相关内容也过于简略,我们使用Faster-RCNN代码中的新建节点为例,重新介绍一下新建节点的调用栈. 1.调用新建节点参数分为三部分,op_ ...
『PyTorch』第九弹_前馈网络简化写法
『PyTorch』第四弹_通过LeNet初识pytorch神经网络_上『PyTorch』第四弹_通过LeNet初识pytorch神经网络_下在前面的例子中,基本上都是将每一层的输出直接作为下一层的 ...
『PyTorch』第四弹_通过LeNet初识pytorch神经网络_下
『PyTorch』第四弹_通过LeNet初识pytorch神经网络_上 # Author : Hellcat # Time : 2018/2/11 import torch as t import t ...
『PyTorch』第三弹重置_Variable对象
『PyTorch』第三弹_自动求导 torch.autograd.Variable是Autograd的核心类,它封装了Tensor,并整合了反向传播的相关实现 Varibale包含三个属性: data ...
『PyTorch』第二弹重置_Tensor对象
『PyTorch』第二弹_张量 Tensor基础操作简单的初始化 import torch as t Tensor基础操作 # 构建张量空间,不初始化 x = t.Tensor(5,3) x -2. ...

随机推荐

论文笔记之《Event Extraction via Dynamic Multi-Pooling Convolutional Neural Network》
1. 文章内容概述本人精读了事件抽取领域的经典论文<Event Extraction via Dynamic Multi-Pooling Convolutional Neural Networ ...
python3.4学习笔记(二十四) Python pycharm window安装redis MySQL-python相关方法
python3.4学习笔记(二十四) Python pycharm window安装redis MySQL-python相关方法window安装redis,下载Redis的压缩包https://git ...
windows tomcat web应用以及eclipse console乱码解决方法
在windows下,如果vm文件名为UTF-8格式,则显示乱码(velocity写出的不乱码): 改回GBK,则不再乱码.
简单的Django实现图片上传，并存储进MySQL数据库案例——小白
目标:通过网页上传一张图片到Django后台,后台接收并存储进数据库真是不容易!!这个案例的代码网上太乱,不适合我,自己摸索着写,终于成功了,记录一下,仅供自己参考,有的解释可能不对,自己明白就好, ...
05: python中的函数
1.1 python 函数 1.函数作用定义: 函数是指将一组语句的集合通过一个名字(函数名)封装起来,要想执行这个函数,只需调用其函数名即可特性: 减少重复代码使程序变的可扩展使程序变得 ...
20145318《网络对抗》注入shellcode及Return-to-libc
20145318<网络对抗>注入shellcode及Return-to-libc 注入shellcode 知识点注入shellcodeShellcode实际是一段代码(也可以是填充数据) ...
如何写出格式优美的javadoc？
如果你读过Java源码,那你应该已经见到了源码中优美的javadoc.在eclipse 中鼠标指向任何的公有方法都会显示出详细的描述,例如返回值.作用.异常类型等等. 本文主要来自<Thinki ...
linux中线程池【转】
本文转载自:http://blog.csdn.net/yusiguyuan/article/details/18401277 一.线程池大多数的网络服务器,包括Web服务器都具有一个特点,就是单位时 ...
bootstrap的carousel图片轮播
整个轮播是放在一个div .carousel和.slide的div中的, 包括3个部分: 1. 第一个部分indicator位于下方的指示器部分. 结构是一个ol和li, ol的类是carousel- ...
SpringJDBC源码分析记录
我们使用JdbcTemplate时,调用的query方法为: public <T> List<T> query(String sql, @Nullable Object[] a ...

『PyTorch』第十六弹_hook技术