Squeeze-and-Excitation Networks

简介

SENet提出了一种更好的特征表示结构，通过支路结构学习作用到input上更好的表示feature。结构上是使用一个支路去学习如何评估通道间的关联，然后作用到原feature map上去，实现对输入的校准。支路的帮助学习到的是神经网络更加适合的表示。为了使网络通过全局信息来衡量通道关联，结构上使用了global pooling捕获全局信息，然后连接两个全连接层，作用到输入上去，即完成了对输入的重校准，可以使网络学习到更好的表示。

SQUEEZE-AND-EXCITATION BLOCKS

一个block的结构大致如下：

上图中Fsq是Squeeze过程，Fex是Excitation过程，然后通过Fscale将学习到的权重作用在输入上。

Squeeze: Global Information Embedding

作者将Squeeze过程称为global information embedding的过程，因为squeeze的过程实际上是对feature map利用global pooling来整合全局特征。

Excitation: Adaptive Recalibration

作者将Excitation过程称为重校准过程，因为此过程通过支路学习到的权重，作用到原输入上去，要实现对每个通道进行打分，即网络学习到通道score，则必须要学习到非线性结果，所以作者采用fc-relu-fc-sigmoid的excitation结构来实现score映射。

根据作者论文中的举例，可以清楚看到以Inception为例的Squeeze和Excitation过程：

而Fscale过程就是对应相乘，把每个通道的权重对应乘上input的对应通道feature。

这个论文比较好理解。

简单写了一个block：

import torch

import torch.nn as nn

class SEModule(nn.Module):

    def __init__(self,r = 3):

        super(SEModule,self).__init__()

        self.global_pooling = nn.MaxPool2d(128)

        self.fc1 = nn.Linear(64,64//r)

        self.relu1 = nn.ReLU(64//r)

        self.fc2 = nn.Linear(64//r,64)

        self.sigmoid = nn.Sigmoid()

    def forward(self,x):

        se_x = self.global_pooling(x)

        se_x = self.fc1(se_x.view(-1,64))

        se_x = self.relu1(se_x)

        se_x = self.fc2(se_x)

        se_x = self.sigmoid(se_x).view(-1,64,1,1)

        return x * se_x

if __name__ =="__main__":

    from torchsummary import summary

    model = SEModule()

    summary(model,(64,128,128),device = "cpu")

'''

----------------------------------------------------------------

        Layer (type)               Output Shape         Param #

================================================================

         MaxPool2d-1             [-1, 64, 1, 1]               0

            Linear-2                   [-1, 21]           1,365

              ReLU-3                   [-1, 21]               0

            Linear-4                   [-1, 64]           1,408

           Sigmoid-5                   [-1, 64]               0

================================================================

Total params: 2,773

Trainable params: 2,773

Non-trainable params: 0

----------------------------------------------------------------

Input size (MB): 4.00

Forward/backward pass size (MB): 0.00

Params size (MB): 0.01

Estimated Total Size (MB): 4.01

----------------------------------------------------------------

'''

论文原文：https://arxiv.org/pdf/1709.01507.pdf

[论文理解] Squeeze-and-Excitation Networks的更多相关文章

[论文理解] Learning Efficient Convolutional Networks through Network Slimming
Learning Efficient Convolutional Networks through Network Slimming 简介这是我看的第一篇模型压缩方面的论文,应该也算比较出名的一篇吧 ...
图像处理论文详解 | Deformable Convolutional Networks | CVPR | 2017
文章转自同一作者的微信公众号:[机器学习炼丹术] 论文名称:"Deformable Convolutional Networks" 论文链接:https://arxiv.org/a ...
论文笔记之：Action-Decision Networks for Visual Tracking with Deep Reinforcement Learning
论文笔记之:Action-Decision Networks for Visual Tracking with Deep Reinforcement Learning 2017-06-06 21: ...
[论文理解]关于ResNet的进一步理解
[论文理解]关于ResNet的理解这两天回忆起resnet,感觉残差结构还是不怎么理解(可能当时理解了,时间长了忘了吧),重新梳理一下两点,关于resnet结构的思考. 要解决什么问题论文的一大贡 ...
[论文理解] CornerNet: Detecting Objects as Paired Keypoints
[论文理解] CornerNet: Detecting Objects as Paired Keypoints 简介首先这是一篇anchor free的文章,看了之后觉得方法挺好的,预测左上角和右下 ...
[论文理解] Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks
Faster R-CNN: Towards Real-Time Object Detection with Region Proposal Networks 简介 Faster R-CNN是很经典的t ...
[论文理解]Region-Based Convolutional Networks for Accurate Object Detection and Segmentation
Region-Based Convolutional Networks for Accurate Object Detection and Segmentation 概括这是一篇2016年的目标检测 ...
[论文理解] MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications
MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications Intro MobileNet 我 ...
[论文理解] Spatial Transformer Networks
Spatial Transformer Networks 简介本文提出了能够学习feature仿射变换的一种结构,并且该结构不需要给其他额外的监督信息,网络自己就能学习到对预测结果有用的仿射变换.因 ...

随机推荐

C++ 内联函数 inline关键字
inline 关键字主要功能是为了代替掉宏代码片段. 在C++中使用关键字inline关键字声明内联函数. inline int fun(int a,int b) { return a < ...
Jmeter 设置默认语言为中文
1.在apache-jmeter-4.0\bin目录下,打开jmeter.properties; 2.将#language=en改为#language=cn,保存 3.重新启动jmeter.
this 到底指向谁
this 的指向,是在调用函数时根据执行上下文所动态确定的. 在函数体中,简单调用该函数时(非显式/隐式绑定下),严格模式下 this 绑定到 undefined,否则绑定到全局对象 window/g ...
vue单页应用首次加载太慢之性能优化
问题描述: 最近开发了一个单页应用,上线后发现页面初始加载要20s才能完成,这就很影响用户体验了,于是分析原因,发现页面加载时有个 vendor.js达到了3000多kb,于是在网上查找了一下原因,是 ...
call apply bind sleep
1.自己实现一个call 1)利用对象的方式的形式改变this指针 funcion add; add.call(temObj) 只需要在temObj对象临时添加一个方法即可 Function.pro ...
阿里服务器+Centos7.4+Tomcat+JDK部署
适用对象本文档介绍如何使用一台基本配置的云服务器 ECS 实例部署 Java web 项目.适用于刚开始使用阿里云进行建站的个人用户. 配置要求这里列出的软件版本仅代表写作本文档使用的版本.操作时 ...
Delphi 布尔型数据
[转]实际项目中如何使用Git做分支管理 (A successful Git branching model)
来自 https://nvie.com/posts/a-successful-git-branching-model/ In this post I present the development m ...
ACM常用之异或运算的性质。
java ArrayList迭代过程中删除
第一种迭代删除方式: 第二种迭代删除方式: 第三种迭代删除: 第四种迭代删除: 第五种迭代删除: 第六种: ArrayList中remove()方法的机制,首先看源码: 真正的删除操作在fastRem ...

[论文理解] Squeeze-and-Excitation Networks