1. 故事

现有的卷积操作：在局部感受野内，提取空域（spatial-wise）和通道域（channel-wise）信息。

这篇文章希望提高网络的表示能力，提出了一个称为“挤压-激活（Squeeze-and-Excitation, SE）”块，能够通过显式建模通道依赖性，重新校准通道域特征。

【我猜是一种通道注意力机制】

该SENet在2017年ILSVRC分类比赛上获得第一名。

对于深度学习优化，有两种科研方向：（1）改进推理结构；（2）改进表示结构和方法。本文是后者。

2. SENet

2.1 概况

一个SE block如图。对于任意变换\(F_{tr}: X \to U\)（例如一组或多组卷积），我们都可以采用后续操作，来重新校准（recalibrate）通道：

首先通过一个挤压算子\(F_{sq}\)，每个通道都被挤压成一个表示元素。\(C\)个通道就有\(C\)维向量。
通过一个激活算子\(F_{ex}\)，学习每一个通道的权重。
最终输出是\(U\)的原通道加权放缩后的通道。权值就是上一步学习的。

整个SENet就是多个SE block的堆叠。

这种SE block可以作为插件，在任意深度嵌入（drop-int）。但作者发现，在不同层嵌入的作用也是不同的：

在浅层嵌入，SE block可以帮助激活有用的、与类别没有太大关系的特征，从而帮助增强共享的底层特征。
在深层嵌入，SE block对类别更敏感，会起到一种（与类别有关的）特征选择的作用。

因此，如果在整个网络中堆叠使用，效果更佳哦。

2.2 具体

挤压：在某通道上，取该通道的全局均值。简单有效。
激活：两层FC，中间有一次ReLU非线性激活，最后是逻辑回归。在第一次FC，\(C\)层通道减少至\(C/r\)；第二次FC，通道数又恢复至\(C\)。这相当于一个bottleneck，目的是为了降低复杂度。\(r\)的选取见第四节，取16。

最终，我们将SE block嵌入Inception和ResNet试试：

在选择激活方法时，我们不希望让输出变成one-hot向量，即不希望通道权重是互斥的。

3. 实验

作者不仅考察了装载SE block前后的精度，还考察了前后计算效率，如表：

可见，在err下降的同时，GFLOPs上升微乎其微。

不仅如此，SE block还能让MobileNet和ShuffleNet显著改善：

收敛过程也更快：

Paper | Squeeze-and-Excitation Networks的更多相关文章

Paper | Densely Connected Convolutional Networks
目录黄高老师190919在北航的报告听后感故事背景网络结构 Dense block DenseNet 过渡层成长率瓶颈层细节实验发表在2017 CVPR. 摘要 Recent work ...
Paper Reading:Deep Neural Networks for YouTube Recommendations
论文:Deep Neural Networks for YouTube Recommendations 发表时间:2016 发表作者:(Google)Paul Covington, Jay Adams ...
Paper Reading:Deep Neural Networks for Object Detection
发表时间:2013 发表作者:(Google)Szegedy C, Toshev A, Erhan D 发表刊物/会议:Advances in Neural Information Processin ...
InsightFace源码以及pre-train模型以及使用
一下摘自:https://blog.csdn.net/Fire_Light_/article/details/79602705 论文链接:ArcFace: Additive Angular Margi ...
Squeeze-and-Excitation Networks
Squeeze-and-Excitation Networks Paper 近些年来,卷积神经网络在很多领域都取得了巨大的突破.而卷积核作为卷积神经网络的核心,通常被看做是在局部感受野上,将空间上(s ...
SENet（Squeeze-and-Excitation Networks）算法笔记---通过学习的方式来自动获取到每个特征通道的重要程度，然后依照这个重要程度去提升有用的特征并抑制对当前任务用处不大的特征
Momenta详解ImageNet 2017夺冠架构SENet 转自机器之心专栏作者:胡杰本届 CVPR 2017大会上出现了很多值得关注的精彩论文,国内自动驾驶创业公司 Momenta 联合机器 ...
论文笔记-Squeeze-and-Excitation Networks
作者提出为了增强网络的表达能力,现有的工作显示了加强空间编码的作用.在这篇论文里面,作者重点关注channel上的信息,提出了"Squeeze-and-Excitation"(SE ...
《Self-Attention Generative Adversarial Networks》里的注意力计算
前天看了 criss-cross 里的注意力模型仔细理解了在: https://www.cnblogs.com/yjphhw/p/10750797.html 今天又看了一个注意力模型 < ...
论文阅读笔记六十:Squeeze-and-Excitation Networks(SENet CVPR2017)
论文原址:https://arxiv.org/abs/1709.01507 github:https://github.com/hujie-frank/SENet 摘要卷积网络的关键构件是卷积操作, ...
Deep learning_CNN_Review：A Survey of the Recent Architectures of Deep Convolutional Neural Networks——2019
CNN综述文章的翻译 [2019 CVPR] A Survey of the Recent Architectures of Deep Convolutional Neural Networks 翻 ...

随机推荐

POJ1961Period(kmp+循环节)
传送门题目大意:输出字符串所有前缀的循环节个数,下标从1开始,i 和1-i循环节的个数题解:网上摘得 KMP最小循环节.循环周期: 定理:假设S的长度为len,则S存在最小循环节,循环节的长度L为 ...
66000][12505] Listener refused the connection with the following error: ORA-12505, TNS:listener does not currently know of SID given in connect descriptor oracle.n et.ns.NetException: Listener refuse
新装的idea开发工具后连接数据库出现如题所示错误. 1.网上搜了不少的文章,没有解决我的问题.后来细心看了一下url: 一开始url是这样子的. jdbc:oracle:thin:@:s21_pdb ...
趣谈Linux操作系统学习笔记：第二十四讲
一.小内存的分配基础 1.kmem_cache_alloc_node的作用通过这段代码可以看出,它调用了kmem_cache_alloc_node函数,在task_struct的缓存区域task_s ...
PHP 构造函数
在PHP5以前的版本中,构造函数的名称必须与类名相同,这种方法在PHP5中仍然可以使用,但现在已经很少有人用了.PHP5以及之后的版本,构造函数用__construct()方法来声明,这样做的好处是可 ...
《js高程》笔记总结一：基本概念（语法，数据类型，流程控制，函数）
1.ECMA 欧洲计算机制造商协会 2.";"的作用代码后的:当压缩代码时可以用于压缩代码,有效的间隔开代码. 3.数据类型有 undefined,null,boolean,st ...
使用vue组件需要注意的4个细节
细节1:table(表格)中直接引用自定义组件出现的bug 如上图,tr本应在tbody中面,现在却是同级.造成的原因是h5规定table里必须有tbody,tbody中必须有tr, 当tbody中引 ...
Linux常用命令之网络命令
write命令 write命令用于向指定登录用户终端上发送信息.通过write命令可传递信息给另一位登入系统的用户,当输入完毕后,键入EOF表示信息结束,write命令就会将信息传给对方.如果接收信息 ...
同步IDEA系列软件的设置,再也不用但心我的配置丢失了
同步IDEA系列软件的设置问题描述:重装idea,之前配置好的快捷键就没有了.之前一直是每隔几个月要把配置导出一下,上传百度云盘.现在好了,通过配置可以自动同步配置了.我再也不用但心配置丢失了. 快 ...
Go template高级用法、深入详解、手册、指南、剖析
入门示例以下为test.html文件的内容,里面使用了一个template语法{{.}}. <!DOCTYPE html> <html> <head> <m ...
百度ai语音识别
//语音识别功能 var APP_ID = "149**323"; var API_KEY = "N1Po****o6WPUeU8er"; var SECRET ...

Paper | Squeeze-and-Excitation Networks