近期，动态网络在加速推理这方面有很多研究，DGC(Dynamic Group Convolution)将动态网络的思想结合到分组卷积中，使得分组卷积在轻量化的同时能够加强表达能力，整体思路直接清晰，可作为网络设计时的一个不错的选择

来源：晓飞的算法工程笔记公众号

论文: Dynamic Group Convolution for Accelerating Convolutional Neural Networks

Introduction

分组卷积目前广泛应用于轻量级网络中，但论文分析发现分组卷积有两个致命的缺点：

由于引入稀疏连接，减弱了卷积的表达能力，导致性能的降低，特别对于难样本。

固定的连接模式，不会根据输入样本的特性而改变。而论文通过可视化DenseNet中间层的输入维度对输出维度的贡献发现，不同的输入维度对不同的输出的贡献是不一样的，而且这个贡献关系在不同的输入样本之间也存在差异。

参考动态网络的思想，论文提出动态分组卷积(DGC, dynamic group convolution)，为每个分组引入小型特征选择器，根据输入特征的强度动态决定连接哪些输入维度，而多个分组能捕获输入图片中不同的互补特征，学习到丰富的特征表达能力。为此，动态分组卷积能够在保持原网络的完整结构下，自适应地为每个分组的选择最相关输入维度。

Group-wise Dynamic Execution

DGC的结构如图2所示，将输出维度分成多个分组，每组都配有辅助head，用来决定那些输入维度用于卷积计算。每个分组的逻辑如下：

saliency generator生成输入维度的重要性分数。
input channel selector采用gating策略根据重要性评分来动态决定输入维度最重要部分。
对选择的输入维度子集进行正常的卷积操作。

最后，将所有head的输出concate并打乱，送入后续的BN层和激活层。

Saliency Generator

saliency generator为每个输入维度指定一个分数用来表示其重要程度，每个head都有特定的saliency generator，用来引导不同的head使用不同的输入维度，从而增加特征的多样化表达。saliency generator遵循了SE block的设计，对于第\(i\)个head，重要性向量\(g^i\)的计算为：

\(g^i\in \mathbb{R}^{1\times C}\)代表输入维度的重要性向量，\((z)_+\)代表ReLU激活，\(p\)将每个输入特征图缩小为单个标量，论文采用使用全局平均池化，\(\beta^{i}\)和\(W^{i}\)为可学习参数，\(\beta^{i}\)为偏置，\(W^{i}\)两部转换操作\(\mathbb{R}^{1\times C}\mapsto \mathbb{R}^{1\times C/d}\mapsto \mathbb{R}^{1\times C}\)，其中d为压缩比。这里的\(x^{i}\)为全部输入维度，即在每个head中，所有的输入维度都是候选。

Gating Strategy

在获得重要性向量后，下一步是决定当前head选择哪些输入维度参与后续的卷积操作，可以用head-wise阈值或network-wise阈值来过滤分数较低的输入特征。论文使用的是head-wise阈值，给定目标裁剪比例\(\zeta\)，第\(i\)个head的阈值\(\tau^{i}\)满足：

重要性分数有两个作用：1) 重要性分数小于阈值的将被去除 2) 剩余的维度会使用对应的重要性分数进行加权，得到加权特征\(y^{i}\in \mathbb{R}^{(1-\zeta)C\times H\times W}\)。假设head数量为\(\mathcal{H}\)，第\(i\)个head的卷积核为\(w^{i}\subset \theta^{i}, \theta^{i} \in \mathbb{R}^{k\times k\times C\times \frac{C^{'}}{\mathcal{H}}}\)，则对应的卷积计算为：

公式7其实就是将选择的特征和对应的权值选出来进行常规卷积计算，\(\mathcal{I}_{top} \lceil k\rceil (z)\)返回\(z\)中最大的\(k\)个元素的下标，输出\(x^{'i}\in \mathbb{R}^{\frac{C^{'}}{\mathcal{H}}\times H^{'}\times W^{'}}\)，\(\otimes\)为常规卷积。在DGC的最后，各输出会合并然后打乱，输出\(x^{'}\)。

为了让重要性分数尽量稀疏，引入lasso损失：

\(\mathcal{L}\)为DGC层数，\(\lambda\)为预设的超参数。

Computation Cost

卷积核大小为\(k\)的常规卷积MAC为\(k^2C^{'}CH^{'}W^{'}\)，而DGC中，每个head的saliency generator和卷积的MAC为\(\frac{2C^2}{d}\)和\(k^2(1-\zeta)C\frac{C^{'}}{\mathcal{H}}H^{'}W^{'}\)。所以DGC层的MAC相对于常规卷积的节省比例为：

head的数量\(\mathcal{H}\)几乎对整体的计算消耗没有影响。

Invariant to Scaling

DGC方法整体思想与动态剪枝算法FBS有点类似，FBS算法的流程如上图所示，计算的是输出维度的重要性分数，在最后的特征输出时使用重要性分数进行了加权，没有采用BN。这种加权方式会导致每个样本的特征分布差异较大，造成internal covariate shift问题。

而DGC虽然也使用重要性分数进行特征加权，但其对最后的卷积结果进行BN+ReLU归一化来避免这个问题：

Training DGC Networks

DGC网络从零开始训练，不需要预训练模型。在反向传播阶段，仅计算推理时选择的维度的相关权值的梯度，其它设为零。为了防止剪枝导致训练损失变化过大，在训练过程逐步增加裁剪比例\(\zeta\)。整体训练分为3个阶段，第一阶段(前1/12 epochs)用于warm up，第二阶段逐步提升剪裁比例进行训练，第三阶段(后1/4 epochs)用于fine-tune稀疏网络，学习率下降采用余弦退火下降方法。

Experiments

与剪枝方法和动态维度选择方法对比，DGC-G使用network-wise阈值进行维度选择，这个阈值是在训练中学习来的。

与其它轻量级网络对比。

不同参数设置的性能对比。

可视化浅层和深层的重要性分数和过滤情况。

DGC网络某层的其中一个head对于各输入维度的裁剪概率。

Conclustion

DGC(Dynamic Group Convolution)将动态网络的思想结合到分组卷积中，使得分组卷积在轻量化的同时能够加强表达能力，整体思路直接清晰，可作为网络设计时的一个不错的选择。

如果本文对你有帮助，麻烦点个赞或在看呗～

更多内容请关注微信公众号【晓飞的算法工程笔记】

DGC：真动态分组卷积，可能是解决分组特征阻塞的最好方案 | ECCV 2020 Spotlight的更多相关文章

CondenseNet：可学习分组卷积，原作对DenseNet的轻量化改造 | CVPR 2018
CondenseNet特点在于可学习分组卷积的提出,结合训练过程进行剪枝,不仅能准确地剪枝,还能继续训练,使网络权重更平滑,是个很不错的工作来源:晓飞的算法工程笔记公众号论文:Neural ...
Java_java动态编译整个项目，解决jar包找不到问题
java动态编译整个项目,解决jar包找不到问题原文:http://itzyx.com/index.php/javac/ 动态将java文件编译为class文件解决方案:将temp\sdl\src目录 ...
使用jquery的load方法设计动态加载，并解决浏览器前进、后退、刷新等问题
继上一篇使用jquery的load方法设计动态加载,并解决被加载页面JavaScript失效问题解决了后台业务系统的部分动态加载问题,然而该框架离正常的用户体验还存在一些问题,如:浏览器的前进.后 ...
Group Convolution分组卷积，以及Depthwise Convolution和Global Depthwise Convolution
目录写在前面 Convolution VS Group Convolution Group Convolution的用途参考博客:blog.shinelee.me | 博客园 | CSDN 写在 ...
分组卷积+squeezenet+mobilenet+shufflenet的参数及运算量计算
来一发普通的二维卷积 1.输入feature map的格式为:m * m * h1 2.卷积核为 k * k 3.输出feature map的格式为: n * n * h2 参数量:k * k * h ...
php面试题二--解决网站大流量高并发方案（从url到硬盘来解决高并发方案总结）
php面试题二--解决网站大流量高并发方案(从url到硬盘来解决高并发方案总结) 一.总结从外到内解决网站大流量高并发问题---从提交一个url开始(从用户按下搜索栏回车键开始) url最开始会到d ...
SEPC：使用3D卷积从FPN中提取尺度不变特征，涨点神器 | CVPR 2020
论文提出PConv为对特征金字塔进行3D卷积,配合特定的iBN进行正则化,能够有效地融合尺度间的内在关系,另外,论文提出SEPC,使用可变形卷积来适应实际特征间对应的不规律性,保持尺度均衡.PConv ...
微信分组群发45028，微信分组群发has no masssend quota hint
微信分组群发45028,微信分组群发has no masssend quota hint >>>>>>>>>>>>>> ...
echarts解决一些大屏图形配置方案汇总
本文主要记录使用echarts解决各种大屏图形配置方案. 1.说在前面去年经常使用echarts解决一些可视化大屏项目,一直想记录下使用经验,便于日后快速实现.正好最近在整理文档,顺道一起记录在博客 ...
Python中正则匹配使用findall,捕获分组(xxx)和非捕获分组(?:xxx)的差异
转自:https://blog.csdn.net/qq_42739440/article/details/81117919 下面是我在用findall匹配字符串时遇到的一个坑,分享出来供大家跳坑. 例 ...

随机推荐

HTMLElement对象
HTMLElement对象任何HTML元素都继承于HTMLElement对象,一些元素直接实现这个接口,而另一些元素通过多层继承来实现它. 属性从其父元素Element继承属性,并从Documen ...
手动实现apply、call、bind
手动实现apply.call.bind 每个Function对象都存在apply().call().bind()方法,其作用都是可以在特定的作用域中调用函数,等于设置函数体内this对象的值,以扩充函 ...
OpenStack调度器
计算使用 nova-scheduler 服务来确定如何调度计算请求默认配置中,调度程序会考虑以下所有条件的主机: 位于请求的可用区 (map_az_to_placement_aggregate) 放 ...
collections模块下的defaultdict用法
defaultdict from collections import defaultdict s=[('yellow',1),('blue', 2), ('yellow', 3), ('blue', ...
基于Python GDAL为长时间序列遥感图像绘制时相变化曲线图
本文介绍基于Python中gdal模块,对大量多时相栅格图像,批量绘制像元时间序列折线图的方法. 首先,明确一下本文需要实现的需求:现有三个文件夹,其中第一个文件夹存放了某一研究区域原始的多时 ...
矩池云教程｜体验 OpenAI 最近推出的 3D 生成模型 Shap-E！
Shap-E 是由 OpenAI 最近推出的3D生成模型,使用者可以通过简单的文字或图像进行三维模型的生成,OpenAI 认为相比于点云的生成模型Point-E,Shap-E的收敛更快.本文将展示如何 ...
用宝塔设立分发Directory.Build.props及其Import文件的网站
新建站点服务器名称我们约定是dev.amihome.cn 创建的默认站点有下面4个文件把本地的文件,用宝塔上传上图我们是把本地的Directory.Build.props文件上传到了网站的根目录 ...
【Azure Key Vault】是否有直接方法将Azure Key Vault中的机密名称/机密值到处成文件呢？
问题描述是否有直接方法将Azure Key Vault中的机密名称/机密值导出,保存为一个文件呢? 问题解答 Azure Key Vault 没有直接提供Secret 导出文件(如xlsx格式)的方 ...
C++//vector存放自定义数据类型
1 //vector存放自定义数据类型 2 3 #include <iostream> 4 #include <string> 5 #include<fstream> ...
gitlab推送代码触发jenkins构建
预期:推送devloop或者master分支的代码, 自动执行jenkins 发布测试环境首先,jenkins中需要安装如下插件打开一个任务配置,构建触发器中勾选"Build when ...

DGC：真动态分组卷积，可能是解决分组特征阻塞的最好方案 | ECCV 2020 Spotlight