【论文阅读】Clustering Convolutional Kernels to Compress Deep Neural Networks

文章：Clustering Convolutional Kernels to Compress Deep Neural Networks

链接：http://openaccess.thecvf.com/content_ECCV_2018/papers/Sanghyun_Son_Clustering_Kernels_for_ECCV_2018_paper.pdf

这篇文章主要是研究模型的压缩和加速。其他的文章大多数都只研究网络结构中的冗余参数或影响不大的结构，用剪枝的方法来压缩模型。作者从另一个方面研究，将相似的卷积统一表示，极大程度压缩了所需储存内存，并与剪枝的方法不冲突（可同时使用）。

贡献：

1.提出了一种新的方法，将k-means聚类应用于2d核上，以压缩和加速cnn。这是第一个考虑内核冗余空间模式的网络压缩方法。

2.提出的变换不变聚类方法扩展了具有几何变换的核心点的有效数目。

3.实验表明，提出的的方法普遍适用于各种cnn架构和数据集。特别是，我们的压缩后的resnet在lsvrc12图像分类上比原始模型在10倍以上的压缩比上达到了更高的精确度。

一、用两个参数表示一个卷积核（压缩）

文中选择聚类的卷积核为3*3；这在大多数现有模型中出现的最多。VGG16有1,634,496 多个3×3 kernels 占了所有参数量的99.9%。ResNet-56 和DenseNet-12-40 分别有94,256 和101,160 kernels，也占了参数量的绝大部分。

聚类的为2维卷积核，。C_out为卷积输出通道，C_in为卷积输入通道，h,w为卷积图像大小。每个卷积核的计算可以写为。其中i为输入通道，j为输出通道。用k-means将w_ij聚为k类，表达式为，其中u_n为正常的求均值，，与传统的k-means没有任何区别。

由于内核权重的分布可以在不同的卷积层之间变化，我们利用卷积的基本概念，对所有的核进行归一化处理。具体地说，我们把形状相似但规范不同的内核放在一起处理，因为它们在过滤中表现出相似的行为。因此，我们使用归一化的内核，而不是直接计算内核与其原值之间的距离。K-means 聚类表达写为：，其中为归一化的卷积核。为放缩的比例参数。为3*3卷积核的中心元素。

举个例子，对于一个卷积核w_ij，可以近似的用s_ij*u_lij表示。其中s表示放缩比例，u表示其所属的聚类中心，l为所属的中心在所有聚类中心中的编号。这个时候，一个3*3的卷积核，我们可以用s_ij和l_ij两个参数近似表示。

二、一些基于共享参数的计算小技巧（加速）

正常计算卷积的式子为，对于一个卷积层而言，需要计算2*w*h*C_in*C_out个乘法。

先说（a）先加再卷积，，对于同一个输出而言，我们的聚类中心设为k个，即这里用到的卷积核不会超过k个，不妨即为v个。则对于不同的输入，如果乘以的卷积核相同，我们可以先将这些输入相加，最后再算卷积乘法。即对一个输出计算v个乘法，当然，每个输出的用到的聚类中心v可能不同，这一层卷积的乘法总数为所有输出对应的v相加。

再说（b）先卷积再相加，，。因为是同一个输入，它的正则化系数（放缩比例）一定相同，即可以将s提出来最后乘，假设这个输入总共用到λ个聚类中心。这时对于这个输入，只需要算λ乘法。

作者使用下面三个模型在CIFAR10上进行了实验，仅对3*3的卷积核进行聚类近似表示，C128代表聚类中心数目为128.分类效果没有明显下降。注：网络进行了一些小修改，例如VGG16的三个全连接变为一个。

然后分析了压缩比例和提升速度

，N为网络中3*3核的数目，b_w为一个权重占内存大小（32b），h*w为图大小，k为聚类中心数目，b_s为正则化参数（放缩比例）占内存大小。所以说，上式分子为传统需要内存，储存每个权重的参数。而分母则为文中优化后的占内存，前半部分为这N个核的所属聚类中心编号和放缩参数的内存，后半部分为聚类中心的内存。由于k远远小于N，近似等于。。

加速的话上面已经分析了加速算法（a）add-then-conv和（b）conv-then-add，v和λ就是用到的聚类中心的个数。由于这两个算法不能同时使用，所以取最小值。约等于是因为加法计算也是要时间的。

三、变换不变聚类法（TIC）

对一个聚类中心，它的水平翻转，竖直翻转，旋转90°。这八种上图做所示算作一个聚类中心。。注意：不是在原来的聚类结果上再聚一次类，而是在原有的聚类结果上进行修正，即考虑了变换的情况下，对原来的没有聚类过的数据上进行变换不变聚类。这时，聚类的表达式就变成了下面这个样子。

四、实验结果

C32代表聚类中心为32，C64代表聚类中心为64。M2表示模型分为两部分，前10层共用一组聚类中心，后3层共用另一组聚类中心。M13代表13层卷积层每层都用一组聚类中心。TIC则是变换不变聚类的缩写，2,4,8分别表示只有竖直翻折，只有竖直水平翻折，翻折并旋转。注：有可能出现所有核数目没有预设的聚类中心个数多的情况，这时两者取最小。

文章的方法和剪枝的方法不冲突，可以同时使用，使得压缩和计算效果更好。P代表最常见的剪枝，基于L1去除一半的卷积核。原文：P is simple thresholding which removing 50% of the spatial kernels from each layer based on their L1 norms；filter-pruning则是一篇文章（Pruning filters for efficient convnets. In: International Conference on Learning Representations (2017)）提出的剪枝方法，我没去看就不解说了。

这是在最近很火的有瓶颈结构的网络上做的实验，因为1*1的卷积占了大部分，压缩的整体效果没有在VGG16上明显。但是错误率并没有明显上升，表明瓶颈对正常网络的影响在这种压缩表示中没有消失。

最后是对其他压缩算法的比较。由于大家的硬件软件的配置不一样，这些东西并不好比较，作者也只比较了一部分。

五、其他：

这篇文章和大多数压缩的想法不太一样，用了索引和聚类的方式近似的表示出所有需要储存的参数来进行压缩。和大多数文章中采用的去除冗余的卷积结构的做法可以同时使用。但是文章只描述了3*3的卷积，提到了对7*7卷积做了相似的事情。但是对1*1卷积暂时没有好的处理方式。

【论文阅读】Clustering Convolutional Kernels to Compress Deep Neural Networks的更多相关文章

论文阅读笔记十四：Decoupled Deep Neural Network for Semi-supervised Semantic Segmentation（CVPR2015）
论文链接:https://arxiv.org/abs/1506.04924 摘要该文提出了基于混合标签的半监督分割网络.与当前基于区域分类的单任务的分割方法不同,Decoupled 网络将分割与分类 ...
论文阅读笔记六十五:Enhanced Deep Residual Networks for Single Image Super-Resolution(CVPR2017)
论文原址:https://arxiv.org/abs/1707.02921 代码: https://github.com/LimBee/NTIRE2017 摘要以DNN进行超分辨的研究比较流行,其中 ...
论文笔记——Channel Pruning for Accelerating Very Deep Neural Networks
论文地址:https://arxiv.org/abs/1707.06168 代码地址:https://github.com/yihui-he/channel-pruning 采用方法这篇文章主要讲诉 ...
论文阅读---Reducing the Dimensionality of Data with Neural Networks
通过训练多层神经网络可以将高维数据转换成低维数据,其中有对高维输入向量进行改造的网络层.梯度下降可以用来微调如自编码器网络的权重系数,但是对权重的初始化要求比较高.这里提出一种有效初始化权重的方法,允 ...
论文翻译：2022_PACDNN: A phase-aware composite deep neural network for speech enhancement
论文地址:PACDNN:一种用于语音增强的相位感知复合深度神经网络引用格式:Hasannezhad M,Yu H,Zhu W P,et al. PACDNN: A phase-aware compo ...
论文翻译：2018_Source localization using deep neural networks in a shallow water environment
论文地址:https://asa.scitation.org/doi/abs/10.1121/1.5036725 深度神经网络在浅水环境中的源定位摘要: 深度神经网络(DNNs)在表征复杂的非线性关 ...
论文笔记：Mastering the game of Go with deep neural networks and tree search
Mastering the game of Go with deep neural networks and tree search Nature 2015 这是本人论文笔记系列第二篇 Nature ...
论文笔记-IGCV3：Interleaved Low-Rank Group Convolutions for Efficient Deep Neural Networks
论文笔记-IGCV3:Interleaved Low-Rank Group Convolutions for Efficient Deep Neural Networks 2018年07月11日 14 ...
[论文阅读笔记] metapath2vec: Scalable Representation Learning for Heterogeneous Networks
[论文阅读笔记] metapath2vec: Scalable Representation Learning for Heterogeneous Networks 本文结构解决问题主要贡献算法 ...

随机推荐

Linux 修改网卡名
1. 修改网卡配置文件 vim /etc/sysconfig/network-scripts/ifcfg-ens32 (“ens32”为当前网卡名) 将NAME.DEVICE项修改为eth0 2. ...
LeetCode刷题笔记（2）HashMap相关应用
1.问题描述 Example 1: Input: A = "this apple is sweet", B = "this apple is sour" Out ...
mysql的一些常用操作（一）
1.启动Mysql服务 net start mysql 2.进入mysql环境中,由于自己没有设置密码,直接回车进入即可(要将bin加入到环境变量path中) mysql -u root -p 3.创 ...
一般链表实现集合运算（C语言）
最近在学习数据结构,遇到以下问题: 假设集合A = (c, b, e, g, f, d),B = (a, b, n, f),利用一般线性链表实现集合运算(A-B)∪(B-A). 分析: 上面的问题只要 ...
python实现人工智能Ai抠图功能
这篇文章主要介绍了python实现人工智能Ai抠图功能,本文通过实例代码给大家介绍的非常详细,具有一定的参考借鉴价值,需要的朋友可以参考下自己是个PS小白,没办法只能通过技术来证明自己. 话不多说, ...
H5 + WebGL 实现的楼宇自控 3D 可视化监控
前言智慧楼宇和人们的生活息息相关,楼宇智能化程度的提高,会极大程度的改善人们的生活品质,在当前工业互联网大背景下受到很大关注.目前智慧楼宇可视化监控的主要优点包括: 智慧化 -- 智慧楼宇是一个生态 ...
SROP的一个实例
以前一直只是大概看过这种技术,没实践过,今天刚好遇到一道题,实践了一波,确实很方便 unmoxiao@cat ~/s/pd_ubuntu> r2 -A smallest 00:54:15 War ...
IM里“附近的人”功能实现原理是什么？如何高效率地实现它？
1.引言基本上以陌生人社交为主的IM产品里,都会增加“附近的人”.“附近的xxx”这种以LBS(地理位置)为导向的产品特色(微信这个熟人社交产品里为啥也有“附近的人”?这当然是历史原因了,微信当初还 ...
爬虫学习--Requests库详解 Day2
什么是Requests Requests是用python语言编写,基于urllib,采用Apache2 licensed开源协议的HTTP库,它比urllib更加方便,可以节约我们大量的工作,完全满足 ...
创建linux系统下的虚拟机
1.打开VMware软件 2.创建新的虚拟机 3.下一步 4.点击稍后安装操作系统——下一步 5.选择其中版本我的镜像是这个版本所以选择这个 6.下一步设置虚拟机名称要保存的位置 7 ...

【论文阅读】Clustering Convolutional Kernels to Compress Deep Neural Networks

【论文阅读】Clustering Convolutional Kernels to Compress Deep Neural Networks的更多相关文章

随机推荐

热门专题