Index

Introduction
Related Works
Binary Neural Networks
XNOR-Net
Conclusion

Introduction

神经网络模型的压缩是一个很有前景的方向。由于神经网络需要较大的计算量，目前来说，我们通常在服务器上对神经网络进行训练或是计算的。移动端的神经网络在断网的情况下就失去了作用。通过一些压缩神经网络的方法，我们能够缩小神经网络的规模，并且提高计算速度。这对于实现移动端人工智能来说很有意义。
本文基于< XNOR-Net: ImageNet Classification Using Binary Convolutional Neural Networks>介绍了神经网络模型压缩的一些相关工作，以及二值化卷积神经网络BWN，还有XNOR-Net的工作原理。XNOR-Net的实现代码:[此处应有链接，等我写完初步的demo将会上传]。（由于Tensorflow暂时不支持bit操作，所以代码只作为研究用，并不能真正实现bit操作。）

Related Works

Shallow Networks浅层网络：用更浅的网络来表示训练好的网络。很多时候，神经网络会存在冗余的参数和层数，这个方法通过使用更浅的网络，达到相同的效果，减少参数加快计算。
Compressing pre-trained networks压缩训练好的模型：Deep Compression就是这样的方法。通过对模型参数进行剪枝，量化，哈夫曼编码等技巧，能够压缩模型。关于Deep Compression的介绍可以看我前几篇文章（文末有链接）。
Designing compact layers设计更简洁层: Residual layers就是一种压缩的手段。
Quantizing parameters量化参数：目前浮点数通常使用32bit表示，量化可以用更少的位数来表示参数，但是会损失一定精度。
Network binarization网络二值化：二值化是将网络完全使用+1, -1来表示，这样就可以用1bit来表示网络。Binary Weight Network 和XNOR-Net都是二值化的网络。网络二值化后，卷积可以表示为简单的加法减法，且可以大大减小计算时间。

Binary Neural Networks

Binary Neural Networks由Bengio团队在< BinaryNet: Training Deep Neural Networks with Weights and Activations Constrained to +1 or −1 >一文中提出。
其原理很简单：

BWN

其中I为Input输入，W为weight，B为二值化的weight，alpha为缩放因子。
由上式可知，一个kernel对输入进行卷积的结果，可以由二值化的weight对输入进行⊕后，再乘缩放因子得到。其中⊕表示没有乘法的卷积运算。
证明：

证明

由上式可知，J最小时，alpha和B有最优值。
展开一式：

证明

令c = WTW, n=BTB，得到：

证明

易得alpha和B的最优解：

证明

可知B = Sign(W), alpha=L1norm(W)/n. 其中n=cwh，c,w,h分布为kernel的输入通道数，宽，高。

可以通过以下算法对网络进行训练：

Algorithm

值得注意的是，我们在前向计算时使用B和alpha，而在后向传播时使用实数W进行参数更新。这是由于梯度的量级通常很小，直接对B进行更新时，求导后值为0。
在网络中加入Batch Normalization可以提升网络性能。

XNOR-Net

XNOR-Net与BWN不同的地方在于，XNOR-Net不仅将kernel进行二值化，还将input二值化。
由于证明过程与BWN相似，在这里不进行累述。

Binarization

如上图，将输入进行二值化时，由于计算L1norm时存在很多冗余的计算，XNOR-Net采用了更有效的方式：将输入在channel维度计算norm得到A，用k（k为wh大小的卷积核，其值为1/wh）对A进行卷积得到K。
之后只需要将Sign（I）与Sign（W）进行卷积，再乘K和alpha即可。
由于Sign（I）和Sign（W）都是二值化的，卷积可以通过XNOR和bit-count表示。

结构

XNOR-Net的block表示如上图。

Conclusion

总的来说，神经网络压缩是一个很有前景的方向。目前存在的问题主要是精度损失的问题。文章中将AlexNet进行压缩后，精度损失了2.9%，这对于某些任务来说是不可接受的。其次在于现在很多硬件没有成熟的二值运算。
未来我可能会开源一个基于Tensorflow的神经网络压缩的代码。由于目前Tensorflow底层代码没有支持二值运算，所以里面使用的实际上还是浮点数。因此只能作为研究或者提取训练好的参数到其他平台。

Neural Networks compression系列文章包括：

漫谈Deep Compression
XNOR-Net：二值化卷积神经网络

作者：Efackw13
链接：https://www.jianshu.com/p/f9b015cc4514
来源：简书
简书著作权归作者所有，任何形式的转载都请联系作者获得授权并注明出处。

XNOR-Net：二值化卷积神经网络的更多相关文章

二值化神经网络(BNN)基础学习(一)
目录 1.简介 2.优点 3.基本原理 3.1 权重和激活值二值化[3] 3.2 乘法优化 3.3 权重和激活值更新 4.结论[3] 参考资料 1.简介二值化神经网络,在浮点型(权重值和激活函数 ...
Opencv实现图像的灰度处理，二值化，阀值选择
前几天接触了图像的处理,发现用OPencv处理确实比較方便.毕竟是非常多东西都封装好的.可是要研究里面的东西,还是比較麻烦的,首先,你得知道图片处理的一些知识,比方腐蚀,膨胀,仿射,透射等,还有非常多 ...
深度学习实践-强化学习-bird游戏 1.np.stack(表示进行拼接操作) 2.cv2.resize(进行图像的压缩操作) 3.cv2.cvtColor(进行图片颜色的转换) 4.cv2.threshold(进行图片的二值化操作) 5.random.sample(样本的随机抽取)
1. np.stack((x_t, x_t, x_t, x_t), axis=2) 将图片进行串接的操作,使得图片的维度为[80, 80, 4] 参数说明: (x_t, x_t, x_t, x_t) ...
OpenCV图像的全局阈值二值化函数（OTSU）
cv::threshold(GrayImg, Bw, 0, 255, CV_THRESH_BINARY | CV_THRESH_OTSU);//灰度图像二值化 CV_THRESH_OTSU是提取图像最 ...
opencv二值化处理
#include "stdafx.h"//对一张图片进行二值化处理 IplImage *pSrclmg =NULL;//载入的图片IplImage *pDeclmg =NULL;/ ...
[iOS OpenCV的使用，灰度和二值化]
看网上方法很多,但版本都不够新,我看了网上一些知识,总结了下,来个最新版Xcode6.1的. 最近主要想做iOS端的车牌识别,所以开始了解OpenCV.有兴趣的可以跟我交流下哈. 一.Opencv的使 ...
java 图像灰度化与二值化
转载:http://www.chinasb.org/archives/2013/01/5053.shtml 1: package org.chinasb.client; 2: 3: import ja ...
OpenCV图像的二值化
图像的二值化: 与边缘检测相比,轮廓检测有时能更好的反映图像的内容.而要对图像进行轮廓检测,则必须要先对图像进行二值化,图像的二值化就是将图像上的像素点的灰度值设置为0或255,这样将使整个图像呈现出 ...
OpenCV中对图像进行二值化的关键函数——cvThreshold()。
函数功能:采用Canny方法对图像进行边缘检测函数原型: void cvThreshold( const CvArr* src, CvArr* dst, double threshold, doub ...

随机推荐

day 05 预科
目录文本处理什么是文件什么是文本视频/音频文件(多媒体文件) 我们如何通过文本编辑器去控制txt文件文本高级文本处理+高级分析文本处理什么是文件文件是操作系统提供的一个特殊概念,拿来 ...
nodejs express+nodemon 实现自动刷新（热更新）
1.全局安装 nodemon npm i nodemon -g -f 2. 在项目中安装nodemon npm i nodemon -f 3.使用nodemon 在express项目中运行nodem ...
Linux命令——parted
参考:8 Linux ‘Parted’ Commands to Create, Resize and Rescue Disk Partitions 简介 parted是磁盘分区操作工具,支持多种磁盘分 ...
【学英语~磨耳朵】2013年以来看过的所有美剧&电影&纪录片等等
我看美剧看太多了,而且同一部剧刷很多遍.这种coach potato的做法其实一点也不好,英文会好可能只是意外收获.下面是单子: 美剧: 老友记-情景喜剧-10季全看.至今还在网易云音乐循环10季音频 ...
模型融合---CatBoost 调参总结
一.参数速查 1.通用参数 2.性能参数 3.处理单元设置二.分类三.回归
压缩及解压命令gzip、bzip2、tar
1. gzip 描述:压缩与解压缩用法:gzip[选项]...[文件名称]... 选项:-d 解压 gzip hello.txt # 文件压缩后名为hello.txt.gz gzip -d ...
云服务器CentOS7.4下搭建GitLab
一.Git.GitHub.GitLab的区别 Git是版本控制系统,Github是在线的基于Git的代码托管服务. GitHub是2008年由Ruby on Rails编写而成.GitHub同时提供付 ...
UVA11424 GCD - Extreme (I)[数论]
其实这题我也没太明白... 我们要求 \[ \sum_{i=1}^{N-1}\sum_{j=i+1}^Ngcd(i,j) \] 引理: 我们要求\(gcd(i,j)=k\)的个数,可转化为求\(gcd ...
Alpha冲刺(8/10)——追光的人
1.队友信息队员学号队员博客 221600219 小墨 https://www.cnblogs.com/hengyumo/ 221600240 真·大能猫 https://www.cnblogs. ...
CodeForces - 115E：Linear Kingdom Races （DP+线段树+lazy）
pro: 从左到有有N个车道,都有一定程度损坏,所以有不同的修理费a[]: 有M场比赛,每场比赛的场地是[Li,Ri],即如果这个区间的车道都被修理好,则可以举办这个比赛,并且收益是Pi.问最多得到多 ...

XNOR-Net：二值化卷积神经网络