论文笔记——Data-free Parameter Pruning for Deep Neural Networks

清水汪汪 2024-09-01 08:04:45 原文

论文地址：https://arxiv.org/abs/1507.06149

1. 主要思想

权值矩阵对应的两列i,j，如果差异很小或者说没有差异的话，就把j列与i列上(合并，也就是去掉j列)，然后在下一层中把第j行的权值累加在第i像。这个过程就想象一下隐藏层中少一个单元，对权值矩阵的影响。整体思想还是考虑权值矩阵中列的相似性，有点类似于聚类。然后作者给出了一种计算相似性的方法。

2. 原理

假设一个隐藏层，一个输出单元，那么网络表达式如下：

我们可以看到下面这个图：如果两个权值集合W1和W4相等或者相差不大的话，我们可以合并W1和W4，然后累加输出的权值。也就说下图对应两个权值矩阵，在第一个权值矩阵中，删除第4列，然后在第二个权值矩阵中将第四行累加在第一行上。

但是有一个问题就是，权值完全相等的可能比较少或者没有，那么我们就把条件放宽，差异比较小的，那么怎么衡量呢。请看下面的分析。

3. 相似条件

如果Wi和Wj相等，那么两个输出的误差为：

进一步化简，然后两边求期望可以得到以下：

那么我们可以得到判断是否可以合并的条件：

解释就是：如果两列权值的差异较少，且aj作为下一层的输入权值不大，那么就可以将i，j合并。

4. 合并过程

5. 结果

MNIST上85%的压缩，AlexNet上35%的压缩。这篇文章的可解释性还是很强的，但是可能效果没有这么的好，所以发在了BMVC上吧。

论文笔记——Data-free Parameter Pruning for Deep Neural Networks的更多相关文章

论文笔记：（2019CVPR）PointConv: Deep Convolutional Networks on 3D Point Clouds
目录摘要一.前言 1.1直接获取3D数据的传感器 1.2为什么用3D数据 1.3目前遇到的困难 1.4现有的解决方法及存在的问题二.本文idea 2.1 idea来源 2.2 初始思路 2.3 ...
论文笔记：分形网络（FractalNet: Ultra-Deep Neural Networks without Residuals）
FractalNet: Ultra-Deep Neural Networks without Residuals ICLR 2017 Gustav Larsson, Michael Maire, Gr ...
论文笔记之：Spatially Supervised Recurrent Convolutional Neural Networks for Visual Object Tracking
Spatially Supervised Recurrent Convolutional Neural Networks for Visual Object Tracking arXiv Paper ...
论文笔记（7）：Constrained Convolutional Neural Networks for Weakly Supervised Segmentation
UC Berkeley的Deepak Pathak 使用了一个具有图像级别标记的训练数据来做弱监督学习.训练数据中只给出图像中包含某种物体,但是没有其位置信息和所包含的像素信息.该文章的方法将imag ...
论文笔记：Mastering the game of Go with deep neural networks and tree search
Mastering the game of Go with deep neural networks and tree search Nature 2015 这是本人论文笔记系列第二篇 Nature ...
论文笔记-IGCV3：Interleaved Low-Rank Group Convolutions for Efficient Deep Neural Networks
论文笔记-IGCV3:Interleaved Low-Rank Group Convolutions for Efficient Deep Neural Networks 2018年07月11日 14 ...
《Improving Deep Neural Networks:Hyperparameter tuning, Regularization and Optimization》课堂笔记
Lesson 2 Improving Deep Neural Networks:Hyperparameter tuning, Regularization and Optimization 这篇文章其 ...
论文翻译：2018_Source localization using deep neural networks in a shallow water environment
论文地址:https://asa.scitation.org/doi/abs/10.1121/1.5036725 深度神经网络在浅水环境中的源定位摘要: 深度神经网络(DNNs)在表征复杂的非线性关 ...
论文笔记之：Visual Tracking with Fully Convolutional Networks
论文笔记之:Visual Tracking with Fully Convolutional Networks ICCV 2015 CUHK 本文利用 FCN 来做跟踪问题,但开篇就提到并非将其看做 ...

随机推荐

Django中配置用Redis做缓存和session
django-redis文档: http://django-redis-chs.readthedocs.io/zh_CN/latest/# 一.在Django中配置 # Django的缓存配置 CAC ...
【Python】【Web.py】python调用html【问题：echart图标调用html上未显示】
code调用123.html和echarts.min.js文件 code.py import web import execjs urls = ( '/hello', 'hello', ) app = ...
python3爬虫-爬取新浪新闻首页所有新闻标题
准备工作:安装requests和BeautifulSoup4.打开cmd,输入如下命令 pip install requests pip install BeautifulSoup4 打开我们要爬取的 ...
android studio 布局
1) 可见(visible)XML文件:Android:visibility="visible"Java代码:view.setVisibility(View.VISIBLE); 2 ...
XtraBackup完整备份与增量备份的原理
MySQL数据库实现备份的操作包括完整备份和增量备份等,本文我们主要介绍一下增量备份和完整备份的原理,接下来我们就一起来了解一下这部分内容. 完整备份的原理: 对于InnoDB,XtraBackup基 ...
【java】System.out重定向到文件，并重定向会console上
重定向到文件: System.setOut(new PrintStream(new File("data\\train.1.scale"))); 重定向回console: //把输 ...
[LeetCode] 437. Path Sum III_ Easy tag: DFS
You are given a binary tree in which each node contains an integer value. Find the number of paths t ...
[LeetCode] 168. Excel Sheet Column Title_Easy tag: Math
Given a positive integer, return its corresponding column title as appear in an Excel sheet. For exa ...
discuz模板引擎
discuz是采用“编译型的模板”,就是指采用普通网页文件保存,在文件中插入需要动态显示数据的仿php的代码,最后进行编译成真正的php的文件保存为模板缓存文件,这个转换的过程就称为编译.在用户浏览页 ...
csv到mysql数据库如何分割
这两天修改一个取XML文件存入到CSV,然后再存入到mysql的bug,bug是XML文件里面有个name字段,存入CSV文件里面的时候我们用“|”,来分割字段.但是name里面有时候也有 ...