论文笔记——Deep Model Compression Distilling Knowledge from Noisy Teachers

论文地址：https://arxiv.org/abs/1610.09650

主要思想

这篇文章就是用teacher-student模型，用一个teacher模型来训练一个student模型，同时对teacher模型的输出结果加以噪声，然后来模拟多个teacher，这也是一种正则化的方法。

1. teacher输出的结果加噪声以后，然后和student的输出结果计算L2 loss，作为student网络的反馈。

2. 加噪声

3. 计算L2 loss

4. 反向传播，更新参数

5. 算法过程

注意：加噪声的时候对输入进行了采样，不然直接全加也太暴力了吧。

等价于基于噪声的回归

实验结果

1. 对比了不同噪声比例对结果的影响，其实就是调参的过程。

2. 比较了学生加噪声和教师加噪声，结果是教师加噪声效果更加明显。

3. 比较了教师加噪声和一般的正则化操作(dropout)

总结

本文想法比较简单，就是给teacher输出结果加噪声，美曰其名，learn from multi teachers.

论文笔记——Deep Model Compression Distilling Knowledge from Noisy Teachers的更多相关文章

论文笔记: Deep Learning based Recommender System: A Survey and New Perspectives
(聊两句,突然记起来以前一个学长说的看论文要能够把论文的亮点挖掘出来,合理的进行概括23333) 传统的推荐系统方法获取的user-item关系并不能获取其中非线性以及非平凡的信息,获取非线性以及非平 ...
论文笔记——Deep Residual Learning for Image Recognition
论文地址:Deep Residual Learning for Image Recognition ResNet--MSRA何凯明团队的Residual Networks,在2015年ImageNet ...
深度学习论文笔记-Deep Learning Face Representation from Predicting 10,000 Classes
来自:CVPR 2014 作者:Yi Sun ,Xiaogang Wang,Xiaoao Tang 题目:Deep Learning Face Representation from Predic ...
论文笔记-Deep Affinity Network for Multiple Object Tracking
作者: ShijieSun, Naveed Akhtar, HuanShengSong, Ajmal Mian, Mubarak Shah 来源: arXiv:1810.11780v1 项目:http ...
深度学习网络压缩模型方法总结(model compression)
两派 1. 新的卷机计算方法这种是直接提出新的卷机计算方式,从而减少参数,达到压缩模型的效果,例如SqueezedNet,mobileNet SqueezeNet: AlexNet-level ac ...
论文翻译：2021_Towards model compression for deep learning based speech enhancement
论文地址:面向基于深度学习的语音增强模型压缩论文代码:没开源,鼓励大家去向作者要呀,作者是中国人,在语音增强领域深耕多年引用格式:Tan K, Wang D L. Towards model c ...
A Survey of Model Compression and Acceleration for Deep Neural Network时s
A Survey of Model Compression and Acceleration for Deep Neural Network时s 本文全面概述了深度神经网络的压缩方法,主要可分为参数修 ...
论文笔记： Dual Deep Network for Visual Tracking
论文笔记: Dual Deep Network for Visual Tracking 2017-10-17 21:57:08 先来看文章的流程吧 ... 可以看到,作者所总结的三个点在于: 1. ...
Deep Reinforcement Learning for Visual Object Tracking in Videos 论文笔记
Deep Reinforcement Learning for Visual Object Tracking in Videos 论文笔记 arXiv 摘要:本文提出了一种 DRL 算法进行单目标跟踪 ...

随机推荐

【CSS3】CSS3自学
CSS3学习网址:http://www.runoob.com/css3/css3-tutorial.html
hduPiggy-Bank(完全背包)
http://acm.hdu.edu.cn/showproblem.php?pid=1114 此题就是最简单的完全背包,顺序!!! for i=1..N for v=0..V f[v]=max{f[v ...
[LeetCode] 557. Reverse Words in a String III_Easy tag: String
Given a string, you need to reverse the order of characters in each word within a sentence while sti ...
iOS常用第三方类库及Xcode插件
第三方类库(github地址): 1.AFNetworking 网络数据 https://github.com/AFNetworking/AFNetworking 2.SDWebImage 图 ...
redis的5种数据结构的使用场景介绍
一.redis 数据结构使用场景原来看过 redisbook 这本书,对 redis 的基本功能都已经熟悉了,从上周开始看 redis 的源码.目前目标是吃透 redis 的数据结构.我们都知道,在 ...
echarts2简单笔记
1.代码 <!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF- ...
linux系统安装 dig和nslookup命令
Fedora / Centos:1.yum install bind-utils Ubuntu: 1.sudo apt-get install dnsutils Debian: 1.2 apt-get ...
深入理解php内核——读书笔记1
第一章基础准备宏定义 #字符串化 ##连接符 do{}while(0) 多行全局宏: EG.PG 第二章用户代码的执行 php请求的生命周期 SAPI接口 php脚本执行第三章变量及数据类 ...
js自执行函数的常见写法
js自执行函数的常见写法 2016-12-20 20:02:26 1.关于自执行函数 1.1 写自执行函数的好处:独立的作用域,不会污染全局环境 (function() { })(); 1.2 理解重 ...
svn回滚到某一版本
svn回滚到某一版本 (1)在代码文件夹或vs中show log,查看历史,记住想要回滚到的版本号如1000 (2)新建文件夹,右击svn checkout,在revision中输入版本号1000

论文笔记——Deep Model Compression Distilling Knowledge from Noisy Teachers

主要思想

1. teacher输出的结果加噪声以后，然后和student的输出结果计算L2 loss，作为student网络的反馈。

2. 加噪声

3. 计算L2 loss

4. 反向传播，更新参数

5. 算法过程

等价于基于噪声的回归

实验结果

1. 对比了不同噪声比例对结果的影响，其实就是调参的过程。

2. 比较了学生加噪声和教师加噪声，结果是教师加噪声效果更加明显。

3. 比较了教师加噪声和一般的正则化操作(dropout)

总结

论文笔记——Deep Model Compression Distilling Knowledge from Noisy Teachers的更多相关文章

随机推荐

热门专题