Deep learning:四十(龙星计划2013深度学习课程小总结)
头脑一热,坐几十个小时的硬座北上去天津大学去听了门4天的深度学习课程,课程预先的计划内容见:http://cs.tju.edu.cn/web/courseIntro.html。上课老师为微软研究院的大牛——邓力,群(qq群介绍见:Deep learning高质量交流群)里面有人戏称邓力(拼音简称DL)老师是天生注定能够在DL(Deep learning)领域有所成就的,它的个人主页见:http://research.microsoft.com/en-us/people/deng/。这次我花费这么大的力气参加这个课程,是期望能达到3个目的的:一、把DL中一些常见基础算法弄明白,特别是跟能量模型等相关的算法。二、站在更上一层的角度来理解DL,知道下一步该学哪些知识。三、和群友交流下科研心得,多认识几个朋友。实践表明,第二和第三个目的基本达到,但关于第一个有点小失望。
下面简单回忆下邓老师这4天大概讲了些什么内容(没做太多笔记,记忆有些模糊)。
Day1:其课件主要见Lecture-Slides-DayOne.由于邓老师讲课时喜欢插入一些他和其它DL大牛(比如Hinton)之间的故事,所以这个课件没有讲完(课件本身内容页太多),大概讲了前面100页,后面几天还有不少内容是基于这个课件的。在这一天的课程中,他列出了一些DL研究小组的网页,并给出了一些常见的学习工具。主要是从语音处理领域介绍DL,Dynamic model,以及两者的结合;具体内容有:DL是分布式的表示;感知机介绍,SVM其实本质也是感知机;为什么BP算法在90年代末期被扔掉的原因;比较详细的介绍了RBM以及RBM的训练过程,对比了RBM和GMM模型;介绍了DBN模型,以及DBN在生成数据和识别上的使用方法;DNN模型(用generative method pre-training后的深度网络);从优化角度和过拟合角度介绍了为什么pre-training会有效果;RBM等价于一个无穷层的DBN;微软在语音识别领域的历史进展;DBN(动态贝叶斯模型)在语音处理上的使用;DL和动态贝叶斯的结合。
Day2:课件见Lecture-Slides-DayTwo,课件内容非常少。因为这一天放了一天的video,video内容都是coursera上的课程,其中一门课是Hintion的Neural Networks for Machine Learning,另一门课程是从生物角度介绍神经科学的:Computational Neuroscience。可能每个人基础不同以及所期望的目的不同吧,反正本人对那一天的课程比较失望。因为那些课程都是网上公开的,课件和视频网上都可以看得到,而邓老师却用了一天的时间在课程上放这些。比较好的方法应该是列出它要放的视频的重点(几页ppt就可以搞定),然后大致提一下其内容,让学员回去后对照看即可(比较大家千里迢迢跑来听课是想多学点东西)。这一天的内容中邓老师是想从生物神经的角度来推导出DL,因为DL的数学理论太差,这点经常遭他人抨击。而邓老师的观点是,DL其实是生物神经模型通过N步简化而来的,具有一定的生物基础,所以有一定的道理。这就是那一天的主要内容,交叉放生物神经模型和工程神经网络的视频教程。听说现场有些搞科研的老师听完当天的课程后收获非常大,因为受到邓老师很多观点的启发,有了很多自己新的想法。另外,在第二天的课程中,邓老师比较客观的介绍了他自己认为DL能够适用的领域(比如语音,图像,文本等),以及DL不擅长的领域(比如说Malware detection,movie recommender, speaker/language detection),理由是一些有感知机制的AI比较适合用DL,而一些Data Matching不太适合。
Day3:课件虽为Lecture-Slides-DayThree,但是由于第二天有人反应上课方式和内容不太好,所以把邓老师的计划弄乱了,因此这一天的内容是想到哪方面还没介绍就讲哪方面的知识。主要内容好像是CNN;目标识别;dropout;SGD;Hopfield能量模型;RNN的介绍以及一些常见的RNN learning方法,包括long short term memory, Hessian Free optimization, Echo State Network等,主要还是用Hintion的NN课件。
Day4:当天的内容更没有预先的计划,像打补丁似的想到哪就讲到哪,课件主要用的是第一天没有讲完的内容和hintion的课件,还有一些是ICML2013的一些keynote,比如Vincent Vanhoucke的。主要讲的内容有Deep AutoEncoder;DL在IR中的应用,重点讲了邓老师自己提出的模型DSN;DL在NLP领域的应用;DL在语音处理中的acoustic model中的应用。下午的安排主要是邓老师回答同学的提问,问题是前一天通过已发邮件给胡老师(胡老师个人主页:http://cs.tju.edu.cn/faculty/huqinghua/)整理过的,在邓老师回答这些问题前请科大讯飞和中科院自动化所的人分享了一些Deep learning领域的心得,其中一个报告毫无内容,另一个没太听懂。同学提的问题比较多,从邓老师的回答过程中也收获了不少。
总结:邓老师还是相当厉害的,从他上课激动的语言可以看出,他对DL的未来还是比较乐观的,他并不是盲目推崇DL,比如他也比较客观的分析了哪些领域适合DL,哪些领域不适合DL。这次上课虽然没有收获太多的DL基本算法细节,但是也知道了后续一段时间如果想继续DL的,该看哪方面的知识。比如说至少知道了coursera是个很好的自学平台。另外和群友一起参加小讨论,逛校园,聚餐,整个过程还是相当愉快的,认识了不少朋友。
10号到学校后花了3天多时间把Hition的课程Neural Networks for Machine Learning大概学了一遍。共16节课。感觉这个课程还是比较不错的(很早以前有看过其中的一节RBM,完全不知所云,所以第一印象是他的课程不好),有很多工程经验性的东西在里面,因为课程主要是从工程角度上讲解的,所以如果你对所将内容有过实际项目和实验经验的话,收获会很大。这么课的基本内容是:从什么是机器学习,为什么要使用机器学习到怎样常见的NN算法在机器学习中的应用;从感知机的学习到BP算法;从NN在预测下一个单词到图片目标识别的应用;从梯度下降法到常见的NN优化算法;从Hopfield Nets到RNN网络以及其训练方法,从模型泛化到模型平均;从BM到RBM以及从RBM到DBN,DBM;从SBN到Week-Sleep算法;从PCA到Deep AutoEncoder;从joint model到Hierachy part model;还有各种DL在语音,图像,文本上的应用,以及DL的未来都给出了一定的介绍。课程覆盖的内容相当广泛;相信随着自己今后具体实践时回过图来参考这些课件,会很有帮助。
总的来说说,”北伐”的这几天,收获还是不错的。感谢龙星计划和天津大学的组织者,感谢邓老师这几天辛苦的付出!
Deep learning:四十(龙星计划2013深度学习课程小总结)的更多相关文章
- 【RS】A review on deep learning for recommender systems: challenges and remedies- 推荐系统深度学习研究综述:挑战和补救措施
[论文标题]A review on deep learning for recommender systems: challenges and remedies (Artificial Intell ...
- 深度学习课程笔记(十八)Deep Reinforcement Learning - Part 1 (17/11/27) Lectured by Yun-Nung Chen @ NTU CSIE
深度学习课程笔记(十八)Deep Reinforcement Learning - Part 1 (17/11/27) Lectured by Yun-Nung Chen @ NTU CSIE 201 ...
- 【Deep Learning Nanodegree Foundation笔记】第 0 课:课程计划
第一周 机器学习的类型,以及何时使用机器学习 我们将首先简单介绍线性回归和机器学习.这将让你熟悉这些领域的常用术语,你需要了解的技术进展,并了解深度学习在更大的机器学习背景中的位置. 直播:线性回归 ...
- Deep Learning 8_深度学习UFLDL教程:Stacked Autocoders and Implement deep networks for digit classification_Exercise(斯坦福大学深度学习教程)
前言 1.理论知识:UFLDL教程.Deep learning:十六(deep networks) 2.实验环境:win7, matlab2015b,16G内存,2T硬盘 3.实验内容:Exercis ...
- 深度学习课程笔记(十四)深度强化学习 --- Proximal Policy Optimization (PPO)
深度学习课程笔记(十四)深度强化学习 --- Proximal Policy Optimization (PPO) 2018-07-17 16:54:51 Reference: https://b ...
- 深度学习课程笔记(十二) Matrix Capsule
深度学习课程笔记(十二) Matrix Capsule with EM Routing 2018-02-02 21:21:09 Paper: https://openreview.net/pdf ...
- 深度学习课程笔记(四)Gradient Descent 梯度下降算法
深度学习课程笔记(四)Gradient Descent 梯度下降算法 2017.10.06 材料来自:http://speech.ee.ntu.edu.tw/~tlkagk/courses_MLDS1 ...
- 深度学习课程笔记(十七)Meta-learning (Model Agnostic Meta Learning)
深度学习课程笔记(十七)Meta-learning (Model Agnostic Meta Learning) 2018-08-09 12:21:33 The video tutorial can ...
- 深度学习课程笔记(十六)Recursive Neural Network
深度学习课程笔记(十六)Recursive Neural Network 2018-08-07 22:47:14 This video tutorial is adopted from: Youtu ...
随机推荐
- 手机浏览器,微信中播放amr录音
由于微信公众号开发中,临时素材只有三天的有效期,但是客户要求所有录音永久保存,永久素材数量又有限制,故只能把录音保存到服务器上.但是存到服务器上有一个问题,手机微信中无法直接播放amr录音.无意中发现 ...
- 我的ORM之二--添加
我的ORM索引 添加的语法: var 影响行数 = dbr.表.Insert(实体).Execute(); 实体类型 1. 任何C#类. 如:public class Entity{ public ...
- Etag缓存在PHP和NodeJS中的实现
HTTP 提供了许多页面缓存的方案,其中属 Etag 和 Last-Modified 应用最广.本文会先介绍 Etag 的应用场景,然后说说他在 php 和 node 中的使用. 本文地址:http: ...
- [.net 面向对象编程基础] (5) 基础中的基础——变量和常量
[.net面向对象编程基础] (5) 基础中的基础——变量和常量 1.常量:在编译时其值能够确定,并且程序运行过程中值不发生变化的量. 通俗来说,就是定义一个不能改变值的量.既然不能变动值,那就必须 ...
- 微信自定义分享到朋友圈API
<script src="http://s0.qhimg.com/!249ce048/WeixinApi.js" type="text/javascript&quo ...
- Linux cat命令
200 ? "200px" : this.width)!important;} --> 介绍 cat命令经常会用来查看一个文件的内容,并且结合它本身的一些参数经常可以用来做一 ...
- 细说.NET 中的多线程 (一 概念)
为什么使用多线程 使用户界面能够随时相应用户输入 当某个应用程序在进行大量运算时候,为了保证应用程序能够随时相应客户的输入,这个时候我们往往需要让大量运算和相应用户输入这两个行为在不同的线程中进行. ...
- 基于Task的异步模式的定义
返回该系列目录<基于Task的异步模式--全面介绍> 命名,参数和返回类型 在TAP(Task-based Asynchronous Pattern)中的异步操作的启动和完成是通过一个单独 ...
- C# 对包含文件或目录路径信息的 System.String 实例执行操作
在字符串操作中有一类比较特殊的操作,就是对包含文件或目录路径信息的 System.String 实例执行操作.比如根据一个表示路径的字符串获取其代表的文件名称.文件夹路径.文件扩展名等.在很多时候,我 ...
- Android开发学习之路-Palette颜色提取工具类使用
视频(要FQ):https://www.youtube.com/watch?v=5u0dtzXL3PQ Palette是一个在support-v7包中的一个颜色提取工具类,用法比较简单,而且是谷歌官方 ...