深度学习国外课程资料(Deep Learning for Self-Driving Cars)+(Deep Reinforcement Learning and Control )
MIT(Deep Learning for Self-Driving Cars) CMU(Deep Reinforcement Learning and Control )
参考网址:
1 Deep Learning for Self-Driving Cars -- 6.S094
http://selfdrivingcars.mit.edu/
2 Deep Reinforcement Learning and Control -- 10703
https://katefvision.github.io/
Deep Learning for Self-Driving Cars ALL
课程视频和PPT:http://url.cn/45DIOnZ
开始学习机器人-知乎专栏-Top
下面为机器翻译结果,请参考源链接地址。
----
6.S094:自驾车的深度学习
本课程通过建立自动驾驶汽车的应用主题,介绍深度学习的实践。它对初学者开放,是为那些刚接触机器学习的人设计的,但它也可以帮助现场的高级研究人员寻找深度学习方法及其应用的实用概述。
对班级感兴趣吗?这里有一些你可以做的事情:
- 在网站上注册一个帐户以保持最新。课程的材料是免费的,向公众开放。
- 按照DeepTraffic和DeepTesla教程,签出DeepTraffic排行榜。
- 为DeepTraffic游戏和DeepTesla模拟模拟设计和评估神经网络。
- 观看下面的讲座和客座讲座。
课程资料:
- 首次提供: 2017年冬季
- 教练: Lex Fridman
- 联系人: deepcars@mit.edu
讲座幻灯片和视频:
* 标记为红色的材料表示尚未激活但即将发生的链接。
- 讲座1:深度学习和自驾车介绍
[ 幻灯片 ] - [ 演讲视频 ] - 讲座2:运动计划的深层加固学习
[ 幻灯片 ] - [ 演讲视频 ] - 讲座3:驾驶任务的端到端学习的卷积神经网络
[ 幻灯片 ] - [ 演讲视频 ] - 讲座4:通过时间转向的循环神经网络
[ 幻灯片 ] - [ 演讲视频 ] - 讲座5:以人为中心的半自主车辆的深度学习
[ 幻灯片 ] - [ 讲座视频 ]
客人说话:
十分感谢
本课程的支持由MIT-SUTD和丰田集体行动解决安全研究和教育计划的良好人士提供。比赛的奖品由我们的朋友和Udacity的自驾驾驶汽车工程师提供。如果没有麻省理工学院及其以外的聪明年轻人的伟大社区,也不可能有这样的机会。

----
深加固学习和控制
|
| 日期 | 主题(幻灯片) | 讲师 | 阅读 |
|---|---|---|---|
| 1/18 | 介绍 | 卡特琳娜 | [1] |
| 1/23 | 马尔科夫决策过程(MDP),POMDP | 卡特琳娜 | [SB,Ch 3] |
| 1/25 | 解决已知的MDP:动态规划 | 卡特琳娜 | [SB,Ch 4] |
| 1/30 | 蒙特卡罗学习:价值函数(VF)估计和优化 | Russ | [SB,Ch 5] |
| 2/1 | 时间差分学习:VF估计和优化,Q学习,SARSA | Russ | [SB,Ch 8] |
| 2/2 | OpenAI健身房 | 德文 | |
| 2/6 | 规划与学习:Dyna,蒙特卡罗树搜索 | 卡特琳娜 | [SB,Ch 8; 2] |
| 2/8 | VF近似,具有VF近似的MC,TD,具有VF近似的控制 | Russ | [SB,Ch 9] |
| 2/13 | VF近似,深度学习,Convnets,反向传播 | Russ | [GBC,Ch 6] |
| 2/15 | 深度学习,Convnets,优化技巧 | Russ | [GBC,第9章] |
| 2/20 | 深Q学习:双Q学习,重放记忆 | Russ | |
| 2/22 | 策略梯度(1):REINFORCE,梯度估计的方差减少,演员 - 批评 | Russ | [GBC,第13章] |
| 2/27 | 政策梯度(2),自然政策梯度,深层演员 - 评论家,TRPO | Russ | |
| 3/1 | 仔细看看连续操作,变量自动编码器,多模态随机策略 | Russ | |
| 3/6 | 勘探 | 卡特琳娜 | [3,4] |
| 3/8 | 模仿1 | 卡特琳娜 | [5,6] |
| 3/20 | 模仿2 | 卡特琳娜 |
资源
阅读
- Smith&Gasser,The Development of Embodied Cognition:Six Lessons from Babies
- Silver,Huang等人,Mastering the Game of Go with Deep Neural Networks and Tree Search
- Houthooft等人,VIME:Variational Information Maximizing Exploration
- Stadie等人,Incentivizing Exploration In Reinforcement Learning With Deep Predictive Models
- Bagnell,模仿的邀请
- Ho&Ermon,Generative Adversarial Imitation Learning
一般参考
在线课程
- Rich Sutton的课:强化学习人工智能,2016年秋季
- John Schulman和Pieter Abeel的课:深层增强学习,2015年秋季
- 谢尔盖·莱文,切尔西·芬恩和约翰·舒尔曼的类:深层增强学习,2017年春
- Abdeslam Boularias的类:机器人学习研讨会
- Pieter Abeel的类:高级机器人,2015年秋季
- Emo Todorov的类:通过学习和优化的智能控制,2015年春季
- David Silver的类:钢筋学习
作业和评分
请使用NIPS样式文件在LaTeX中编写所有作业。(sty文件,tex示例)
课程成绩是作业的加权平均值(60%)和开放式最终项目(40%)。
先决条件
本课程假定学生熟悉钢筋学习,数值优化和机器学习。MLD中建议的相关课程包括机器学习简介,10807深度学习课程,10725凸优化或这些课程的在线等效版本。关于机器学习和神经网络的介绍材料,参见:
不太熟悉钢筋学习的学生可以从Sutton&Barto的第一章和Dave Silver的课程的第一课开始热身。
反馈
非常感谢您的 反馈。随意保持匿名,但总是试图有礼貌。
深度学习国外课程资料(Deep Learning for Self-Driving Cars)+(Deep Reinforcement Learning and Control )的更多相关文章
- 『深度应用』NLP机器翻译深度学习实战课程·零(基础概念)
0.前言 深度学习用的有一年多了,最近开始NLP自然处理方面的研发.刚好趁着这个机会写一系列NLP机器翻译深度学习实战课程. 本系列课程将从原理讲解与数据处理深入到如何动手实践与应用部署,将包括以下内 ...
- 【PyTorch】深度学习与PyTorch资料链接整理
欢迎来到我的博客! 以下链接均是日常学习,偶然得之,并加以收集整理,感兴趣的朋友可以多多访问和学习.如果以下内容对你有所帮助,不妨转载和分享.(Update on 5,November,2019) 1 ...
- 『深度应用』NLP机器翻译深度学习实战课程·壹(RNN base)
深度学习用的有一年多了,最近开始NLP自然处理方面的研发.刚好趁着这个机会写一系列NLP机器翻译深度学习实战课程. 本系列课程将从原理讲解与数据处理深入到如何动手实践与应用部署,将包括以下内容:(更新 ...
- 深度学习笔记之关于总结、展望、参考文献和Deep Learning学习资源(五)
不多说,直接上干货! 十.总结与展望 1)Deep learning总结 深度学习是关于自动学习要建模的数据的潜在(隐含)分布的多层(复杂)表达的算法.换句话来说,深度学习算法自动的提取分类需要的低层 ...
- 深度学习基础 Probabilistic Graphical Models | Statistical and Algorithmic Foundations of Deep Learning
目录 Probabilistic Graphical Models Statistical and Algorithmic Foundations of Deep Learning 01 An ove ...
- 吴恩达《深度学习》-第三门课 结构化机器学习项目(Structuring Machine Learning Projects)-第一周 机器学习(ML)策略(1)(ML strategy(1))-课程笔记
第一周 机器学习(ML)策略(1)(ML strategy(1)) 1.1 为什么是 ML 策略?(Why ML Strategy?) 希望在这门课程中,可以教给一些策略,一些分析机器学习问题的方法, ...
- 吴恩达《深度学习》-课后测验-第一门课 (Neural Networks and Deep Learning)-Week 3 - Shallow Neural Networks(第三周测验 - 浅层神 经网络)
Week 3 Quiz - Shallow Neural Networks(第三周测验 - 浅层神经网络) \1. Which of the following are true? (Check al ...
- 【deep learning】斯坦福CS231n—深度学习与计算机视觉(资料汇总)
官网 链接:CS231n: Convolutional Neural Networks for Visual Recognition Notes: 链接:http://cs231n.github.io ...
- 吴恩达《深度学习》-课后测验-第一门课 (Neural Networks and Deep Learning)-Week 4 - Key concepts on Deep Neural Networks(第四周 测验 – 深层神经网络)
Week 4 Quiz - Key concepts on Deep Neural Networks(第四周 测验 – 深层神经网络) \1. What is the "cache" ...
随机推荐
- 【agc019F】Yes or No
Portal -->agc019F Description 给你\(n+m\)个询问,其中\(n\)个的答案是\(Yes\),\(m\)个的答案是\(No\),现在依次回答这些询问,每回答一个询 ...
- linux查看当前文件夹的大小
1.(方法一)ls -lht会列出当前目录下每个文件的大小,同时也会给出当前目录下所有文件大小总和 [查看谬个文件的大小,] 2.(方法二)du -sh *也会列出当前文件夹下所有文件对应的大小 [把 ...
- php 通过链接生成二维码,扫码支付用到
$(".good_info").on('click',function () { var id = $(this).data('id'); var string='http://q ...
- pandas读csv、数据处理
.caret, .dropup > .btn > .caret { border-top-color: #000 !important; } .label { border: 1px so ...
- Linux /etc/issue 和 /etc/issue.net的作用和区别
1./etc/motd /etc/motd即messageoftoday(布告栏信息),每次用户登录时,/etc/motd文件的内容会显示在用户的终端.系统管理员可以在文件中编辑系统活动消息,例如:管 ...
- golang 中 sync包的 WaitGroup
golang 中的 sync 包有一个很有用的功能,就是 WaitGroup 先说说 WaitGroup 的用途:它能够一直等到所有的 goroutine 执行完成,并且阻塞主线程的执行,直到所有的 ...
- WAV MP3 Converter-强大的音频转换软件-特别版
From:http://www.cnblogs.com/killerlegend/p/3873909.html Author:KillerLegend Date:2014.7.28 WAV MP3 C ...
- 3.fIddler的使用
https://blog.csdn.net/chaoyu168/article/details/51065644 https://blog.csdn.net/u013474436/article/de ...
- Java并发编程原理与实战三十三:同步容器与并发容器
1.什么叫容器? ----->数组,对象,集合等等都是容器. 2.什么叫同步容器? ----->Vector,ArrayList,HashMap等等. 3.在多线程环境下,为什么不 ...
- 【Foreign】tty的方程math [数学]
tty的方程math Time Limit: 50 Sec Memory Limit: 128 MB Description 给定n.m.k.p. a+b+c=n, a^2+b^2+c^2=m, a ...









