DEEP LEARNING 大满贯课程表

Reinforcement Learning
post by ISH GIRWAN

Courses/Tutorials

Deep Reinforcement Learning, Spring 2017, by UC Berkeley: http://rll.berkeley.edu/deeprlcours...
Reinforcement Learning, 2015, by UCL (David Siver): http://www0.cs.ucl.ac.uk/staff/d.si...
https://github.com/yandexdataschool...
Lecture notes by Andrew Ng: http://cs229.stanford.edu/notes/cs2...
https://medium.com/emergent-future/...

Books

Reinforcement Learning: An Introduction by Richard S. Sutton and Andrew G. Barto: http://webdocs.cs.ualberta.ca/~sutt...

Blogs

http://bair.berkeley.edu/blog

I think you can take the UC Berkeley course instead of David Silver's course as it's more up to date. Additionally you can check Arthur Juliani's blog series, it's really good.

相关课程

Calculus One, Coursera, Jim Fowler
Calculus Two, Coursera, Jim Fowler
Multivariable Calculus, Khan Academy, Grant Sanderson
Linear Algebra, MIT, Prof. Gilbert Strang (so mechanical..)
Coding the Matrix, Brown University, Philip Klein
Introduction to Probability, The Science of Uncertainty Edx, MIT, Joh Tsitsiklis
微积分, coursera, 吉姆·福勒
微积分, coursera, 吉姆·福勒
多元微积分, 汗学院, grant sanderson
线性代数, 麻省理工学院教授吉尔伯特·斯特朗(所以机械..)
编码矩阵, 布朗大学, 菲利普·克莱因
介绍概率, 不确定的科学, 麻省理工学院, joh tsitsiklis

以下是比较旧的RL Course by David Silver

UCL Course on RL
http://www0.cs.ucl.ac.uk/staff/d.silver/web/Teaching.html

Advanced Topics 2015 (COMPM050/COMPGI13)

Reinforcement Learning

Contact: d.silver@cs.ucl.ac.uk

Video-lectures available here

Lecture 1: Introduction to Reinforcement Learning

Lecture 2: Markov Decision Processes

Lecture 3: Planning by Dynamic Programming

Lecture 4: Model-Free Prediction

Lecture 5: Model-Free Control

Lecture 6: Value Function Approximation

Lecture 7: Policy Gradient Methods

Lecture 8: Integrating Learning and Planning

Lecture 9: Exploration and Exploitation

Lecture 10: Case Study: RL in Classic Games

Easy21 assignment

Discussion and announcements: http://groups.google.com/group/csml-advanced-topics

Previous RL exam questions and answers

DEEP LEARNING 大满贯课程表的更多相关文章

收藏：左路Deep Learning+右路Knowledge Graph，谷歌引爆大数据
发表于2013-01-18 11:35| 8827次阅读| 来源sina微博条评论| 作者邓侃数据分析智能算法机器学习大数据Google 摘要:文章来自邓侃的博客.数据革命迫在眉睫. 各大公司重兵 ...
Deep learning：五十一(CNN的反向求导及练习)
前言: CNN作为DL中最成功的模型之一,有必要对其更进一步研究它.虽然在前面的博文Stacked CNN简单介绍中有大概介绍过CNN的使用,不过那是有个前提的:CNN中的参数必须已提前学习好.而本文 ...
【深度学习Deep Learning】资料大全
最近在学深度学习相关的东西,在网上搜集到了一些不错的资料,现在汇总一下: Free Online Books by Yoshua Bengio, Ian Goodfellow and Aaron C ...
《Neural Network and Deep Learning》_chapter4
<Neural Network and Deep Learning>_chapter4: A visual proof that neural nets can compute any f ...
Deep Learning模型之：CNN卷积神经网络（一）深度解析CNN
http://m.blog.csdn.net/blog/wu010555688/24487301 本文整理了网上几位大牛的博客,详细地讲解了CNN的基础结构与核心思想,欢迎交流. [1]Deep le ...
Deep Learning 19_深度学习UFLDL教程：Convolutional Neural Network_Exercise（斯坦福大学深度学习教程）
理论知识:Optimization: Stochastic Gradient Descent和Convolutional Neural Network CNN卷积神经网络推导和实现.Deep lear ...
0.读书笔记之The major advancements in Deep Learning in 2016
The major advancements in Deep Learning in 2016 地址:https://tryolabs.com/blog/2016/12/06/major-advanc ...
#Deep Learning回顾#之LeNet、AlexNet、GoogLeNet、VGG、ResNet
CNN的发展史上一篇回顾讲的是2006年Hinton他们的Science Paper,当时提到,2006年虽然Deep Learning的概念被提出来了,但是学术界的大家还是表示不服.当时有流传的段 ...
#Deep Learning回顾#之2006年的Science Paper
大家都清楚神经网络在上个世纪七八十年代是着实火过一回的,尤其是后向传播BP算法出来之后,但90年代后被SVM之类抢了风头,再后来大家更熟悉的是SVM.AdaBoost.随机森林.GBDT.LR.FTR ...

随机推荐

Mybatis-plus多表关联查询，多表分页查询
学习plus真的觉得写代码真的越来越舒服了.昨天开始接触吧,只要学会了多表关联查询.plus就能随意搭配使用了. 关于怎么搭建的就自行了去研究了哦.这里直接进入主题. 我用的是springboot+m ...
BFS + 状态搜索
题目题意给一个100x100的迷宫,'.'表示路面,'S'表示起点,'T'表示终点:'#'表示毒气区,进入毒气区必须要消耗一个氧气:'B'表示氧气区,每次进入自动获得一个氧气,可反复进入从而获得多 ...
POJ2828 Buy Tickets（线段树之插队问题）
飞翔问题是这样的:现在有n个人要买票,但是天黑可以随便插队.依次给出将要买票的n个人的数据信息.包含两项:pos,当前第i号人来了之后他肯定要插入到pos这个位置,如果当前pos无人,那最好了,直接 ...
form组件之modelForm
modelForm的使用及参数设置从modelForm这个名字就能看出来,这个form是和模型类model有知己诶关联的,还是以数和出版社的模型来说明: models.py(模型) from dja ...
Java中的ThreadLocal使用
ThreadLocal用于下面的场景: 1. 不允许多个线程同时访问的资源 2. 单个线程存活过程只使用一个实例官方定义如下: This class provides thread-local va ...
NMS_非极大值抑制（转）
NMS(non maximum suppression),中文名非极大值抑制,在很多计算机视觉任务中都有广泛应用,如:边缘检测.目标检测等. 这里主要以人脸检测中的应用为例,来说明NMS,并给出Mat ...
Jenkins安全配置详解
一.进入安全配置界面首页后点击进入系统管理(Manage Jenkins) ——下拉下方看到安全配置(Configure Global Security) ——进入安全配置界面二,详解安全配置的选 ...
Tab 插件（一）
前言使用Jquery封装插件,使代码复用不需要每个功能重新编写代码只需修改传入参数. jQuery 插件常见到有类开发和对象开发模式, 在下边介绍两种模式使用,初次编写,有误拍砖. jQuery ...
android Activity启动过程(二)从ActivityManagerService的startActivity到栈顶Activity的onPause过程
ActivityManagerService.startActivity() ActvityiManagerService.startActivityAsUser() ActivityStackSup ...
C# IO流 File.Exists，Directory.Exists， File.Create，Directory.CreateDirectory
void Start() { CreateDirectory(); CreateFile(); } //平台的路径(封装起来的一个属性,这不是一个方法) public string path { ge ...

DEEP LEARNING 大满贯课程表

DEEP LEARNING 大满贯课程表的更多相关文章

随机推荐

热门专题