Machine Learning——吴恩达机器学习笔记（酷

【1】

ML Introduction

a. supervised learning & unsupervised learning

　　监督学习：从给定的训练数据集中学习出一个函数（模型参数），当新的数据到来时，可以根据这个函数预测结果。监督学习的训练集要求包括输入输出，也可以说是特征和目标。训练集中的目标是由人标注的。常用于：训练神经网络、决策树、回归分析、统计分类

　　无监督学习：输入数据没有被标记，也没有确定的结果。样本数据类别未知，需要根据样本间的相似性对样本集进行分类，试图使类内差距最小化，类间差距最大化。常用方法：1.基于概率密度函数的估计；2.基于样本间相似性。常用于：PCA、deep learning、模式识别

b. reinforcement learning

　　强化学习：

　　（1）有监督的学习是从一个已经标记的训练集中进行学习，训练集中每一个样本的特征可以视为是对该situation的描述，而其label可以视为是应该执行的正确的action，但是有监督的学习不能学习交互的情景，因为在交互的问题中获得期望行为的样例是非常不实际的，agent只能从自己的经历（experience）中进行学习，而experience中采取的行为并一定是最优的。这时利用RL就非常合适，因为RL不是利用正确的行为来指导，而是利用已有的训练信息来对行为进行评价。

　　（2）因为RL利用的并不是采取正确行动的experience，从这一点来看和无监督的学习相似，但是无监督的学习的目的可以说是从一堆未标记样本中发现隐藏的结构，而RL的目的是最大化reward signal。

　　（3）RL与其他机器学习算法不同的地方在于：其中没有监督者，只有一个reward信号；反馈是延迟的，不是立即生成的；时间在RL中具有重要的意义；agent的行为会影响之后一系列的data。

【2】
Linear regression

　　线性回归：y = θ * x

　　最小二乘：J(θ) = J(x, y) = 1/2 * ∑(h(x) - y)²

（原理：误差分析的极大似然估计；设误差服从高斯分布，极大似然估计）

Gradient descent

　　梯度下降：先选择一个初始点，然后逐步向梯度下降最快的方向选取下一个点；梯度下降的结果和初始点的选取有关：

　　　　1. 先给定初始点：θ = 0;

　　　　2. 不断改进J(θ)变得更小；θ(i) = θ(i) - α*(φ(J(θ)) / φ(θ(i)))；

　　　　【如果只有一个训练集：θ_(i) = θ_(i) - α * (h_e(x) - y)² * x_i，α 决定了训练步长，即每一次下降的距离】

　　　　【对于m个样本：　　 θ_(i) = θ_(i) - α * ∑(h_e(x^(j)) - y^(j))² * x_i^(j)】Batch Gradient Descent，每一次更新便利所有的样本；

　　　　【对于m个样本：for j = 1 to m {

　　　　　　　　　　　　　　　θ_(i) = θ_(i) - α * ∑(h_e(x^(j)) - y^(j))² * x_i^(j)

　　　　　　　　　　　　　　　　} (for all i)】Incremental Gradient Descent，每次只用一个样本进行更新，依次往下进行。速度会快很多；不会精确的收敛到局部最小值，总体上接近；

　　　　矩阵符号：tr (A) = ∑_i=1:nA_ii，求对角元素之和 trace：

　　　　　　　　　tr (AB) = tr (BA);

　　　　　　　　　tr (ABC) = tr (BCA) = tr (CAB)

　　　　　　　　　grad(AB)_A = B^T

　　　　　　　　　grad(ABA^TC)_A = CAB + C^TAB^T

　　　　矩阵求解：grad(J(θ)) = 0 → X^TXθ=X^TY → θ = (X^TX)^-1X^TY

【3】
Linear regression 参数学习算法，有固定的参数来进行拟合；

　　underfitting 欠拟合：拟合太单一，不准确；

　　overfitting 过拟合；仅仅反映已有的数据集的特征，没有包括实际意义；

　　　　Locally weighted regression 局部加权回归：注重对零界点的精准拟合，忽略那些离得远的点的贡献！ 非参数学习算法，参数的数目随着训练集数量m的增长而增长：

　　　在所选取的点周围选取点，进行局部的线性拟合成直线，用拟合值作为该点的值，而不是带入全局拟合函数求值：

　　　　Fit θ to minimize ∑w⁽ⁱ⁾ * (y⁽ⁱ⁾- θ^Tx⁽ⁱ⁾)² , where w⁽ⁱ⁾= exp(-(x⁽ⁱ⁾-x)²/2τ) 衰减函数，τ波长函数，控制权值随距离下降的速度；

　　　　If |x⁽ⁱ⁾-x| small, then w⁽ⁱ⁾≈ 1

　　　　If |x⁽ⁱ⁾-x| large, then w⁽ⁱ⁾≈ 0

　　　　（每选择一个新的点进行求值，都需要重新进行一次拟合，对于特别大的训练集来说更新很吃力）

Logistic regression 分类问题

　　sigmoid function( logistic function) 　　g(z) = 1 / (1 + e^-z)

　　与线性回归不同的是，梯度上升而不是下降；

Preception algorithm 感知器算法

　　g(z) = { 1, if z >= 0; 0, otherwise}

Newton’s method

4.
Logistic regression
Exponential family
Generalized linear models

5.
Generative learning algorithms
Gaussian Discriminant ****ysis
Naïve Bayes
Laplace smoothing

6.
Naïve Bayes
Neural networks
Support vector machine

7.
Optimal margin classifier
KKT
SVM dual
Kernel

8.
SVM
Kernel
Soft margin
SMO algorithms

9.
Learning theory
Bias/variance
Empirical Risk Minimization (ERM)
Union Bound
Hoeffding Inequality
Uniform convergence

10.
Learning theory
VC dimension
Model selection
Bayesian statistics and regularization

11.
Bayesian statistics and regularization
Online learning
Applying machine learning

12.
Unsupervised learning
Cluster K-means
Mixture of Gaussian
Jensen and Equality
EM (Expectation Maximization)

13.
EM
Mixture of Gaussians
Mixture of naïve Bayes
Factor ****ysis

14
Factor ****ysis
Principal Component ****ysis

15.
PCA
Latent Semitic Indexing (LSI)
SVD
Independent component ****ysis (ICA)

16.
Reinforcement Learning
Markov Decision Processes (MDPs)
Value functions
Value iteration
Policy iteration

17.
MDPs
Approximate policy iteration

18.
State-action reward
Horizon MDPs
Linear dynamical systems
Linear-quadratic regulation (LQR)
Riccati equation

19.
Debugging RL algorithms
LQR
French dynamic programming
Kalman filters
Linear-quadratic Gaussian control (LGG)

20.
POMDPs
Policy search
Reinforced
Pegasus

Machine Learning——吴恩达机器学习笔记（酷的更多相关文章

Machine Learning|Andrew Ng|Coursera 吴恩达机器学习笔记
Week1: Machine Learning: A computer program is said to learn from experience E with respect to some ...
Machine Learning|Andrew Ng|Coursera 吴恩达机器学习笔记(完结)
Week 1: Machine Learning: A computer program is said to learn from experience E with respect to some ...
吴恩达机器学习笔记（六） —— 支持向量机SVM
主要内容: 一.损失函数二.决策边界三.Kernel 四.使用SVM (有关SVM数学解释:机器学习笔记(八)震惊!支持向量机(SVM)居然是这种机) 一.损失函数二.决策边界对于: 当C非常 ...
吴恩达机器学习笔记（十一） —— Large Scale Machine Learning
主要内容: 一.Batch gradient descent 二.Stochastic gradient descent 三.Mini-batch gradient descent 四.Online ...
吴恩达机器学习笔记60-大规模机器学习（Large Scale Machine Learning）
一.随机梯度下降算法之前了解的梯度下降是指批量梯度下降:如果我们一定需要一个大规模的训练集,我们可以尝试使用随机梯度下降法(SGD)来代替批量梯度下降法. 在随机梯度下降法中,我们定义代价函数为一个 ...
吴恩达机器学习笔记54-开发与评价一个异常检测系统及其与监督学习的对比（Developing and Evaluating an Anomaly Detection System and the Comparison to Supervised Learning）
一.开发与评价一个异常检测系统异常检测算法是一个非监督学习算法,意味着我们无法根据结果变量
吴恩达机器学习笔记37-学习曲线（Learning Curves）
学习曲线就是一种很好的工具,我经常使用学习曲线来判断某一个学习算法是否处于偏差.方差问题.学习曲线是学习算法的一个很好的合理检验(sanity check).学习曲线是将训练集误差和交叉验证集误差作为 ...
[吴恩达机器学习笔记]12支持向量机5SVM参数细节
12.支持向量机觉得有用的话,欢迎一起讨论相互学习~Follow Me 参考资料斯坦福大学 2014 机器学习教程中文笔记 by 黄海广 12.5 SVM参数细节标记点选取标记点(landma ...
[吴恩达机器学习笔记]12支持向量机3SVM大间距分类的数学解释
12.支持向量机觉得有用的话,欢迎一起讨论相互学习~Follow Me 参考资料斯坦福大学 2014 机器学习教程中文笔记 by 黄海广 12.3 大间距分类背后的数学原理- Mathematic ...

随机推荐

Quick BI助力云上大数据分析---深圳云栖大会
在3月29日深圳云栖大会的数据分析与可视化专场中,阿里云产品专家陌停对大数据智能分析产品 Quick BI 进行了深入的剖析.大会现场的精彩分享也赢得观众们的一直认可和热烈的反响. 大数据分析之路的挑 ...
CSS制作图形速查表
很少会有人意识到,当浏览器绘制的border,会有一个角度的问题.我们就是得用这样的一个技巧来制作三角的效果.我们只需要保证一边的边框是有色,其他边框色为透明色,这样我们就很容易制作出三角形,然后改变 ...
vue项目出现的错误汇总
报错一: expected "indent", got "!" 通过vue-cli创建的项目,不需要在webpack.base.conf.js中再手动配置关于c ...
angularJs的指令系统和双向数据绑定
一.langularJs的指令系统 <!DOCTYPE HTML> <html ng-app><!--这种以ng开头的就是指令系统,初始化的一个指令,不仅可以加在html ...
BZOJ 1191 超级英雄Hero 二分图匹配
题目链接: https://www.lydsy.com/JudgeOnline/problem.php?id=1191 题目大意: 现在电视台有一种节目叫做超级英雄,大概的流程就是每位选手到台上回答主 ...
BZOJ1972:[SDOI2010]猪国杀(模拟)
Description 太长就不贴过来了 Solution 这个题是真的不难写……唯一的难度就在于理解题意上面……感觉这就是个阅读理解题啊…… 而且你三国杀玩的越多可能就越难写因为你无法理解那些猪的思 ...
【NOIP2014】解方程
题目描述已知多项式方程 \[a_0 + a_1x + a_2x^2 + \dots +a_nx^n=0\] 求这个方程在\([1,m]\)内的整数解(\(n\)和\(m\)均为正整数). 输入输出格 ...
No.4 - 3D 空间的卡片翻转动效
参考 ①张鑫旭http://www.zhangxinxu.com/wordpress/2012/09/css3-3d-transform-perspective-animate-transition/ ...
jQuery Mobile中jQuery.mobile.changePage方法使用详解
jQuery.mobile.changePage方法用的还是很多的.作为一个老手,有必要对jQuery mobile中实用方法做一些总结.系列文章请看jQuery Mobile专栏.jquery.mo ...
[转]MBTiles移动存储简介
首先奉上官网地址http://mapbox.com/developers/mbtiles/#storing_tiles 由于英文水平有限,看资料很费眼睛,特将它翻译成中文存储瓦片地图制作者面对一个 ...

Machine Learning——吴恩达机器学习笔记（酷

Machine Learning——吴恩达机器学习笔记（酷的更多相关文章

随机推荐

热门专题