线性回归 Linear regression(1)线性回归的基本算法与求解

本系列内容大部分来自Standford公开课machine learning中Andrew老师的讲解，附加自己的一些理解，编程实现和学习笔记。

第一章 Linear regression

1.线性回归

线性回归是一种监督学习的方法。

线性回归的主要想法是给出一系列数据，假设数据的拟合线性表达式为：

$h(x)_\theta=\theta _0+\theta _1x_1+\theta _2x_2...=\sum_{i=0}^{n}\theta _ix_i=\theta ^Tx$

如何求得参数θ成为这个方法唯一的问题，为此我们需要定义损失函数：

$J(\theta)=\frac{1}{2}\sum_{1}^{m}(h_\theta (x^{(i)})-y^{(i)})^{2}$ ，其中m表示样本个数， $(x^{(i)},y^{(i)})$ 表示第i组样本，所以J表示总的m个样本的损失函数。

这个损失函数的表达式我们一定很熟悉，方差？最小二乘法？没错，这就是我们最原始的最小二乘模型。我们的任务就是让损失函数J尽可能的小。

P.S:至于为什么要选择J作为我们的损失函数，从表面上看很自然，当然选择这个函数也有概率解释，概率解释会放在之后的文章中讨论。

2.LMS最小均方算法

我们现在要做的任务就是选择参数θ，使得损失函数J尽可能小，很自然我们会想到梯度下降的方法。

梯度下降的思想最形象的解释就是：你站在山顶，环顾四周，寻找一个下山最快的方向走一小步，然后再次环顾四周寻找一个下山最快的方向走一小步，在多次迭代之后就会走到最低点。

放在这里也就要求我们先选择一个初始的 $\theta _0$ 然后利用梯度下降进行迭代 $\theta _{j}=\theta _{j}-\alpha \frac{\partial }{\partial \theta _j}J(\theta )$ ,其中α表示学习的步长。

对于单个样本来说最后迭代公式为 $\theta _{j}=\theta _{j}-\alpha (y^{(i)}-h_\theta(x^{(i)}))x_j^{(i)}$ ，这就是我们熟知的Widrow-Hoff规则。

我们可以来分析一下这个迭代公式， $\theta _{j}$ 的更新取决于真实值与拟合值的误差 $(y^{(i)}-h_\theta (x^{(i)}))$ ，从直观上我们就很能理解梯度下降和Widrow-Hoff规则了。

有了这个规则，我们就可以设计相应的算法，使得J取到最小值了。

方法一：批量梯度下降

意思很简单，每次迭代都迭代所有的m个已知样本，直到收敛。

Repeat until convergence{

　　 $\theta_j:=\theta_j+\alpha \sum_{i=1}^{m}(y^{(i)}-h_\theta (x^{(i)}))x_j^{(i)}$ (for every j)

}

方法二：随机梯度下降

批量梯度下降其实存在一个比较大的问题，当数据组数m特别大的时候，我们迭代一次就需要很长的时间。使用随机梯度下降虽然有可能走一些“弯路”，但因为每次迭代只使用一组数据所以相比较而言，反而能更快的收敛。

Loop{

　　for i=1 to m{

$\theta_j:=\theta_j+\alpha (y^{(i)}-h_\theta (x^{(i)}))x_j^{(i)}$ if convergence;

}

其实在梯度下降算法中，还有一个问题，学习率如何控制，AndrewNg并没有太多的介绍，但是其实对于学习率α的控制相当重要，如果α略大就会导致最后无法收敛。我会针对自己做的demo再写一篇博客讨论学习率控制的问题。

3.如何直接求出θ

其实我们是能利用矩阵运算直接求出参数θ，不过需要一些矩阵计算，可能会重新开一篇文章来计算这个θ。

这里就直接给出答案 $\theta =(X^{T}X)^{-1}X^{T}\vec{y}$

线性回归 Linear regression(1)线性回归的基本算法与求解的更多相关文章

线性回归 Linear regression(3) 线性回归的概率解释
这篇博客从一种方式推导了Linear regression 线性回归的概率解释,内容来自Standford公开课machine learning中Andrew老师的讲解. 线性回归的概率解释在Lin ...
线性回归 Linear regression(2)线性回归梯度下降中学习率的讨论
这篇博客针对的AndrewNg在公开课中未讲到的,线性回归梯度下降的学习率进行讨论,并且结合例子讨论梯度下降初值的问题. 线性回归梯度下降中的学习率上一篇博客中我们推导了线性回归,并且用梯度下降来求 ...
Ng第二课：单变量线性回归(Linear Regression with One Variable)
二.单变量线性回归(Linear Regression with One Variable) 2.1 模型表示 2.2 代价函数 2.3 代价函数的直观理解 2.4 梯度下降 2.5 梯度下 ...
斯坦福第二课：单变量线性回归(Linear Regression with One Variable)
二.单变量线性回归(Linear Regression with One Variable) 2.1 模型表示 2.2 代价函数 2.3 代价函数的直观理解 I 2.4 代价函数的直观理解 I ...
机器学习方法：回归（一）：线性回归Linear regression
欢迎转载,转载请注明:本文出自Bin的专栏blog.csdn.net/xbinworld. 开一个机器学习方法科普系列:做基础回顾之用,学而时习之:也拿出来与大家分享.数学水平有限,只求易懂,学习与工 ...
斯坦福CS229机器学习课程笔记 Part1：线性回归 Linear Regression
机器学习三要素机器学习的三要素为:模型.策略.算法. 模型:就是所要学习的条件概率分布或决策函数.线性回归模型策略:按照什么样的准则学习或选择最优的模型.最小化均方误差,即所谓的 least-sq ...
机器学习 (一) 单变量线性回归 Linear Regression with One Variable
文章内容均来自斯坦福大学的Andrew Ng教授讲解的Machine Learning课程,本文是针对该课程的个人学习笔记,如有疏漏,请以原课程所讲述内容为准.感谢博主Rachel Zhang的个人笔 ...
ML 线性回归Linear Regression
线性回归 Linear Regression MOOC机器学习课程学习笔记 1 单变量线性回归Linear Regression with One Variable 1.1 模型表达Model Rep ...
ufldl学习笔记与编程作业：Linear Regression（线性回归）
ufldl学习笔记与编程作业:Linear Regression(线性回归) ufldl出了新教程,感觉比之前的好.从基础讲起.系统清晰,又有编程实践. 在deep learning高质量群里面听一些 ...

随机推荐

ubuntu mac terminal install software
http-server // ubuntu sudo npm install http-server -g npm node.js yarn
常见HTTP状态(304，)
一.1XX(临时响应) 表示临时响应并需要请求者继续执行操作的状态码. 100(继续) 请求者应当继续提出请求.服务器返回此代码表示:已经收到请求的第一部分,正在等待其余部分. 101(切换协议) 请 ...
APP Inventor 基于网络微服务器的即时通信APP
APP Inventor 基于网络微服务器的即时通信APP 一.总结一句话总结:(超低配版的QQ,逃~) 1.APP Inventor是什么? google 傻瓜式编程手机 app App In ...
spring security3.1配置比较纠结的2个问题
转自:http://www.iteye.com/topic/1122629 总论无疑问的,spring security在怎么保护网页应用安全上做得很强很周全,但有些地方还是很差强人意,比如对< ...
mysql外键理解
一个班级的学生个人信息表: 什么是外键在设计的时候,就给表1加入一个外键,这个外键就是表2中的学号字段,那么这样表1就是主表,表2就是子表. 外键用来干什么为了一张表记录的数据不要太过冗余. 这和 ...
phalcon: 项目地址/P(.*), 项目地址/Pbaidu 与路由
phalcon: 项目地址/P(.*) 与路由有一个项目地址:因客户渠道不同,带的参数也不相同.当时想到的是伪静态规则,但是发现自己没有那么强大.该走phalcon路由规则,地址如下: www.x ...
bzoj1083: [SCOI2005]繁忙的都市瓶颈生成树
https://www.lydsy.com/JudgeOnline/problem.php?id=1083 题意:给你一个图,求生成树最大边权最小值就是求瓶颈生成树(生成树中最大边权最小),最小生成 ...
个人知识管理系统Version1.0开发记录（02）
第一步做什么我们该如何入手呢?先来看看目前常用的三个方法. 1.从事物产生的源头出发,层层推进,步步验证,最后开花结果.这种方法经常用于科研项目,或者三期以后的工程,国家政府项目用的较多. ...
Where do I belong
先给数组排序,然后找到指定的值在数组的位置,最后返回位置对应的索引. 举例:where([1,2,3,4], 1.5) 应该返回 1.因为1.5插入到数组[1,2,3,4]后变成[1,1.5,2,3, ...
mybatis定义拦截器
applicationContext.xml <bean id="sqlSessionFactory" class="org.mybatis.spring.SqlS ...

线性回归 Linear regression(1)线性回归的基本算法与求解

线性回归 Linear regression(1)线性回归的基本算法与求解的更多相关文章

随机推荐

热门专题