Coursera Machine Learning : Regression 简单回归
简单回归
这里以房价预测作为例子来说明:这里有一批关于房屋销售记录的历史数据,知道房价和房子的大小。接下来就根据房子的大小来预测下房价。
简单线性回归,如下图所示,找到一条线,大体描述了历史数据的走势。
f(x) 代表房价的预测值
wo 代表截距(intercept) 相关系数
w1 代表特征(房子大小)的相关系数(coefficient)
x 代表房子的大小
yi 代表房价真实值
xi 代表房子大小的真实值
εi 代表真实值与预测值之间的误差

已知x,只要求出wo和w1就能简单的对房价进行预测,但是w0和w1的值如何选择,更能准确的描述历史数据,更能准确的进行预测?
这里要注意区分如下两个点:
1、更准确的描述测试数据的点。
2、更准确的对数据进行预测。
更准确的描述测试数据,并不能代表可以更准确的对数据进行预测。后面会进一步讨论。
咱们回到w0和w1值的选择,每种w0和w1的选择都会形成一条线,咱们先讨论如何评价每条线的“代价”。
RSS残差平方和,针对每个测试数据,将真实值与预测值的差值进行平方,并将所有的结果进行求和。

RSS的值越小,就说明这条线更准确的描述了测试数据的点。

w0和w1的值为多少的时候RSS的值最小呐?

先简单回顾一下,凹凸函数,
凹函数(concave)有最大值点,凸函数(convex)有最小指点,另凸凹函数的导数为0,则可求出极值点。
比如g(w) = 5-(w-10)2 , 对 g(w)求导 = 0 - 2(w-10)1 = -2w + 20 = 0, w = 10
将w = 10 代入源函数g(10) = 5 - (10 - 10)2 = 5, 极大值为5

通过下山方法查找最小值,如下图:
取w(t),当W(t)的导数小于0,说明W(t)在最小值的左边,需要右移动增加一步,
当W(t)的导数大于0,说明W(t)在最小值的右边,需要左移动增加一步,直到结果无限接近于0
将增加一步的大小量化,记作步长μ,将无限接近于0量化为阀值ε,这种方式是进行迭代计算,直到结果小于阀值,结束运算,不然将根据步长迭代计算。

根据上述的描述,可以计算出RSS的值取最小值时w0和w1的值:
1、直接将倾斜度置为0,计算导数为0的结果。
2、梯度下降,迭代运算,取最小值为小于阀值。
接下来进行公式推导,求出具体的值。
根据之前的推导知道RSS的公式,然后分别对w0和w1进行求导,求导结果如下:

通过方法一求w0和w1,将结果置为0
w1 = (Σyixi - ΣyiΣxi/N) / (Σxi2 - ΣxiΣxi)
w0 = Σyi/N - w1(Σxi/N)
需要知道
Σyi 房价总和
Σxi 房屋总大小
Σxi2 房屋大小平方和
Σyixi 房价和房屋大小乘积和

方法二,梯度下降算法实现,如下图:


贴两个具体的计算实例,方便大家理解:


Coursera Machine Learning : Regression 简单回归的更多相关文章
- Coursera Machine Learning : Regression 评估性能
评估性能 评估损失 1.Training Error 首先要通过数据来训练模型,选取数据中的一部分作为训练数据. 损失函数可以使用绝对值误差或者平方误差等方法来计算,这里使用平方误差的方法,即: (y ...
- Coursera Machine Learning : Regression 多元回归
多元回归 回顾一下简单线性回归:一个特征,两个相关系数 实际的应用要比这种情况复杂的多,比如 1.房价和房屋面积并不只是简单的线性关系. 2.影响房价的因素有很多,不仅仅是房屋面积,还包括很多其他因素 ...
- Coursera Machine Learning: Regression 证书
- Coursera machine learning 第二周 quiz 答案 Linear Regression with Multiple Variables
https://www.coursera.org/learn/machine-learning/exam/7pytE/linear-regression-with-multiple-variables ...
- 【Coursera - machine learning】 Linear regression with one variable-quiz
Question 1 Consider the problem of predicting how well a student does in her second year of college/ ...
- Coursera machine learning 第二周 编程作业 Linear Regression
必做: [*] warmUpExercise.m - Simple example function in Octave/MATLAB[*] plotData.m - Function to disp ...
- Coursera, Machine Learning, notes
Basic theory (i) Supervised learning (parametric/non-parametric algorithms, support vector machine ...
- 神经网络作业: NN LEARNING Coursera Machine Learning(Andrew Ng) WEEK 5
在WEEK 5中,作业要求完成通过神经网络(NN)实现多分类的逻辑回归(MULTI-CLASS LOGISTIC REGRESSION)的监督学习(SUOERVISED LEARNING)来识别阿拉伯 ...
- Coursera, Machine Learning, Anomoly Detection & Recommender system
Algorithm: When to select Anonaly detection or Supervised learning? 总的来说guideline是如果positive e ...
随机推荐
- html狂记
由于承接一部分站点优化工作,竟无节操地好几天没有喂博客,好了,今天完成交接工作,马上奉上DIV+CSS传统开发的干货一枚,内容绝非原创,仅是收集.学习.消化.总结.吐出... 基本结构标签: < ...
- oracle-关于dual
来源:百度知道1. dual 是一张表.是一张只有一个字段,一行记录的表. 2.习惯上,我们称之为'伪表'.因为他不存储主题数据.3. 他的存在,是为了操作上的方便.因为select 都是要有特定对象 ...
- Could not find a getter for orderItems in class
::, ERROR ContextLoader: - Context initialization failed org.springframework.beans.factory.BeanCreat ...
- SQL Server提高事务复制效率优化(一)总体概述
随着公司业务的发展,数据量增长迅速,在解决Scale Out的同时,还要考虑到主从的复制延迟问题,尽量降到1s以内满足线上业务,如果不调整,SQL Server默认的配置可能平均要3s左右.生产的 ...
- 区块 Blocks
Structure / Blocks / Demonstrate block regions
- Convert HTML to Text(转载)
原文地址:http://www.blackbeltcoder.com/Articles/strings/convert-html-to-text Download Source Code Intro ...
- Orchard分类Taxonomies图文教程
Orchard分类和标签都实现对内容的分类管理,两者区别是分类的子项之间是具有级别(同级.上下级)关系,而标签是很随意的,子项之间可以有关系也可以没有,今天给大家分享分类的使用方法. 一.环境说明 O ...
- AIX 环境下遇到Device Busy问题
IBM AIX v5.3操作系统环境下在对网络或网卡进行操作过程中经常遇到"Device Busy"而终止操作例如:#rmdev -l ent1遇到如下返回信息Method err ...
- 发现大量的TIME_WAIT解决办法
存在一定的TIME_WAIT是正常的,个人认为如果超过了连接数的比例就不是很正常 服务器端与客户端建立TCP/IP连接后关闭SOCKET后,服务器端连接的端口状态变为TIME_WAIT.主动关闭的一方 ...
- eclipse debug maven项目时出现缺少库的问题
调试maven web项目时出现缺少库的情况导致项目无法启动 可是打包到tomcat发布却一切正常 后来在stackoverlow上找到了解决方案 项目右键属性->Deployment Ass ...