欠拟合、过拟合

如下图中三个拟合模型。第一个是一个线性模型，对训练数据拟合不够好，损失函数取值较大。如图中第二个模型，如果我们在线性模型上加一个新特征 $x^{2}$ 项，拟合结果就会好一些。图中第三个是一个包含5阶多项式的模型，对训练数据几乎完美拟合。

模型一没有很好的拟合训练数据，在训练数据以及在测试数据上都存在较大误差，这种情况称之为欠拟合（underfitting）。

模型三对训练数据拟合的很不错，但是在测试数据上的准确度并不理想。这种对训练数据拟合较好，而在测试数据上准确度较低的情况称之为过拟合（overfitting）。

局部加权线性回归（Locally weighted linear regression，LWR）

从上面欠拟合和过拟合的例子中我们可以体会到，在回归预测模型中，预测模型的准确度特别依赖于特征的选择。特征选择不合适，往往会导致预测结果的天壤之别。局部加权线性回归很好的解决了这个问题，它的预测性能不太依赖于选择的特征，又能很好的避免欠拟合和过拟合的风险。

在理解局部加权线性回归前，先回忆一下线性回归。线性回归的损失函数把训练数据中的样本看做是平等的，并没有权重的概念。线性回归的详细请参考《线性回归、梯度下降》，它的主要思想为：

而局部加权线性回归，在构造损失函数时加入了权重w，对距离预测点较近的训练样本给以较高的权重，距离预测点较远的训练样本给以较小的权重。权重的取值范围是(0,1)。

局部加权线性回归的主要思想是：

其中假设权重 $w^{(i)}$ 符合公式

公式中权重大小取决于预测点x与训练样本 $x^{(i)}$ 的距离。如果| $x^{(i)}$ - x|较小，那么取值接近于1，反之接近0。参数τ称为bandwidth，用于控制权重的变化幅度。

局部加权线性回归优点是不太依赖特征选择，而且只需要用线性模型就训练出不错的拟合模型。

但是由于局部加权线性回归是一个非参数学习算法，损失值随着预测值的不同而不同，这样θ无法事先确定，每次预测时都需要扫描所有数据重新计算θ，所以计算量比较大。

出处：http://www.cnblogs.com/BYRans/

局部加权回归、欠拟合、过拟合（Locally Weighted Linear Regression、Underfitting、Overfitting）的更多相关文章

Locally weighted linear regression(局部加权线性回归)
(整理自AndrewNG的课件,转载请注明.整理者:华科小涛@http://www.cnblogs.com/hust-ghtao/) 前面几篇博客主要介绍了线性回归的学习算法,那么它有什么不足的地方么 ...
Locally Weighted Linear Regression 局部加权线性回归-R实现
局部加权线性回归 [转载时请注明来源]:http://www.cnblogs.com/runner-ljt/ Ljt 作为一个初学者,水平有限,欢迎交流指正. 线性回归容易出现过拟合或欠拟合的问 ...
局部权重线性回归(Locally weighted linear regression)
在线性回归中,因为对參数个数选择的问题是在问题求解之前已经确定好的,因此參数的个数不能非常好的确定,假设參数个数过少可能拟合度不好,产生欠拟合(underfitting)问题,或者參数过多,使得函数过 ...
局部加权线性回归(Locally weighted linear regression)
首先我们来看一个线性回归的问题,在下面的例子中,我们选取不同维度的特征来对我们的数据进行拟合. 对于上面三个图像做如下解释: 选取一个特征,来拟合数据,可以看出来拟合情况并不是很好,有些数据误差还是比 ...
局部加权回归、欠拟合、过拟合 - Andrew Ng机器学习公开课笔记1.3
本文主要解说局部加权(线性)回归.在解说局部加权线性回归之前,先解说两个概念:欠拟合.过拟合.由此引出局部加权线性回归算法. 欠拟合.过拟合例如以下图中三个拟合模型.第一个是一个线性模型.对训练数据 ...
线性回归 Linear regression(4) 局部加权回归
这篇文章将介绍过拟合和欠拟合的概念,并且介绍局部加权回归算法. 过拟合和欠拟合之前在线性回归中,我们总是将单独的x作为我们的特征,但其实我们可以考虑将,甚至x的更高次作为我们的特征,那么我们通过线性 ...
第三集欠拟合与过拟合的概念、局部加权回归、logistic回归、感知器算法
课程大纲欠拟合的概念(非正式):数据中某些非常明显的模式没有成功的被拟合出来.如图所示,更适合这组数据的应该是而不是一条直线. 过拟合的概念(非正式):算法拟合出的结果仅仅反映了所给的特定数据的特质 ...
Robust Locally Weighted Regression 鲁棒局部加权回归 -R实现
鲁棒局部加权回归 [转载时请注明来源]:http://www.cnblogs.com/runner-ljt/ Ljt 作为一个初学者,水平有限,欢迎交流指正. 算法参考文献: (1) Robust L ...
Stanford大学机器学习公开课（三）：局部加权回归、最小二乘的概率解释、逻辑回归、感知器算法
(一)局部加权回归通常情况下的线性拟合不能很好地预测所有的值,因为它容易导致欠拟合(under fitting).如下图的左图.而多项式拟合能拟合所有数据,但是在预测新样本的时候又会变得很糟糕,因为 ...

随机推荐

理解C# 4 dynamic(1) - var, object, dynamic的区别以及dynamic的使用
阅读目录: 一. 为什么是它们三个二. 能够任意赋值的原因三. dynamic的用法四. 使用dynamic的注意事项一. 为什么是它们三个? 拿这三者比较的原因是它们在使用的时候非常相似.你 ...
【51Nod 1674】【算法马拉松 19A】区间的价值 V2
http://www.51nod.com/onlineJudge/questionCode.html#!problemId=1674 对区间分治,统计$[l,r]$中经过mid的区间的答案. 我的 ...
.eww
http://sourceforge.net/projects/ezwinports/files/ 下载libxml2的文件. 再下载的bin里复制libiconv-2.dll和libxml2-2.d ...
noip2016 Day1T3
理解错题意了....导致考场上直接爆零TAT 正解就是期望dp啊,dp[i][j][0/1]表示前i节课用了j次机会,这一次用没用的期望代价看代码吧 #include<iostream> ...
MapReduce实现手机上网日志分析（分区）
一.问题背景实际业务的需要,比如以移动为例,河南的用户去了北京上网,那么他的上网信息默认保存在了北京的基站,那么我们想要查询北京地区的上网日志信息默认也包含了其他地区用户的在本区的上网信息,否则只能 ...
<<< eclipse软件部署修改项目的访问地址
在eclipse开发javaweb项目的时候,访问项目时需要在浏览器地址输入:localhost:8080/项目名但是大多数部署到服务器的时候访问的是根目录,就是不加localhost:8080后 ...
Javascript实现前端简单路由
<!DOCTYPE html> <html> <head> <meta charset="UTF-8"> <meta http ...
js只弹窗一次
<script> var alertmessage="检测到您当前浏览器为IE8或以下版本,建议您使用IE9或以上版本,或者火狐.谷歌浏览器,才能体验到最佳效果" fu ...
getResourceAsStream和getResource的用法及Demo实例
用JAVA获取文件,听似简单,但对于很多像我这样的新人来说,还是掌握颇浅,用起来感觉颇深,大家最经常用的,就是用JAVA的File类,如要取得 D:/test.txt文件,就会这样用File file ...
Spring系列之Spring常用注解总结
传统的Spring做法是使用.xml文件来对bean进行注入或者是配置aop.事物,这么做有两个缺点:1.如果所有的内容都配置在.xml文件中,那么.xml文件将会十分庞大:如果按需求分开.xml文件 ...

局部加权回归、欠拟合、过拟合（Locally Weighted Linear Regression、Underfitting、Overfitting）

欠拟合、过拟合

局部加权线性回归（Locally weighted linear regression，LWR）

局部加权回归、欠拟合、过拟合（Locally Weighted Linear Regression、Underfitting、Overfitting）的更多相关文章

随机推荐

热门专题