第三集 欠拟合与过拟合的概念、局部加权回归、logistic回归、感知器算法
课程大纲
欠拟合的概念(非正式):数据中某些非常明显的模式没有成功的被拟合出来。如图所示,更适合这组数据的应该是而不是一条直线。
过拟合的概念(非正式):算法拟合出的结果仅仅反映了所给的特定数据的特质。
非参数学习方法
线性回归是参数学习方法,有固定数目的参数以用来进行数据拟合的学习型算法算法称为参数学习方法。对于非参数学习方法来讲,其参数的数量随着训练样本的数目m线性增长;换句话来说,就是算法所需要的东西会随着训练集合线性增长。局部加权回归算法是非参数学习方法的一个典型代表。
局部加权回归算法(Loess算法)
与线性回归算法相比,其最大的特点是注重对临近点而不是所有训练样本的精确拟合,它同时忽略那些与要估计的输入距离很远的点的贡献。局部加权回归算法描述如下:
其中X是指输入到输出函数h(x)中进行预测的新数据。是波长函数,它控制了权值随距离下降的速率。
很小时,下降很快;
很大时,下降很慢。(个人感觉类似于方差)。
若很小,说明两点很近,
趋近于1,权值很大。若
很大,说明两点很远,
趋近于0,贡献可以忽略。这样就可以实现对临近点的精确拟合。
对线性回归模型的概率解释
假设:
为误差项,这个误差项可以理解为其他没有考虑到模型中的特征或者随机噪声造成的影响。假设
满足均值为0的高斯分布(这样的假设是很有道理的,因为绝大多数情况
均服从高斯分布,且由中心极限定理也可以证明)。所以概率分布函数如下:
其中第二个式子中的分号代表以为参数。由于
之间是相互独立的,在这里引出
的似然函数:
这时我们的目标是使P最大化也就是最大化,我们要求出合适的
来实现这一目标。为了方便计算,引入如下函数:
为了最大化这个函数,其实就是使这一项最小化,而这个式子正好等于之前提到过的
。下面可以用梯度下降的方法解出解析解。这就是对线性模型的概率解释。
分类算法
在分类算法中y的取值只有0和1两种,是二元分类。则可设。对于
可以令其为sigmod函数(也可叫做logistic函数),
,其图像如下所示:
由于y只能取0和1,则概率密度函数可以表示成如下形式:
那么,与上面对线性回归的概率解释形式相似,我们可以推导出如下式子:
若想使这个函数最大化,我们可以采用上节课讲过的梯度下降方法,当然在这里是梯度上升,下式中的“+”与上节课的梯度下降的“—”正好相反,在这里我们是要求最大化,所以用“+”。
如上式所示,参数可以通过概率的方式求解出来。
感知器算法
感知器算法与logistic回归相似,但是g(z)函数变成了如下形式:
其余均与logistic回归相似,参数的解为:
版权声明:本文为博主原创文章,未经博主允许不得转载。
第三集 欠拟合与过拟合的概念、局部加权回归、logistic回归、感知器算法的更多相关文章
- Stanford大学机器学习公开课(三):局部加权回归、最小二乘的概率解释、逻辑回归、感知器算法
(一)局部加权回归 通常情况下的线性拟合不能很好地预测所有的值,因为它容易导致欠拟合(under fitting).如下图的左图.而多项式拟合能拟合所有数据,但是在预测新样本的时候又会变得很糟糕,因为 ...
- 局部加权回归、欠拟合、过拟合(Locally Weighted Linear Regression、Underfitting、Overfitting)
欠拟合.过拟合 如下图中三个拟合模型.第一个是一个线性模型,对训练数据拟合不够好,损失函数取值较大.如图中第二个模型,如果我们在线性模型上加一个新特征项,拟合结果就会好一些.图中第三个是一个包含5阶多 ...
- 局部加权回归、欠拟合、过拟合 - Andrew Ng机器学习公开课笔记1.3
本文主要解说局部加权(线性)回归.在解说局部加权线性回归之前,先解说两个概念:欠拟合.过拟合.由此引出局部加权线性回归算法. 欠拟合.过拟合 例如以下图中三个拟合模型.第一个是一个线性模型.对训练数据 ...
- 过拟合/欠拟合&logistic回归等总结(Ng第二课)
昨天学习完了Ng的第二课,总结如下: 过拟合:欠拟合: 参数学习算法:非参数学习算法 局部加权回归 KD tree 最小二乘 中心极限定律 感知器算法 sigmod函数 梯度下降/梯度上升 二元分类 ...
- DL基础补全计划(三)---模型选择、欠拟合、过拟合
PS:要转载请注明出处,本人版权所有. PS: 这个只是基于<我自己>的理解, 如果和你的原则及想法相冲突,请谅解,勿喷. 前置说明 本文作为本人csdn blog的主站的备份.(Bl ...
- Pytorch_第八篇_深度学习 (DeepLearning) 基础 [4]---欠拟合、过拟合与正则化
深度学习 (DeepLearning) 基础 [4]---欠拟合.过拟合与正则化 Introduce 在上一篇"深度学习 (DeepLearning) 基础 [3]---梯度下降法" ...
- 机器学习之路:python 多项式特征生成PolynomialFeatures 欠拟合与过拟合
分享一下 线性回归中 欠拟合 和 过拟合 是怎么回事~为了解决欠拟合的情 经常要提高线性的次数建立模型拟合曲线, 次数过高会导致过拟合,次数不够会欠拟合.再建立高次函数时候,要利用多项式特征生成器 生 ...
- Java 使用 Apache commons-math3 线性拟合、非线性拟合实例(带效果图)
Java 使用 CommonsMath3 的线性和非线性拟合实例,带效果图 例子查看 GitHub Gitee 运行src/main/java/org/wfw/chart/Main.java 即可查看 ...
- 浅谈Logistic回归及过拟合
判断学习速率是否合适?每步都下降即可.这篇先不整理吧... 这节学习的是逻辑回归(Logistic Regression),也算进入了比较正统的机器学习算法.啥叫正统呢?我概念里面机器学习算法一般是这 ...
随机推荐
- Eclipse里面开发ExtJS程序
首先在http://extjs.org.cn/download下载ext ,我下载的版本是ext-3.4.1.1-gpl,下载好以后解压. 然后在eclipse里面先建立一个web项目,建立好后再we ...
- [你必须知道的.NET]第三十一回,深入.NET 4.0之,从“新”展望
发布日期:2009.05.22 作者:Anytao © 2009 Anytao.com ,Anytao原创作品,转贴请注明作者和出处. /// <summary> /// 本文开始,将以& ...
- Android Grapics图像类体系
- mysql 死锁检查
今天看了一篇关于死锁检查的blog. Advanced InnoDB Deadlock Troubleshooting – What SHOW INNODB STATUS Doesn’t Tell Y ...
- C#文件输入输出流
从输入流中读取数据(行读取字符串) using System; using System.Collections.Generic; using System.Linq; using System.Te ...
- 【Apache运维基础(2)】主配置文件说明
ServerTokens OS 系统信息,在访问出错时出现;把OS改为Minor,就不显示系统信息 ServerSignature On 把On改为Off就连普通的系统都给隐藏起来;改为Email就会 ...
- Android 使用Application类保存应用的全局数据
在实际应用我们经常需要对数据进行交互与保存,但Intent中默认的方法对传输数据是有类型限制的,当我们需要传输或保存一个复杂的泛型数据时,使用Application是一个很好的解决办法. 顾名思义,A ...
- Java 类加载器(转)
java虚拟机中可以安装多个类加载,系统默认三个主要类加载器,每个类负责加载特定位置的类:BootStrap(内嵌在java虚拟机中由C++编写),ExtClassLoader,AppClassLoa ...
- weka数据挖掘拾遗(三)----再谈如果何生成arff
前一阵子写过一个arff的随笔,但是写完后发现有些啰嗦.其实如果使用weka自带的api,生成arff文件将变成一件很简单的事儿. 首先,可以先把特征文件生成csv格式的.csv格式就是每列数据都用逗 ...
- eclipse 中使用tomcat
最近写了个商品搜索模块,要做成tomcat服务,以前只关注算法,从来没有使用过tomcat,这次上网上查了些资料还搞定(小公司真是锻炼人啊,以前我从来不考虑这些服务问题). 1.tomcat 环境的搭 ...