第三集 欠拟合与过拟合的概念、局部加权回归、logistic回归、感知器算法
课程大纲
欠拟合的概念(非正式):数据中某些非常明显的模式没有成功的被拟合出来。如图所示,更适合这组数据的应该是而不是一条直线。
过拟合的概念(非正式):算法拟合出的结果仅仅反映了所给的特定数据的特质。
非参数学习方法
线性回归是参数学习方法,有固定数目的参数以用来进行数据拟合的学习型算法算法称为参数学习方法。对于非参数学习方法来讲,其参数的数量随着训练样本的数目m线性增长;换句话来说,就是算法所需要的东西会随着训练集合线性增长。局部加权回归算法是非参数学习方法的一个典型代表。
局部加权回归算法(Loess算法)
与线性回归算法相比,其最大的特点是注重对临近点而不是所有训练样本的精确拟合,它同时忽略那些与要估计的输入距离很远的点的贡献。局部加权回归算法描述如下:
其中X是指输入到输出函数h(x)中进行预测的新数据。是波长函数,它控制了权值随距离下降的速率。
很小时,下降很快;
很大时,下降很慢。(个人感觉类似于方差)。
若很小,说明两点很近,
趋近于1,权值很大。若
很大,说明两点很远,
趋近于0,贡献可以忽略。这样就可以实现对临近点的精确拟合。
对线性回归模型的概率解释
假设:
为误差项,这个误差项可以理解为其他没有考虑到模型中的特征或者随机噪声造成的影响。假设
满足均值为0的高斯分布(这样的假设是很有道理的,因为绝大多数情况
均服从高斯分布,且由中心极限定理也可以证明)。所以概率分布函数如下:
其中第二个式子中的分号代表以为参数。由于
之间是相互独立的,在这里引出
的似然函数:
这时我们的目标是使P最大化也就是最大化,我们要求出合适的
来实现这一目标。为了方便计算,引入如下函数:
为了最大化这个函数,其实就是使这一项最小化,而这个式子正好等于之前提到过的
。下面可以用梯度下降的方法解出解析解。这就是对线性模型的概率解释。
分类算法
在分类算法中y的取值只有0和1两种,是二元分类。则可设。对于
可以令其为sigmod函数(也可叫做logistic函数),
,其图像如下所示:
由于y只能取0和1,则概率密度函数可以表示成如下形式:
那么,与上面对线性回归的概率解释形式相似,我们可以推导出如下式子:
若想使这个函数最大化,我们可以采用上节课讲过的梯度下降方法,当然在这里是梯度上升,下式中的“+”与上节课的梯度下降的“—”正好相反,在这里我们是要求最大化,所以用“+”。
如上式所示,参数可以通过概率的方式求解出来。
感知器算法
感知器算法与logistic回归相似,但是g(z)函数变成了如下形式:
其余均与logistic回归相似,参数的解为:
版权声明:本文为博主原创文章,未经博主允许不得转载。
第三集 欠拟合与过拟合的概念、局部加权回归、logistic回归、感知器算法的更多相关文章
- Stanford大学机器学习公开课(三):局部加权回归、最小二乘的概率解释、逻辑回归、感知器算法
(一)局部加权回归 通常情况下的线性拟合不能很好地预测所有的值,因为它容易导致欠拟合(under fitting).如下图的左图.而多项式拟合能拟合所有数据,但是在预测新样本的时候又会变得很糟糕,因为 ...
- 局部加权回归、欠拟合、过拟合(Locally Weighted Linear Regression、Underfitting、Overfitting)
欠拟合.过拟合 如下图中三个拟合模型.第一个是一个线性模型,对训练数据拟合不够好,损失函数取值较大.如图中第二个模型,如果我们在线性模型上加一个新特征项,拟合结果就会好一些.图中第三个是一个包含5阶多 ...
- 局部加权回归、欠拟合、过拟合 - Andrew Ng机器学习公开课笔记1.3
本文主要解说局部加权(线性)回归.在解说局部加权线性回归之前,先解说两个概念:欠拟合.过拟合.由此引出局部加权线性回归算法. 欠拟合.过拟合 例如以下图中三个拟合模型.第一个是一个线性模型.对训练数据 ...
- 过拟合/欠拟合&logistic回归等总结(Ng第二课)
昨天学习完了Ng的第二课,总结如下: 过拟合:欠拟合: 参数学习算法:非参数学习算法 局部加权回归 KD tree 最小二乘 中心极限定律 感知器算法 sigmod函数 梯度下降/梯度上升 二元分类 ...
- DL基础补全计划(三)---模型选择、欠拟合、过拟合
PS:要转载请注明出处,本人版权所有. PS: 这个只是基于<我自己>的理解, 如果和你的原则及想法相冲突,请谅解,勿喷. 前置说明 本文作为本人csdn blog的主站的备份.(Bl ...
- Pytorch_第八篇_深度学习 (DeepLearning) 基础 [4]---欠拟合、过拟合与正则化
深度学习 (DeepLearning) 基础 [4]---欠拟合.过拟合与正则化 Introduce 在上一篇"深度学习 (DeepLearning) 基础 [3]---梯度下降法" ...
- 机器学习之路:python 多项式特征生成PolynomialFeatures 欠拟合与过拟合
分享一下 线性回归中 欠拟合 和 过拟合 是怎么回事~为了解决欠拟合的情 经常要提高线性的次数建立模型拟合曲线, 次数过高会导致过拟合,次数不够会欠拟合.再建立高次函数时候,要利用多项式特征生成器 生 ...
- Java 使用 Apache commons-math3 线性拟合、非线性拟合实例(带效果图)
Java 使用 CommonsMath3 的线性和非线性拟合实例,带效果图 例子查看 GitHub Gitee 运行src/main/java/org/wfw/chart/Main.java 即可查看 ...
- 浅谈Logistic回归及过拟合
判断学习速率是否合适?每步都下降即可.这篇先不整理吧... 这节学习的是逻辑回归(Logistic Regression),也算进入了比较正统的机器学习算法.啥叫正统呢?我概念里面机器学习算法一般是这 ...
随机推荐
- ***mysql索引总结----mysql索引类型以及创建
文章归属:http://feiyan.info/16.html,我想自己去写了,但是发现此君总结的非常详细.直接搬过来了 关于MySQL索引的好处,如果正确合理设计并且使用索引的MySQL是一辆兰博基 ...
- 【poj1061-青蛙的约会】拓展欧几里得-不定方程
http://poj.org/problem?id=1061 题意:裸题.注意负数. //poj1061 #include<cstdio> #include<cstdlib> ...
- python爬煎蛋妹子图
# python3 # jiandan meizi tu import urllib import urllib.request as req import os import time import ...
- 小奇模拟赛9.13 by hzwer
2015年9月13日NOIP模拟赛 by hzwer (这是小奇=> 小奇挖矿(explo) [题目背景] 小奇要开采一些矿物,它驾驶着一台带有钻头(初始能力值w)的飞船,按既定路线依次飞 ...
- JSTL Tag学习笔记(二)之<fmt: />
JSTL的formatting tags可以用来格式化和显示文本.日期.时间.数字.如果在JSP页面中要用到该库提供的tag的话,需要引入如下taglib: <%@ taglib prefix= ...
- [iOS]ARC和MRC下混编
1.在MRC工程中使用ARC的文件(例如AFNetworking,SDWebImage,MJRefresh等)在Build Phases里找到对应.m 在后面添加-fobjc-arc(代表这个文件使用 ...
- Echarts事件
Echart饼图.柱状图.折线图(pie.bar.line)添加点击事件发布日期:2014年08月10日 来源:PHP1.CN 点击:250638摘要:var myChart= echar ...
- struts使用html:file上传文件的时候文件名乱码解决
<body> <html:form action="/jwid/struts1x/15.3/form/upload.do?action=upload" encty ...
- sql语句的基本操作
建立一个数据库 create DATABASE mydatabase; 建立一张数据表: ##创建一个员工表##create table employee( eid int not NULL PRIM ...
- win8.1下解决Visual C++不兼容的方法
1.下载visual c++的安装包 百度云下载地址为:http://pan.baidu.com/s/1c0dRAYs 2.修改MSDEV.EXE文件名 安装完成后在安装目录下找到MSDEV.EXE, ...