课程大纲

欠拟合的概念(非正式):数据中某些非常明显的模式没有成功的被拟合出来。如图所示,更适合这组数据的应该是而不是一条直线。

过拟合的概念(非正式)算法拟合出的结果仅仅反映了所给的特定数据的特质。

非参数学习方法

线性回归是参数学习方法,有固定数目的参数以用来进行数据拟合的学习型算法算法称为参数学习方法。对于非参数学习方法来讲,其参数的数量随着训练样本的数目m线性增长;换句话来说,就是算法所需要的东西会随着训练集合线性增长。局部加权回归算法是非参数学习方法的一个典型代表。

局部加权回归算法(Loess算法)

与线性回归算法相比,其最大的特点是注重对临近点而不是所有训练样本的精确拟合,它同时忽略那些与要估计的输入距离很远的点的贡献。局部加权回归算法描述如下:

其中X是指输入到输出函数h(x)中进行预测的新数据。是波长函数,它控制了权值随距离下降的速率。很小时,下降很快;很大时,下降很慢。(个人感觉类似于方差)。

很小,说明两点很近,趋近于1,权值很大。若很大,说明两点很远,趋近于0,贡献可以忽略。这样就可以实现对临近点的精确拟合。

对线性回归模型的概率解释

假设:

为误差项,这个误差项可以理解为其他没有考虑到模型中的特征或者随机噪声造成的影响。假设满足均值为0的高斯分布(这样的假设是很有道理的,因为绝大多数情况均服从高斯分布,且由中心极限定理也可以证明)。所以概率分布函数如下:

其中第二个式子中的分号代表以为参数。由于之间是相互独立的,在这里引出的似然函数:

这时我们的目标是使P最大化也就是最大化,我们要求出合适的来实现这一目标。为了方便计算,引入如下函数:

为了最大化这个函数,其实就是使这一项最小化,而这个式子正好等于之前提到过的。下面可以用梯度下降的方法解出解析解。这就是对线性模型的概率解释。

分类算法

在分类算法中y的取值只有0和1两种,是二元分类。则可设。对于可以令其为sigmod函数(也可叫做logistic函数),,其图像如下所示:

由于y只能取0和1,则概率密度函数可以表示成如下形式:

那么,与上面对线性回归的概率解释形式相似,我们可以推导出如下式子:

若想使这个函数最大化,我们可以采用上节课讲过的梯度下降方法,当然在这里是梯度上升,下式中的“+”与上节课的梯度下降的“—”正好相反,在这里我们是要求最大化,所以用“+”。

如上式所示,参数可以通过概率的方式求解出来。

感知器算法



感知器算法与logistic回归相似,但是g(z)函数变成了如下形式:

其余均与logistic回归相似,参数的解为:

版权声明:本文为博主原创文章,未经博主允许不得转载。

第三集 欠拟合与过拟合的概念、局部加权回归、logistic回归、感知器算法的更多相关文章

  1. Stanford大学机器学习公开课(三):局部加权回归、最小二乘的概率解释、逻辑回归、感知器算法

    (一)局部加权回归 通常情况下的线性拟合不能很好地预测所有的值,因为它容易导致欠拟合(under fitting).如下图的左图.而多项式拟合能拟合所有数据,但是在预测新样本的时候又会变得很糟糕,因为 ...

  2. 局部加权回归、欠拟合、过拟合(Locally Weighted Linear Regression、Underfitting、Overfitting)

    欠拟合.过拟合 如下图中三个拟合模型.第一个是一个线性模型,对训练数据拟合不够好,损失函数取值较大.如图中第二个模型,如果我们在线性模型上加一个新特征项,拟合结果就会好一些.图中第三个是一个包含5阶多 ...

  3. 局部加权回归、欠拟合、过拟合 - Andrew Ng机器学习公开课笔记1.3

    本文主要解说局部加权(线性)回归.在解说局部加权线性回归之前,先解说两个概念:欠拟合.过拟合.由此引出局部加权线性回归算法. 欠拟合.过拟合 例如以下图中三个拟合模型.第一个是一个线性模型.对训练数据 ...

  4. 过拟合/欠拟合&logistic回归等总结(Ng第二课)

    昨天学习完了Ng的第二课,总结如下: 过拟合:欠拟合: 参数学习算法:非参数学习算法 局部加权回归 KD tree 最小二乘 中心极限定律 感知器算法 sigmod函数 梯度下降/梯度上升 二元分类 ...

  5. DL基础补全计划(三)---模型选择、欠拟合、过拟合

    PS:要转载请注明出处,本人版权所有. PS: 这个只是基于<我自己>的理解, 如果和你的原则及想法相冲突,请谅解,勿喷. 前置说明   本文作为本人csdn blog的主站的备份.(Bl ...

  6. Pytorch_第八篇_深度学习 (DeepLearning) 基础 [4]---欠拟合、过拟合与正则化

    深度学习 (DeepLearning) 基础 [4]---欠拟合.过拟合与正则化 Introduce 在上一篇"深度学习 (DeepLearning) 基础 [3]---梯度下降法" ...

  7. 机器学习之路:python 多项式特征生成PolynomialFeatures 欠拟合与过拟合

    分享一下 线性回归中 欠拟合 和 过拟合 是怎么回事~为了解决欠拟合的情 经常要提高线性的次数建立模型拟合曲线, 次数过高会导致过拟合,次数不够会欠拟合.再建立高次函数时候,要利用多项式特征生成器 生 ...

  8. Java 使用 Apache commons-math3 线性拟合、非线性拟合实例(带效果图)

    Java 使用 CommonsMath3 的线性和非线性拟合实例,带效果图 例子查看 GitHub Gitee 运行src/main/java/org/wfw/chart/Main.java 即可查看 ...

  9. 浅谈Logistic回归及过拟合

    判断学习速率是否合适?每步都下降即可.这篇先不整理吧... 这节学习的是逻辑回归(Logistic Regression),也算进入了比较正统的机器学习算法.啥叫正统呢?我概念里面机器学习算法一般是这 ...

随机推荐

  1. java cookie

    public static void AddCookie(HttpServletResponse response, String key, String value) { Cookie cookie ...

  2. 【转载】 硬盘主引导记录(MBR)及其结构详解

    硬盘的0柱面.0磁头.1扇区称为主引导扇区,FDISK程序写到该扇区的内容称为主引导记录(MBR).该记录占用512个字节,它用于硬盘启动时将系统控制权交给用户指定的,并在分区表中登记了的某个操作系统 ...

  3. Shell练习 验证号码

    原文: https://leetcode.com/problems/valid-phone-numbers/ Given a text file file.txt that contains list ...

  4. ByteArrayInputStream与ByteArrayOutputStrean的使用

    String str="sdfasdfasdfa加减法爱的色放就阿克苏地方啊"; InputStream is=new ByteArrayInputStream(str.toStr ...

  5. Ibm-jQuery教程学习笔记

    一.概述 1.虽然 jQuery 本身并非一门新的语言.但是,学习其语法有助于我们熟练.灵活地使用它.回顾下我们熟悉的 CSS 语法,不难发现 jQuery 的语法与 CSS 有相似之处. jQuer ...

  6. WordPress主题制作教程9:文章形式

    wordpress的文章形式: aside -----------------日志:不显示标题的标准文章image --------------图像:单张图像.文章中的首个 <img /> ...

  7. Mysql Workbench 学习

    1.安装 http://dev.mysql.com/downloads/tools/workbench/ 选择合适的,下载(以Ubuntu 为例) cd到下载目录,然后sudo dpkg -i wor ...

  8. git - 简易指南

    http://www.bootcss.com/p/git-guide/ git - 简易指南

  9. gitlab的搭建和linux客户端的连接

    一.安装 1.新建 /etc/yum.repos.d/gitlab-ce.repo,添加以下内容 1 2 3 4 5 6 7 [gitlab-ce] name=gitlab-ce baseurl=ht ...

  10. 下拉刷新控件(3)系统自带的下拉刷新控件SwipeRefreshLayout(推荐*)

    1,简介 The SwipeRefreshLayout should be used whenever the user can refresh the contents of a view via ...