Stanford大学机器学习公开课（三）：局部加权回归、最小二乘的概率解释、逻辑回归、感知器算法

（一）局部加权回归

通常情况下的线性拟合不能很好地预测所有的值，因为它容易导致欠拟合（under
fitting）。如下图的左图。而多项式拟合能拟合所有数据，但是在预测新样本的时候又会变得很糟糕，因为它导致数据的

过拟合（overfitting），不符合数据真实的模型。如下图的右图。

下面来讲一种非参数学习方法——局部加权回归（LWR）。为什么局部加权回归叫做非参数学习方法呢？首先，参数学习方法是这样一种方法：在训练完成所有数据后得到一系列训练参数，然后根据训练参数来预测新样本的值，这时不再依赖之前的训练数据，参数是确定的。而非参数学习方法是这样一种算法：在预测新样本值的时候，每次都会重新训练数据得到新的参数值，亦即说每次预测样本都会依赖训练数据集合，所以每次得到的参数是不确定的。

局部加权回归算法是对线性回归的扩展，当目标假设是线性模型时，使用线性回归自然能拟合得很好，但如果目标假设不是线性模型，比如一个忽上忽下的函数，这时用线性模型就拟合得很差。为了解决这个问题，当当我们在预测一个点的值时，我们选择和这个店相近的点而不是全部得点做线性回归。基于这个思想，就有了局部加权回归算法。之前普通的线性拟合中，我们得到了最小二乘的损失函数为

找到合适的参数θ使得上述损失函数最小即可。而在局部加权回归中，损失函数变为
其中，是权值，它的作用在于根据要预测的点与数据集中的点的距离来为数据集中的点赋权值，当某点距离待预测点较远时，其权重较小，否则较大。一个较好的函数如下

其性质为：

（1）如果

，则

（2）如果，则。

其中，τ被称为波长参数，用于控制权值随距离下降的速率。该函数比较像但不是高斯函数或正太分布。这个算法的问题在于，对于每一个要查询的点，都要重新依据整个数据集计算一个线性回归模型出来，这样使得计算代价极高。

（二）最小二乘法的概率解释

接下来，对线性回归中的最小二乘法的合理性做了概率解释，即为什么选择平方函数作为目标函数会使得效果比较好？

假设一：对于每一个样例(x(i),y(i)),特征值x和目标值y的关系可以表示成：

其中，ε(i)
表示线性模型与目标值的误差。

假设二：ε(i)
服从正态分布：

假设一只是一种表示方法，成立很合理。那么假设二为何会成立呢？这是因为影响误差的因素有很多，这些因素都是随机分布，根据中心极限定理（Central
Limit Thoery），即许多独立随机变量的和趋向于正态分布，我们可以得到假设二。

有了假设二之后，我们可以得到：

这也表示，当给定参数θ和x时，目标值y也服从正态分布：
注意到x(i)与θ间的分号，它表示的是θ是已知变量而非随机变量；整个P式表示给定以θ为参数的概率。

假设三：对于各个样例的误差ε(i) ，它们是IID（独立同分布，Independent
Identical Distribution）随机变量。

这样，我们就可以得到似然函数：

其中，Y是一个长度为样例数的向量，X是样例数*特征数的矩阵。

似然函数的意义是什么？似然函数表示的是在参数θ下，数据集出现的概率。似然函数与概率的概念其实相似，不同之处在于似然函数把θ作为变量，找到使得数据集出现的概率最大时的参数，就称为极大似然估计。

对上式取log对数，即对一个乘积取对数等于对每项取对数之后再求和。可得下式：

所以，最大化

等同于最小化

所以，之前讲的一般的最小二乘法实际上是在假设误差项满足高斯分布且独立同分布的情况下，使似然性最大化。

（三）逻辑回归

对于目标值是连续变量的问题来说，使用线性回归可能会解决得很好，即便其问题不是线性模型所能解决的，也可以用局部加权回归解决。但对于目标值是离散变量的分类问题来说，应用线性模型会有一定的困难。当然，有些这类问题也可以应用线性模型，但线性模型绝不是一种通用的解决这类问题的方法。

对于目标值是离散变量的二分类问题，假设目标值为{0,1}，所以先改变模型使其预测值在[0,1]之间，我们选择这样一个函数：

其中，函数g被称为logistic函数或sigmoid函数。

有了这个函数，对于一个样例，我们就可以得到它分类的概率值：

将两式组合起来，得到公式如下：这样，我们得到了函数h在整个数据集上的似然函数为：
同样的，为了计算方便，对似然函数取对数：因为要求最大似然函数，可应用梯度上升算法，所以有如下更新规则：求上式的导数时，根据上节课的做法，先假设有一个样例，这样，导数的解法如下：

考虑到多个样例，所以更新规则为：
上式与上节课中最小二乘的形式一样，但是实际上含义是不一样的，因为函数h不一样。但这并不是巧合，这几乎是一种通用的规则，你可以选择不同的假设，但如果使用梯度下降（上升）算法的话，更新规则都是如上式的形式的。

（四）感知器算法

感知器算法强迫函数输出为{0,1}离散值而不是概率。其假设为

在这个假设的基础上，我们使用与

形式相同的规则，就得到了感知器算法。感知器算法是人工神经网络的基础，在后面的理论学习中，将把它作为分析的起点。

Stanford大学机器学习公开课（三）：局部加权回归、最小二乘的概率解释、逻辑回归、感知器算法的更多相关文章

Stanford大学机器学习公开课（六）：朴素贝叶斯多项式模型、神经网络、SVM初步
(一)朴素贝叶斯多项式事件模型在上篇笔记中,那个最基本的NB模型被称为多元伯努利事件模型(Multivariate Bernoulli Event Model,以下简称 NB-MBEM).该模型有多 ...
Stanford大学机器学习公开课（五）：生成学习算法、高斯判别、朴素贝叶斯
(一)生成学习算法在线性回归和Logistic回归这种类型的学习算法中我们探讨的模型都是p(y|x;θ),即给定x的情况探讨y的条件概率分布.如二分类问题,不管是感知器算法还是逻辑回归算法,都是在解 ...
Stanford大学机器学习公开课（四）：牛顿法、指数分布族、广义线性模型
(一)牛顿法解最大似然估计牛顿方法(Newton's Method)与梯度下降(Gradient Descent)方法的功能一样,都是对解空间进行搜索的方法.其基本思想如下: 对于一个函数f(x), ...
Stanford大学机器学习公开课（二）：监督学习应用与梯度下降
本课内容: 1.线性回归 2.梯度下降 3.正规方程组监督学习:告诉算法每个样本的正确答案,学习后的算法对新的输入也能输入正确的答案 1.线性回归问题引入:假设有一房屋销售的数据如下: 引 ...
LR 算法总结--斯坦福大学机器学习公开课学习笔记
在有监督学习里面有几个逻辑上的重要组成部件[3],初略地分可以分为:模型,参数和目标函数.(此部分转自 XGBoost 与 Boosted Tree) 一.模型和参数模型指给定输入xi如何去 ...
[置顶] 局部加权回归、最小二乘的概率解释、逻辑斯蒂回归、感知器算法——斯坦福ML公开课笔记3
转载请注明:http://blog.csdn.net/xinzhangyanxiang/article/details/9113681 最近在看Ng的机器学习公开课,Ng的讲法循循善诱,感觉提高了不少 ...
第三集欠拟合与过拟合的概念、局部加权回归、logistic回归、感知器算法
课程大纲欠拟合的概念(非正式):数据中某些非常明显的模式没有成功的被拟合出来.如图所示,更适合这组数据的应该是而不是一条直线. 过拟合的概念(非正式):算法拟合出的结果仅仅反映了所给的特定数据的特质 ...
局部加权回归、欠拟合、过拟合 - Andrew Ng机器学习公开课笔记1.3
本文主要解说局部加权(线性)回归.在解说局部加权线性回归之前,先解说两个概念:欠拟合.过拟合.由此引出局部加权线性回归算法. 欠拟合.过拟合例如以下图中三个拟合模型.第一个是一个线性模型.对训练数据 ...
Andrew Ng机器学习公开课笔记 -- 线性回归和梯度下降
网易公开课,监督学习应用.梯度下降 notes,http://cs229.stanford.edu/notes/cs229-notes1.pdf 线性回归(Linear Regression) 先看个 ...

随机推荐

.NET异步编程之回调
C#中异步和多线程的区别是什么呢?异步和多线程两者都可以达到避免调用线程阻塞的目的,从而提高软件的可响应性.甚至有些时候我们就认为异步和多线程是等同的概念.但是,异步和多线程还是有一些区别的.而这些区 ...
用CSS画个三角形
<!DOCTYPE html> <html> <head> <style type="text/css"> #trangle { d ...
Java多线程基础知识（二）
一. Java线程具有6种状态 NEW 初始状态,线程被创建,但是还没有调用start方法. RUNNABLE 运行状态,java线程将操作系统中的就绪和运行两种状态笼统的称作进行中. BLOCKE ...
python del 注意点
>>> del a[:] >>> a [] del也可以用于删除整个变量: >>> >>> del a 之后再引用名称 a 将会 ...
mysql 之基本操作
已经在板子内部把所有的环境都搭好了,现在的要求是对Mysql 进行一些基本的操作. 在这之前,记录几个要点以防以后忘记. 一,准备工作. 1. 将usr/share/mysql 目录下的 my-lag ...
Python中sorted()方法
Python中sorted()方法的用法 1.先说一下iterable,中文意思是迭代器. Python的帮助文档中对iterable的解释是:iteralbe指的是能够一次返回它的一个成员的对象.i ...
svn下目录说明
Branch 目录 : 该SVN 的Branch目录下存放的是:跟工程项目相关的各个工程版本分支.该目录下面的版本分支可能会被修改合并.不是稳定的版本. Document 目录:该SVN 的Docum ...
tornado RequestHandler request.body & request.arguments
request.body , 请求的原始内容,post方式放在body中的. request.arguments, body参数和url参数的统一体, 同时也是经过“加工”,解码的. eg.在对接其他 ...
Android SDK 在线更新镜像服务器
大连东软信息学院镜像服务器地址:- http://mirrors.neusoft.edu.cn 端口:80 北京化工大学镜像服务器地址:- IPv4: http://ubuntu.buct.edu.c ...
MVC Create
本文介绍如何在MVC里往数据库中插入新的记录. 这里用到的数据表如下: Employees Step 1: 在Control文件里加入method public ActionResult Create ...

Stanford大学机器学习公开课（三）：局部加权回归、最小二乘的概率解释、逻辑回归、感知器算法

Stanford大学机器学习公开课（三）：局部加权回归、最小二乘的概率解释、逻辑回归、感知器算法的更多相关文章

随机推荐

热门专题