最小二乘法 (转)good
最小二乘法也称为最小平方法,是一种数据优化技术,它通过最小化误差的平方和寻找数据的最佳函数匹配。
最小二乘法最初由高尔顿在创立回归分析的时候提出,现在已经成为探索变量间关系最重要的方法,最小二乘法根据其数学原理命名,即误差平方和最小,在误差平方和最小状态下进行函数参数估计,可认为是参数的最佳估计。
一、问题的提出
我们在研究变量间的关系时,会收集一定量的数据样本,这些数据在二维坐标图上呈现为一个个的数据点,理论上来讲,如果变量间存在确定的已知函数关系,则函数图像(曲线或直线)会经过所有的数据点,而通常我们得到的数据都是样本数据,样本数据存在误差,导致我们根据样本数据计算出的函数和已知函数也存在误差,其函数图像无法经过所有数据点。
误差使得多次试验的样本数据所呈现的函数图像会不同,即使是同一组样本数据,如果没有统一的标准,那么不同的人去描绘所呈现的函数图像也会不同。
而我们就是要找到一条标准,使得从这些存在误差的样本数据中求出一个近似函数,使得它和已知函数最为接近,这个近似函数的图像不一定要经过所有的数据点,但是要尽可能的使所有数据点对称且均匀的分布在其两侧,并且这条线既能反映数据的总体分布,也不至于出现局部的较大波动,通过一个近似函数去拟合已知函数,这样就是曲线拟合问题。
一般来说。曲线拟合的任务有两个:
1.当变量间的函数关系已知,只是其中的常数未知,根据数据点拟合出各常数的最佳估计值。
2.当变量间的函数关系未知,根据数据点拟合出变量间函数关系的经验公式,并求出其中各常数的最佳估计值。
二、问题的解决
前面说过,如果没有一条标准,可以找到无数个近似函数,我们可以按照以下原则进行思考:
1.为了精确而全面的描述变量间的关系,必须使用这组变量的全部观察值(实际上很难做到,一般都使用样本数据)
2.确定变量间的关系是直线还是曲线,要根据协方差或相关系数进行判断
3."最好"的近似函数,应该和已知函数偏差最小,对于函数图像来说,就是所有数据点到这个函数图像(曲线或直线)的垂直距离的和最小。
按照以上原则,我们来进行分析:
设已知函数y=f(x),近似函数为φ(x)
令δi=yi-φ(xi)
δi就是残差,让残差最小,有不同的方法

其中第四种——偏差的平方和最小,就是最小二乘法。
在实际应用中,样本数据并不都是等精度、等地位的,对于精度高、地位重的数据应该给予更大的权重,这时要使用加权最小二乘法。
===============================================================
使用最小二乘法估计出的回归方程具有以下性质:
1.无偏性
可以证明最小二乘法估计出的回归方程中各参数的期望(均值)等于真实方程中的参数值
假设一个线性回归方程的形式如下
使用最小二乘估计出的回归方程为
则有
2.线性
可以证明使用最小二乘法估计出的参数是Y的线性函数
3.最小方差性
对同一个样本,使用不同的方法进行估计,会得到不同的参数,这些参数也可能是无偏的和线性的,但是在这些参数中,可以证明使用最小二乘法估计出的参数方差最小。
以上三个性质也是评价一个参数是否为优良参数的参考标准,由于最小二乘法估计量同时具备这三条性质,因此也称为最小二乘法估计量为最佳线性无偏估计量best linear unbiased estimate,简称BLUE
在高斯经典假设条件下,我们不需要再去寻找其它无偏估计量,没有一个会优于普通最小二乘估计量。也就是说,如果存在一个好的线性无偏估计量,这个估计量的方差最多与普通最小二乘估计量的方差一样小,不会小于普通最小二乘估计量的方差,这个定理称为高斯-马尔科夫定理。正是因为最小二乘法估计量具有BLUE性质,才使得最小二乘法得到广泛应用,但是要注意的是,最小二乘估计量这些优良的性质,依赖于高斯基本假设。
对于一个实际的曲线拟合问题,通常的做法是将观测值在二维坐标平面上画出散点图,观察散点图的分布和哪类曲线图接近,然后选用相应的曲线拟合方程,对于有些非线性拟合曲线可以通过适当的变量替换转化为线性拟合曲线,按照线性拟合进行处理,这样会简便一些,下图列举了一些常见的变换
http://www.cnblogs.com/xmdata-analysis/p/5048446.html
最小二乘法 (转)good的更多相关文章
- SPSS数据分析—两阶段最小二乘法
传统线性模型的假设之一是因变量之间相互独立,并且如果自变量之间不独立,会产生共线性,对于模型的精度也是会有影响的.虽然完全独立的两个变量是不存在的,但是我们在分析中也可以使用一些手段尽量减小这些问题产 ...
- SPSS数据分析—加权最小二乘法
标准的线性回归模型的假设之一是因变量方差齐性,即因变量或残差的方差不随自身预测值或其他自变量的值变化而变化.但是有时候,这种情况会被违反,称为异方差性,比如因变量为储蓄额,自变量为家庭收入,显然高收入 ...
- 曲线拟合的最小二乘法(基于OpenCV实现)
1.原理 在现实中经常遇到这样的问题,一个函数并不是以某个数学表达式的形式给出,而是以一些自变量与因变量的对应表给出,老师讲课的时候举的个例子是犯罪人的身高和留下的脚印长,可以测出一些人的数据然后得到 ...
- Least_squares 最小二乘法
https://en.wikipedia.org/wiki/Least_squares 動差估計法( MM, The Method of Moment ) 最小平方法( LSQ, The Method ...
- python数据分析入门——matplotlib的中文显示问题&最小二乘法
正在学习<用python做科学计算>,在练习最小二乘法时遇到matplotlib无法显示中文的问题.查资料,感觉动态的加上几条语句是最好,这里贴上全部的代码. # -*- coding: ...
- 最小二乘法 java
import java.util.ArrayList; import java.util.Collection; import org.apache.commons.math3.optim.Point ...
- 最小二乘法(least squares method)
一.背景 号到北大去听hulu的讲座<推荐系统和计算广告在视频行业应用>,想到能见到传说中的项亮大神,特地拿了本<推荐系统实践>求签名.讲座开始,主讲人先问了下哪些同学有机器学 ...
- 一元线性回归模型与最小二乘法及其C++实现
原文:http://blog.csdn.net/qll125596718/article/details/8248249 监督学习中,如果预测的变量是离散的,我们称其为分类(如决策树,支持向量机等), ...
- 《Linear Algebra and Its Applications》-chaper6-正交性和最小二乘法-基本概念与定理
这一章节我们主要讨论定义在R^n空间上的向量之间的关系,而这个关系概括来讲其实就是正交,然后引入正交投影.最佳逼近定理等,这些概念将为我们在求无解的线性方程组Ax=b的最优近似解打下基石. 正交性: ...
- (转)最小二乘法拟合圆公式推导及vc实现[r]
(下文内容为转载,不过已经不清楚原创的是哪里了,特此说明) 转自: http://www.cnblogs.com/dotLive/archive/2006/10/09/524633.html 该网址下 ...
随机推荐
- Android bluetooth介绍(四): a2dp connect流程分析
关键词:蓝牙blueZ A2DP.SINK.sink_connect.sink_disconnect.sink_suspend.sink_resume.sink_is_connected.sink_ ...
- Http协议学习总结(转)
因为项目中很多地方都与Http协议有关,零散的了解了一下Http协议,但是没有系统的学习过. 今天根据网上其他同学的整理,加上我的一些经验,我也整理了一份.当做学习记录吧. 一.什么是HTTP协议 H ...
- CCLuaObjcBridge调Objective-C方法传索引数组报invalid key to 'next'错调试
CCLuaObjcBridge是cocos2d-x系列引擎与Objective-C进行交互的"桥梁",老廖的quick-cocos2d-x在其framework进行了简单了封装,封 ...
- Winform通用模块之流水号生成
打算接下来的时间里把自己觉得用起来还比较好用的通用模块,在这里向大家介绍一下,如果你有更好的想法时,也希望你不吝指点. 1.数据库表及存储过程 在介绍这个通用流水号生成的模块前,我们先来看一下其相关的 ...
- html+css实现登录界面
<!DOCTYPE html> <style type="text/css"> body{ background-color: #555555; } #ti ...
- Radmin远程控制软件
Radmin远程控制软件 日期:2015-08-20 作者:lujl Radmin是一款快速的远程控制软件,可以用来远程管理公司或个人计算机来实现远程办公.你可以通过鼠标和键盘来控制远程的 ...
- ORACLE函数之日期时间运算函数
1 ADD_MONTHS 格式:ADD_MONTHS(D,N) 说明:返回日期时间D加N月后相应的日期时间.N为正时则表示D之后:N为负时则表示为D之前.N为小数则会自己主动先删 ...
- uvaLive5713 次小生成树
uvaLive5713 修建道路使得n个点任意两点之间都可以连通,每个点有都有一定的人口,现在可以免费修一条道路, A是免费修的道路两端结点的人口之和, B的其它不是免费修道路的长度的总和 要求的是A ...
- 整理QTP知识之1
以下说明由网络其他文章整合而成. 一.关于QTP的说明 QTP是目前市场上占有率最高的一款自动化测试工具,也是每一位测试工作者最想掌握的工具之一,也是目前流行的基于GUI的功能自动化测试工具之一. Q ...
- 很多人都在埋怨没有遇到好的团队,但好的团队不可能凭空出现,一流的团队不能仅靠团队成员努力,作为Leader,要有可行的规划,并坚定地执行、时势地调整(转)
<西游记>中的唐僧团队历经千难万险,终于求得真经,目标明确.分工合理为这支队伍最终走向成功奠定了基础.唐僧从一开始,就为这个团队设定了西天取经的目标,虽然经历各种挫折与磨难,但目标从未动摇 ...