线性回归

由样本资料计算的回归系数b和其他统计量一样,存在抽样误差,因此,需要对线性回归方程进行假设检验

1、方差分析

2、t检验

相关系数的假设检验

相关系数(correlation coefficient)又称Pearson积差相关系数(coefficient of product moment correlation),是说明具有直线相关关系的两个数值变量间相关的密切程度和相关方向的统计量

由于r是样本统计量,需进行假设检验,即要判断两个变最X与Y是否真的存在相关关系,为此需根据r值作总体相关系数ρ是否为零的假设检验

多元回归

多元线性回归是研究一个应变量与多个自变量之间线性依存关系的统计方法,可以对自变量的作用进行评价,也可以用作预测和判别。

与直线回归的情形相同,对所建立的多元回归方程进行假设检验,以判断它是否具有统计学意义。多元线性回归方程的假设检验分为模型检验和单个回归系数检验。

模型检验结果可用来判断回归方程是否具有统计学意义。

偏回归系数检验。回归方程具有统计学意义,只能说明整体的情况,并不能保证每个自变量都具有统计学意义。因此,需要对每个自变量的回归系数进行假设检验,具体有F检验和t检验两种方法,两种检验方法的结果相同。

需要注意,因为自变量之间可能存在一定的相关性,当从原方程剔除一个变量时,其他一 些变量的回归系数可能受到影响。 另外,有时需要比较各自变量的相对贡献大小,由于回归系数受变量度量衡的影响,不能直接比较。 为此,可以对回归系数进行标准化处理,消除度量衡的影响。计算标准化回归系数(standardized regression coefficient)反映各自变量对应变量的影响程度。

复相关系数和决定系数

复相关系数表示回归方程中的全部自变量X与应变量Y的相关密切程度。和简单相关系数不同的是,复相关系数(multiple correlation coefficient)取值总为正值,简记为R(0≤R≤1)

复相关系数的平方称为决定系数(coefficient of determination), 记为R2 ,反映线性回归方程能在多大程度上解释应变量Y的变异性

决定系数R2 反映了回归方程与数据的拟合程度,其值越接近1,说明回归方程的拟合程度越好;反之,其值越接近0,说明回归方程的拟合程度越差

多元逐步回归

多元线性回归分析中,当自变量较多时,可能并不是所有自变量都对应变量有显著影响,同时有些自变量之间可能相关,存在信息重叠和共线的问题。通常情况下,更希望将有统计学意义的自变量引人回归方程,以使方程更为简单,容易解释。更重要的是,把不显著的自变量排除后可以使回归方程的残差均方减小,有利于揭示其他自变量的作用。为此可以采用三种自变量筛选方法,即向前选择法(forward selection)、向后选择法(backward elimination)和逐步选择法(stepwise selection)

1、向前选择法。方程由一个自变量开始,每次引入一个偏回归平方和最大、且具有统计学意义的自变量,由少到多,直到不具有统计意义的因素可以引入为止。这种方法的主要问题是,先进入方程的变量有可能受到后进入方程变量的影响变得不显著。

2、向后选择法。先建立一个包含所有自变量的回归方程,然后每次剔除一个偏回归平方和最小、且无统计学意义的自变量,直到不能剔除时为止。这种方法在样本量比较大(如n>100),或者自变量不是很多的悄况下(如m<10)效果较好。

3、逐步选择法。在前述两种方法的基础上进行双向筛选的一种方法。即向前引入每一个新自变量之后都要重新对先前已选入的自变量进行检查,以评价其有无继续保留在方程中的价值。为此需要“引入”和“剔除”交替进行,直到无统计学意义的新变量可以引入也无自变量可以剔除时为止。

上述筛选自变量三种方法,可以计算偏回归平方和的F统计量,进行检验和筛选。有时也采用校正决定系数(adjusted R-square)作为判断标准,选择校正决定系数大者为“最优” 方程。

在进行逐步回归前,首先应确定检验每个自变量是否有统计学意义的F检验水平,以此作为引入或剔除变量的标准。F检验水平可以根据具体情况而定。一般而言,若使最终的回归方程中包含较多的自变量,F水平可以适当放宽些,但也不能取得太低,否则会失去筛选自变量的意义。一般可将F值定在α为0.05、0.10或0.20水平上,同时要求α选入≤α剔除

SAS学习笔记23 线性回归、多元回归的更多相关文章

  1. Ext.Net学习笔记23:Ext.Net TabPanel用法详解

    Ext.Net学习笔记23:Ext.Net TabPanel用法详解 上面的图片中给出了TabPanel的一个效果图,我们来看一下代码: <ext:TabPanel runat="se ...

  2. SAS学习笔记之《SAS编程与数据挖掘商业案例》(5)SAS宏语言、SQL过程

    SAS学习笔记之<SAS编程与数据挖掘商业案例>(5)SAS宏语言.SQL过程 1. 一个SAS程序可能包含一个或几个语言成分: DATA步或PROC步 全程语句 SAS组件语言(SCL) ...

  3. SAS学习笔记之《SAS编程与数据挖掘商业案例》(4)DATA步循环与控制、常用全程语句、输出控制

    SAS学习笔记之<SAS编程与数据挖掘商业案例>(4)DATA步循环与控制.常用全程语句.输出控制 1. 各种循环与控制 DO组 创建一个执行语句块 DO循环 根据下标变量重复执行DO和E ...

  4. SAS学习笔记之《SAS编程与数据挖掘商业案例》(3)变量操作、观测值操作、SAS数据集管理

    SAS学习笔记之<SAS编程与数据挖掘商业案例>(3)变量操作.观测值操作.SAS数据集管理 1. SAS变量操作的常用语句 ASSIGNMENT 创建或修改变量 SUM 累加变量或表达式 ...

  5. SAS学习笔记之《SAS编程与数据挖掘商业案例》(2)数据获取与数据集操作

    SAS学习笔记之<SAS编程与数据挖掘商业案例>(2)数据获取与数据集操作 1. SET/SET效率高,建立的主表和建表索引的查询表一般不排序, 2. BY语句,DATA步中,BY语句规定 ...

  6. SAS学习笔记之《SAS编程与数据挖掘商业案例》(1)系统简介和编程基础

    SAS学习笔记之<SAS编程与数据挖掘商业案例>(1)系统简介和编程基础 1. SAS系统简介 1.1 SAS是先编译后执行的语言,data步标志着编译的开始. 数据指针:当前内存缓存区, ...

  7. CNN学习笔记:线性回归

    CNN学习笔记:Logistic回归 线性回归 二分类问题 Logistic回归是一个用于二分分类的算法,比如我们有一张图片,判断其是否为一张猫图,为猫输出1,否则输出0. 基本术语 进行机器学习,首 ...

  8. [原创]java WEB学习笔记23:MVC案例完整实践(part 4)---模糊查询的设计与实现

    本博客为原创:综合 尚硅谷(http://www.atguigu.com)的系统教程(深表感谢)和 网络上的现有资源(博客,文档,图书等),资源的出处我会标明 本博客的目的:①总结自己的学习过程,相当 ...

  9. SAS学习笔记<一>

    三个周末的SAS课程宣告结束, 总结下来 第一周的统计原理简介 第二周/第三周讲解SAS的基本操作. 总体下来,对自己的知识结构有了一个新的梳理,对比大学时期,某个老师一上来就教我们SAS编程,而未考 ...

随机推荐

  1. OpenFOAM中的基本变量快速认知【转载】

    转载自:http://blog.sina.com.cn/s/blog_a0b4201d0102vsf9.html label 实际上就是整型数据的变体,int,OF对它进行了包装,以适应32或64位系 ...

  2. C#读写西门子PLC数据

    C#读写西门子PLC数据,包含S7协议和Fetch/Write协议,s7支持200smart,300PLC,1200PLC,1500PLC 本文将使用一个gitHub开源的组件技术来读写西门子plc数 ...

  3. 监控、日志、APM整个监控体系思考 我为峰2014 简书作者 4.6092018-11-19 11:39打开App 序言

    监控.日志.APM整个监控体系思考 我为峰2014 简书作者 4.6092018-11-19 11:39打开App 序言

  4. React拾遗(上)

    JSX代表Objects Babel转义器会把JSX转换成一个名为React.createElement()的方法调用. 下面两种代码的作用是完全相同的: const element = ( < ...

  5. MySQL查询获取行号rownum

    MySQL中可以使用变量产生行号,下面是2个简单例子: 使用工具:MySQL Workbench 说明:表heyf_10中字段,empid(员工工号).deptid(部门编号).salary(薪资): ...

  6. Docs-.NET-C#-指南-语言参考-预处理器指令:#define(C# 参考)

    ylbtech-Docs-.NET-C#-指南-语言参考-预处理器指令:#define(C# 参考) 1.返回顶部 1. #define(C# 参考) 2018/06/30 使用 #define 来定 ...

  7. OGG-01332 ogg高版本向低版本传输

    Neo君遇到的ogg版本问题,在ggserr.log中的错误信息如下: 2018-10-12 09:55:10 ERROR OGG-01332 Oracle GoldenGate Delivery, ...

  8. hue集成mysql找不到 libmysqlclient.so.16问题解决

    首先我的配置文件如下,这个是没有问题的 但是在重启hue连接mysql时,却发生了如下问题: 这个错误的意思就是没有找到libmysqlclient_r.so.16这个文件,可能是我安装的mysql有 ...

  9. 一百四十一:CMS系统之根据板块过滤显示帖子

    视图,根据传过来的板块id查数据 @bp.route('/')def index(): board_id = request.args.get('board_id', type=int, defaul ...

  10. 123457123457#0#-----com.yuming.ZuiNiuChengYu--前拼后广--最牛成语

    com.yuming.ZuiNiuChengYu--前拼后广--最牛成语