SAS学习笔记23 线性回归、多元回归
线性回归
由样本资料计算的回归系数b和其他统计量一样,存在抽样误差,因此,需要对线性回归方程进行假设检验
1、方差分析
2、t检验
相关系数的假设检验
相关系数(correlation coefficient)又称Pearson积差相关系数(coefficient of product moment correlation),是说明具有直线相关关系的两个数值变量间相关的密切程度和相关方向的统计量
由于r是样本统计量,需进行假设检验,即要判断两个变最X与Y是否真的存在相关关系,为此需根据r值作总体相关系数ρ是否为零的假设检验



多元回归
多元线性回归是研究一个应变量与多个自变量之间线性依存关系的统计方法,可以对自变量的作用进行评价,也可以用作预测和判别。
与直线回归的情形相同,对所建立的多元回归方程进行假设检验,以判断它是否具有统计学意义。多元线性回归方程的假设检验分为模型检验和单个回归系数检验。
模型检验结果可用来判断回归方程是否具有统计学意义。
偏回归系数检验。回归方程具有统计学意义,只能说明整体的情况,并不能保证每个自变量都具有统计学意义。因此,需要对每个自变量的回归系数进行假设检验,具体有F检验和t检验两种方法,两种检验方法的结果相同。


需要注意,因为自变量之间可能存在一定的相关性,当从原方程剔除一个变量时,其他一 些变量的回归系数可能受到影响。 另外,有时需要比较各自变量的相对贡献大小,由于回归系数受变量度量衡的影响,不能直接比较。 为此,可以对回归系数进行标准化处理,消除度量衡的影响。计算标准化回归系数(standardized regression coefficient)反映各自变量对应变量的影响程度。
复相关系数和决定系数
复相关系数表示回归方程中的全部自变量X与应变量Y的相关密切程度。和简单相关系数不同的是,复相关系数(multiple correlation coefficient)取值总为正值,简记为R(0≤R≤1)
复相关系数的平方称为决定系数(coefficient of determination), 记为R2 ,反映线性回归方程能在多大程度上解释应变量Y的变异性
决定系数R2 反映了回归方程与数据的拟合程度,其值越接近1,说明回归方程的拟合程度越好;反之,其值越接近0,说明回归方程的拟合程度越差
多元逐步回归
多元线性回归分析中,当自变量较多时,可能并不是所有自变量都对应变量有显著影响,同时有些自变量之间可能相关,存在信息重叠和共线的问题。通常情况下,更希望将有统计学意义的自变量引人回归方程,以使方程更为简单,容易解释。更重要的是,把不显著的自变量排除后可以使回归方程的残差均方减小,有利于揭示其他自变量的作用。为此可以采用三种自变量筛选方法,即向前选择法(forward selection)、向后选择法(backward elimination)和逐步选择法(stepwise selection)
1、向前选择法。方程由一个自变量开始,每次引入一个偏回归平方和最大、且具有统计学意义的自变量,由少到多,直到不具有统计意义的因素可以引入为止。这种方法的主要问题是,先进入方程的变量有可能受到后进入方程变量的影响变得不显著。
2、向后选择法。先建立一个包含所有自变量的回归方程,然后每次剔除一个偏回归平方和最小、且无统计学意义的自变量,直到不能剔除时为止。这种方法在样本量比较大(如n>100),或者自变量不是很多的悄况下(如m<10)效果较好。
3、逐步选择法。在前述两种方法的基础上进行双向筛选的一种方法。即向前引入每一个新自变量之后都要重新对先前已选入的自变量进行检查,以评价其有无继续保留在方程中的价值。为此需要“引入”和“剔除”交替进行,直到无统计学意义的新变量可以引入也无自变量可以剔除时为止。
上述筛选自变量三种方法,可以计算偏回归平方和的F统计量,进行检验和筛选。有时也采用校正决定系数(adjusted R-square)作为判断标准,选择校正决定系数大者为“最优” 方程。
在进行逐步回归前,首先应确定检验每个自变量是否有统计学意义的F检验水平,以此作为引入或剔除变量的标准。F检验水平可以根据具体情况而定。一般而言,若使最终的回归方程中包含较多的自变量,F水平可以适当放宽些,但也不能取得太低,否则会失去筛选自变量的意义。一般可将F值定在α为0.05、0.10或0.20水平上,同时要求α选入≤α剔除
SAS学习笔记23 线性回归、多元回归的更多相关文章
- Ext.Net学习笔记23:Ext.Net TabPanel用法详解
Ext.Net学习笔记23:Ext.Net TabPanel用法详解 上面的图片中给出了TabPanel的一个效果图,我们来看一下代码: <ext:TabPanel runat="se ...
- SAS学习笔记之《SAS编程与数据挖掘商业案例》(5)SAS宏语言、SQL过程
SAS学习笔记之<SAS编程与数据挖掘商业案例>(5)SAS宏语言.SQL过程 1. 一个SAS程序可能包含一个或几个语言成分: DATA步或PROC步 全程语句 SAS组件语言(SCL) ...
- SAS学习笔记之《SAS编程与数据挖掘商业案例》(4)DATA步循环与控制、常用全程语句、输出控制
SAS学习笔记之<SAS编程与数据挖掘商业案例>(4)DATA步循环与控制.常用全程语句.输出控制 1. 各种循环与控制 DO组 创建一个执行语句块 DO循环 根据下标变量重复执行DO和E ...
- SAS学习笔记之《SAS编程与数据挖掘商业案例》(3)变量操作、观测值操作、SAS数据集管理
SAS学习笔记之<SAS编程与数据挖掘商业案例>(3)变量操作.观测值操作.SAS数据集管理 1. SAS变量操作的常用语句 ASSIGNMENT 创建或修改变量 SUM 累加变量或表达式 ...
- SAS学习笔记之《SAS编程与数据挖掘商业案例》(2)数据获取与数据集操作
SAS学习笔记之<SAS编程与数据挖掘商业案例>(2)数据获取与数据集操作 1. SET/SET效率高,建立的主表和建表索引的查询表一般不排序, 2. BY语句,DATA步中,BY语句规定 ...
- SAS学习笔记之《SAS编程与数据挖掘商业案例》(1)系统简介和编程基础
SAS学习笔记之<SAS编程与数据挖掘商业案例>(1)系统简介和编程基础 1. SAS系统简介 1.1 SAS是先编译后执行的语言,data步标志着编译的开始. 数据指针:当前内存缓存区, ...
- CNN学习笔记:线性回归
CNN学习笔记:Logistic回归 线性回归 二分类问题 Logistic回归是一个用于二分分类的算法,比如我们有一张图片,判断其是否为一张猫图,为猫输出1,否则输出0. 基本术语 进行机器学习,首 ...
- [原创]java WEB学习笔记23:MVC案例完整实践(part 4)---模糊查询的设计与实现
本博客为原创:综合 尚硅谷(http://www.atguigu.com)的系统教程(深表感谢)和 网络上的现有资源(博客,文档,图书等),资源的出处我会标明 本博客的目的:①总结自己的学习过程,相当 ...
- SAS学习笔记<一>
三个周末的SAS课程宣告结束, 总结下来 第一周的统计原理简介 第二周/第三周讲解SAS的基本操作. 总体下来,对自己的知识结构有了一个新的梳理,对比大学时期,某个老师一上来就教我们SAS编程,而未考 ...
随机推荐
- BitmapFactory: inSampleSize 的一些思考
一. BitmapFactory.Options 中inSampleSize的取值问题 关于inSampleSize的取值问题Google已经给出了一个推荐的算法:(https://developer ...
- 机器学习 - 算法 - 聚类算法 K-MEANS / DBSCAN算法
聚类算法 概述 无监督问题 手中无标签 聚类 将相似的东西分到一组 难点 如何 评估, 如何 调参 基本概念 要得到的簇的个数 - 需要指定 K 值 质心 - 均值, 即向量各维度取平均 距离的度量 ...
- 复制粘贴引发的鸠占鹊巢——IDEA复制项目导致sources root复用了另一个项目
复制粘贴大法一向是程序猿的利器,但有时也会引发一些拎不清的麻烦关系来.比如我们现在想新建一个项目,为了快速而对原来的uis-gateway动用了复制粘贴大法,然后改改项目名就成了uis-applica ...
- mysql通过binlog恢复删除数据
删除误操作有时会意外出现,如果你有备份表数据的好习惯,那么至少你可以追回备份前的那些数据.如果我们打开了mysql的binlog,那么可以通过它的增量操作日志来恢复数据.怎么打开binlog前篇已有说 ...
- Cisco设备自动定时备份配置
前言 当我们管理的网络设备为个位数的时候,手动的把配置通过tftp方式copy出来还是可以的.但是当我们管理几十台甚至上百台(有点夸张,都这个级别了肯定用专业的运维软件或者开发运维平台进行管理)的时候 ...
- IDEA中提示Error:java: Compilation failed: internal java compiler error
解决办法:File-->Setting...-->Build,Execution,Deployment-->Compiler-->Java Compiler 设置相应Modul ...
- spring-core-5.0.6.RELEASE-sources.jar中java源代码不全
笔者最近在调试一段代码,进入spring-core以后,IDEA帮我反编译出源码,其中MethodProxy.java如下 // // Source code recreated from a .cl ...
- (二)第一个Servlet
一.预备知识 一.Servlet简介 Servlet是sun公司提供的一门用于开发动态web资源的技术. Sun公司在其API中提供了一个servlet接口,用户若想用发一个动态web资源(即开发一个 ...
- 树形DP入门学习
这里是学习韦神的6道入门树形dp进行入门,本来应放在day12&&13里,但感觉这个应该单独放出来好点. 这里大部分题目都是参考的韦神的思想. A - Anniversary part ...
- 设置Android模拟器的窗口大小
Android SDK 中两个位置可以设置Android模拟器的窗口大小 1.设置Android模拟器的分辨率 Android Virtual Device Manager中创建AVD时,窗口中部Re ...