开贴举例说明相关系数复相关系数半偏相关系数之间的联系。

比如,我们要预测学生在高中的表现(学生成绩),一种方法是测量学习速度和难易程度的能力测验来衡量学生的学习能力。那么,假设一个学生已经做了这样的测验,在这个样本中学习能力(X1)与学习成绩(Y)的相关系数r1=.4,这就表明能力可以解释学习成绩方差的.42=.16,即16%。不过,还有84%的方差尚未得到解释(参考:已解释和未解释的方差)。

与大多数的学生表现一致,能力并不是唯一重要的因素。努力程度或学习动机等也可能很有效预测实际表现。假设我们可以准确的调查学生在同一学期的学习时间(单位:h)。在这个例子中,学习时间(X2)和学习成绩的相关系数r2=.3。尽管这不如学习能力的相关程度高,但学习时间仍然可以解释.32=.09(9%)的学习成绩方差。但是这9%的方差和被学习能力解释的16%的方差是否不同呢?我们是不是能够简单地把两个百分数加起来,然后说能力和学习时间总共解释了9%+16%=25%的学习成绩方差呢?如果学习能力和时间的相关为0,那么我们就可以这样下结论。

如图 1fig1.cdr所示,如果学习成绩的总方差以一个长方形表示,那么学习能力和学习时间可用长方形内两个独立的圆圈表示。圆圈的面积就对应于每个预测变量能解释的方差百分比。在这样的图中,图形重叠表示变量相关,而不重叠表示变量不相关。我们称这样的图为韦恩图(Venn Diagram)。在图 1的韦恩图中,两个圆圈没有重叠,说明他们代表的预测变量是相互独立的(两者的相关系数为0)。两个圆圈加起来就表示两个预测变量加在一起可以解释因变量(效标变量)的方差比例。如果我们用R2表示被解释的总方差,我们就可以看出,在这个例子中,R2=r12+r22=.42+.32=.25。与r2称为决定系数一致,R2称为复决定系数(Coefficient of multiple determination)。

图 1

如果不平方,则R称为复相关系数(Multiple Correlation Coefficient),它是(基于两个及其以上预测变量)对因变量(效标变量、被解释变量)做的预测值和因变量的实际值之间的相关。在本例中,R=.5,比简单把两个相关系数加起来要小,但比他们其中任何一个都大(只要当两个为正且相互独立的r合并,都会有这种情况)。

不过,你很快就会发现,在真实世界里,就连只有两个预测变量的情况,预测变量之间的相关系数r也往往并不等于0,换句话说,预测变量之间也不是完全独立的,而是相互作用的。还是回到上文的例子中,假设高学习能力的学生稍微倾向于花更多的学习时间,因此学习能力与学习时间的相关系数r12=.2。此时,两个预测变量之间的相关在韦恩图中就被表示为两个圆圈之间的重叠部分,如图 2fig2.cdr所示。一个预测变量所解释方差的一部分仍可以被另一个预测变量来解释(请注意,为了强调其中有趣的关系,图 2中的各个面积并没有按相应的比例成图)。

图 2

在图 2中,复决定系数R2是两个圆圈所覆盖的面积。由于两个圆圈有重叠,因此R2比我们上次那样简单地把两个圆圈加起来的要小。如果仍然简单相加,重叠部分就被重复计算了。所以,R2实际上是A、B和C面积之和,因此R2=.21。

那么,问题又来了。学习能力(X1)可以解释学习成绩的方差比例为16%,其中有4%又可以被学习时间(X2)所解释,那么剩余的12%就是学习能力“唯一”可以解释的方差比重,我们对A面积开平方得到(sqrt(.12)=).3464,这就是学习能力(X1)与学习成绩(Y)的半偏相关系数。这个半偏相关系数告诉我们学习时间(X2)保持不变时,学习能力(X1)与学习成绩(Y)之间关系的强度。同样地,B面积开平方得到学习时间与学习成绩的半偏相关系数(sqrt(.05)=)0.2236,或者R2减去学习能力相关系数的平方r12再开方。

互补现象

还是上文这个例子,假设聪明学生都不怎么爱学习,r12就为负数。这群学生中,聪明学生比较懒,而不聪明学生却很努力弥补能力上的不足,r12=-.2(在韦恩图中没办法表示这种负相关)。但是,这种负的重叠会增加R2,使得R2r12+r22要大,用下式直接计算R2

式中:在符号ry(1.2)中,圆点之后的数字表示被排除在外的变量,括号表示这种排除只局限于在括号内的变量。Y不在括号里告诉我们这是半偏相关系数而不是偏相关系数。代入上式,得到此时R2=.307,X1X2的半偏相关(半偏相关系数)为.4695和.3878,高于各自的效度相关系数).4和.3。这就是互补现象。

抑制现象

参考文献

[1] Cohen BH. Explaining psychological statistics[M]. New York, US:John Wiley & Sons, 2008. 中译本: 高定国等译, 心理统计学(第三版)[M]. 上海:华东师范大学出版社, 2011.

转自:http://blog.sciencenet.cn/blog-1148346-852597.html

[转载]R2: 相关系数、复相关系数及半偏相关系数之间的联系的更多相关文章

  1. 【转载】python3.0与2.x之间的区别

    python3.0与2.x之间的区别: 1.性能 Py3.0运行pystone benchmark的速度比Py2.5慢30%.Guido认为Py3.0有极大的优化空间,在字符串和整形操作上可以取得很好 ...

  2. 【转载】String、StringBuffer与StringBuilder之间区别

    文章来源:http://www.cnblogs.com/A_ming/archive/2010/04/13/1711395.html 这两天在看Java编程的书,看到String的时候将之前没有弄懂的 ...

  3. [转载]利用memcached在多台服务器之间共享PHP的session数据

    原文地址:利用memcached在多台服务器之间共享PHP的session数据作者:a1049709658 最近我的几篇文章都是是最近项目的一点心得^^ 这个项目一开始就设计的"很大&quo ...

  4. 转载 转载 转载 数组a[],a,&a之间的区别

    通俗理解:内存就是公寓房间,指针就是房间的门牌号,数组就是连续的公寓房间,数组名就是这组连续房间的起始地址,也就是第一个房间的地址. 例如int a[5]   a是数组名,也就是第一个房间号 & ...

  5. 【转载】CString、BSTR和LPCTSTR之间的区别

    原文:http://www.cnblogs.com/GT_Andy/archive/2011/01/18/1938605.html 一.定义 1.CString:动态的TCHAR数组.它是一个完全独立 ...

  6. 转载:Linux系统和Linux系统之间如何实现文件传输

    两台Linux系统之间传输文件 听语音 | 浏览:13183 | 更新:2014-07-15 15:22 | 标签:linux 1 2 3 4 5 6 分步阅读 如何在Linux系统之间传输文件及文件 ...

  7. 半联结&反联结!

    半联结是在两个数据集(表)之间的联结,其中第一个数据集中的数据行在决定是否返回时会根据在另一个数据集中出现或不出现至少一个相匹配的数据行来确定.“不出先”匹配行——这是半联结的一种特殊形式,称为反联结 ...

  8. Pearson product-moment correlation coefficient in java(java的简单相关系数算法)

    一.什么是Pearson product-moment correlation coefficient(简单相关系数)? 相关表和相关图可反映两个变量之间的相互关系及其相关方向,但无法确切地表明两个变 ...

  9. python相关系数

    皮尔逊相关系数: 用于度量两个变量X和Y之间的相关(线性相关),其值介于-1与1之间. 几组的点集,以及各个点集中和之间的相关系数.我们可以发现相关系数反映的是变量之间的线性关系和相关性的方向(第一排 ...

  10. python学习笔记(3) -- 字符与数字之间的转换函数

    转载:python中的字符数字之间的转换函数 int(x [,base ])         将x转换为一个整数     long(x [,base ])        将x转换为一个长整数     ...

随机推荐

  1. [Spring+SpringMVC+Mybatis]框架学习笔记(四):Spring实现AOP

    上一章:[Spring+SpringMVC+Mybatis]框架学习笔记(三):Spring实现JDBC 下一章:[Spring+SpringMVC+Mybatis]框架学习笔记(五):SpringA ...

  2. 使用Canal同步mysql数据到es

    一.简介 Canal主要用途是基于 MySQL 数据库增量日志解析,提供增量数据订阅和消费. 当前的 canal 支持源端 MySQL 版本包括 5.1.x , 5.5.x , 5.6.x , 5.7 ...

  3. 关于微信小程序原生组件与uniApp混合开发过程遇到的问题与解决方式

    前言: 在实际开发过程中,尤其是小程序的开发,我们常常会遇到一些在文档中解决不了的问题,在这里,我就浅谈一下我遇到的一些问题 1.小程序的构建框架是uni-app,却突然被要求用原生的微信小程序代码来 ...

  4. PB从入坑到放弃(六)动态SQL应用

    写在前面 动态 SQL 语句是部分或者整个 SQL 语句在运行时才能确定,可以更好的与用户进行交互,大大提高了SQL的灵活性 一.执行SQL语句 1.1 执行无入参SQL ① 语法 EXECUTE I ...

  5. servlet系列:简介和基本使用以及工作流程

    目录 一.简介 二.Servlet实现 三.基本使用 1.引入pom依赖 2.实现Servlet规范,重写service方法 3.配置web.xml 4.配置Tomcat 6.运行 四.Servlet ...

  6. Linux cpu 亲缘性 绑核

    前言 https://www.cnblogs.com/studywithallofyou/p/17435497.html https://www.cnblogs.com/studywithallofy ...

  7. 论文解读(CBL)《CNN-Based Broad Learning for Cross-Domain Emotion Classification》

    Note:[ wechat:Y466551 | 付费咨询,非诚勿扰 ] 论文信息 论文标题:CNN-Based Broad Learning for Cross-Domain Emotion Clas ...

  8. 11、Mybatis之逆向工程

    11.1.正向与逆向工程概述 正向工程:先创建Java实体类,由框架负责根据实体类生成数据库表:例如Hibernate是支持正向工程的. 逆向工程:先创建数据库表,由框架负责根据数据库表,反向生成Ja ...

  9. Codeforces 1462F The Treasure of The Segments

    题意 给\(n(1\leq n\leq 2*10^5)\)个线段$[l_i,r_i] (1≤l_i≤r_i≤10^9) $,问最少删除几个线段,使得剩下线段中,有至少一个线段与所有线段相交. 分析 对 ...

  10. 618京东到家APP-门详页反爬实战

    一.背景与系统安全需求分析 1. 系统的重要性 上图所示是接口所属位置.对电商平台或在线商店而言,分类查商品都是很重要的,通过为用户提供清晰的商品分类,帮助他们快速找到所需产品,节省浏览时间,提升购物 ...