[转载]R2: 已解释和未解释的方差
估计值的方差与总体方差之间的差异就是回归方程对方差的解释率。试举一例,如图 1,身高与体重的回归线显示身高与体重之间呈正相关,Mr. Y身高76英寸体重220磅(图 1中
插图.cdr的红点),他与体重平均值的总离差(Y-$\bar{Y}$)是220-155=65磅。这个总离差可以被分解为两部分:一部分是Y与回归线之间的离差(Y-Y’),等于30;另一部分是预测值与体重平均值的离差(Y’-$\bar{Y}$),等于35。这两部分之和加起来就是65总的离差。

图 1
一般地,(Y-Y’)+(Y’-$\bar{Y}$)=(Y-Y),第一部分是(Y-Y’),这是预测的误差,有时我们也把它看成是方差的“未解释”部分,反之,第二部分(Y’-$\bar{Y}$)则是“已解释”部分。对Mr. Y来说,他的身高“解释”(或预测)了他的部分体重——我们预期他的体重高于平均水平,但是他甚至比他的身高所预期的体重还要重;这个额外的体重就是身高没法解释的,所以称为“未解释值”。
如果所有这一个个的“未解释值”被平方并加起来(Y-Y’)2,那么我们将得到未解释的平方和SS(Sum of Square),将这个未解释的SS除以N就得到了未解释的方差(unexplained variance)。同样地,我们可以将基于所有的(Y’-$\bar{Y}$)平方而得到的已解释的SS除以N来求得已解释的方差量。已解释和未解释的方差加总起来等于总的方差。(这句话不对吧?)
如何评估回归线究竟在以一个变量预测另一个变量的工作中做得怎么样,可以将已解释的方差除以总方差,这个比值就叫做决定系数(Coefficient of determination),它代表了总方差被预测变量所解释或决定的比率。决定系数等于r2(Squared Pearson’s Correlation Coeficient),r2也称为“方差解释率”。
参考文献
[1] Cohen BH. Explaining psychological statistics[M]. New York, US:John Wiley & Sons, 2008. 中译本: 高定国等译, 心理统计学(第三版)[M]. 上海:华东师范大学出版社, 2011.
“解释”的两层含义
回归模型中的R2可以被称为“方差解释率”,那么这个“解释”要怎样理解(自我描述)。
举例,甲、乙二人同程一辆汽车,甲开车,乙坐车,这辆车以60km/h正常行驶在公路上。若用甲的时速解释乙的时速,可以这样理解:已知甲时速60km,他们同乘一辆车,则可以预测乙也是时速60km,强调他们二者之间的相关性;另一方面,已知甲时速60km,并且甲在开车,那么可以确定乙也是时速60km,强调二者的因果关系,因为甲开车时速60km才导致乙的时速是60km,可以理解为甲驱动乙的空间位移是60km/h。
所以,“解释”在回归模型中对于X和Y包含两层含义,X驱动Y或X预测Y。简言之,“解释”有驱动和预测的两层含义。
转自:http://blog.sciencenet.cn/blog-1148346-852482.html
[转载]R2: 已解释和未解释的方差的更多相关文章
- Checbox的操作含已选、未选及判断代码
Checbox的操作包括已选.未选.判断等等,下面有个不错的示例,使用jquery完成,感兴趣的朋友可以参考下 $("#chk1").attr("checked" ...
- 3.21电脑重装“operation not found system ”和xp分盘”分配表有标记为已使用的未用簇”
问题一.是用光盘重装系统后重启,提示operation not found system ①考虑是系统问题,没装好,还是引导文件丢失;换新盘装,若还是一样; ②分析认为是分区问题,必须是活动分区+主分 ...
- free - 显示系统中已用和未用的内存空间总和.
总览 (SYNOPSIS) free [-b | -k | -m] [-o] [-s delay ] [-t] [-V] 描述 (DESCRIPTION) free 显示 系统中 已用和未用的 物理内 ...
- 同一个事务里 查询 已删除可是未提交的数据[bug记录]
前几天犯了个低级错误.在一个事务方法里老是查询不到某条记录,可是debug卡住时,用db工具查.又能查出值. 经过一番折腾,原来是我在同一个事务里 查询 了已删除可是未提交的数据.当然查询不到了! . ...
- Android 高仿QQ滑动弹出菜单标记已读、未读消息
在上一篇博客<Android 高仿微信(QQ)滑动弹出编辑.删除菜单效果,增加下拉刷新功能>里,已经带着大家学习如何使用SwipeMenuListView这一开源库实现滑动列表弹出菜单,接 ...
- 《转载》化繁为简 如何向老婆解释MapReduce?
本文转载自http://server.zol.com.cn/329/3295529.html 昨天,我在Xebia印度办公室发表了一个关于MapReduce的演说.演说进行得很顺利,听众们都能够理解M ...
- 【转载】C# Graphics类具体解释
封装一个 GDI+ 画图图面. 此类不能被继承.System.Drawing 命名空间 名称 说明 Clip 获取或设置 Region.该对象限定此 Graphics 的画图区域. ClipBoun ...
- 【转载】 BIOS设置选项详细解释——CPU核心篇
原文地址: http://kuaibao.qq.com/s/20180226A1G1OC00?refer=spider ---------------------------------------- ...
- 转载:FreeRTOS 配置文件详细功能解释
原文链接:http://blog.sina.com.cn/s/blog_98ee3a930102wf8c.html 本章节为大家讲解FreeRTOS的配置文件FreeRTOSConfig.h中每个选项 ...
- Linux性能指标解释+Oracle性能指标解释
Linux性能指标解释 类别 计数器名称 计数器描述 业界同行认可的资源阀值 memory Free(KB) 可用物理内存数 swap-in/out =0 Swap(KB) 已使用的虚拟内存数.在Li ...
随机推荐
- 2023河南省ICPC大学生程序设计竞赛-wh
第一次出去比赛,首先感谢程老师选择我们新生更多的比赛机会,感谢! 在周六我们一起做了高铁出发取洛阳参加icpc河南省赛,不得不说洛阳师范学院确实环境很好看..在热身赛时,已经被泼了冷水,这C也太难了, ...
- 痞子衡嵌入式:恩智浦i.MX RT1xxx系列MCU启动那些事(10.A)- FlexSPI NAND启动时间(RT1170)
大家好,我是痞子衡,是正经搞技术的痞子.今天痞子衡给大家介绍的是恩智浦i.MX RT1170 FlexSPI NAND启动时间. 本篇是 i.MXRT1170 启动时间评测第四弹,前三篇分别给大家评测 ...
- Java中的线程池使用及原理
开篇-为什么要使用线程池? Java 中的线程池是运用场景最多的并发框架,几乎所有需要异步或并发执行任务的程序都可以使用线程池.在开发过程中,合理地使用线程池能够带来 3 个好处. 第一:降低 ...
- [论文阅读] 颜色迁移-Illuminant Aware Gamut-Based
[论文阅读] 颜色迁移-Illuminant Aware Gamut-Based 文章: [Illuminant Aware Gamut-Based Color Transfer], [python代 ...
- MongoDB索引操作和执行计划Explain()详解
一.索引操作 说明,下面的内容举例时,以"dailyTrip"collection为例. 字段内容如下: { "_id" : ObjectId("63 ...
- C#中的ConcurrentExclusiveSchedulerPair类
为什么使用ConcurrentExclusiveSchedulerPair? 现实生活中的例子是一个停车场的入口和出口,多辆车可以同时进入和离开停车场,但是只有一个车辆可以进入或离开一次. 这时候就需 ...
- MySQL数据库触发器讲解 [创建/删除/查询/select into]
刚学习实例完mysql触发器, 前来分享学习经验. 菜鸟装逼, 老鸟勿喷 先来认识一下有关触发器的一些关键词. 在使用触发器时, 这些关键词将被用到, 请记下它们的模样和用途(意思) cre ...
- [Maven] maven插件系列之maven-shade-plugin
[Maven] maven插件系列之maven-shade-plugin 1 插件简述/Plugin Overview 1.1 定义与目的/Definition & Goals Officia ...
- KRPANO 最新官方文档中文版(持续更新)
KRPano最新官方文档中文版分享,后续持续更新: http://docs.krpano.tech/ 本博文发表于:http://www.krpano.tech/archives/849 发布者:屠龙 ...
- mpi转以太网连接300PLC与易控INSPEC上位机软件通讯
300PLC转以太网与易控 INSPEC 上位机软件通讯 易控 INSPEC 软件通过以太网连接西门子 S7300 系列 PLC, 兴达易控MPI-ETH-XD1.0通讯模块为 PLC 提供以太网通讯 ...