[转载]R2: 已解释和未解释的方差
估计值的方差与总体方差之间的差异就是回归方程对方差的解释率。试举一例,如图 1,身高与体重的回归线显示身高与体重之间呈正相关,Mr. Y身高76英寸体重220磅(图 1中
插图.cdr的红点),他与体重平均值的总离差(Y-$\bar{Y}$)是220-155=65磅。这个总离差可以被分解为两部分:一部分是Y与回归线之间的离差(Y-Y’),等于30;另一部分是预测值与体重平均值的离差(Y’-$\bar{Y}$),等于35。这两部分之和加起来就是65总的离差。

图 1
一般地,(Y-Y’)+(Y’-$\bar{Y}$)=(Y-Y),第一部分是(Y-Y’),这是预测的误差,有时我们也把它看成是方差的“未解释”部分,反之,第二部分(Y’-$\bar{Y}$)则是“已解释”部分。对Mr. Y来说,他的身高“解释”(或预测)了他的部分体重——我们预期他的体重高于平均水平,但是他甚至比他的身高所预期的体重还要重;这个额外的体重就是身高没法解释的,所以称为“未解释值”。
如果所有这一个个的“未解释值”被平方并加起来(Y-Y’)2,那么我们将得到未解释的平方和SS(Sum of Square),将这个未解释的SS除以N就得到了未解释的方差(unexplained variance)。同样地,我们可以将基于所有的(Y’-$\bar{Y}$)平方而得到的已解释的SS除以N来求得已解释的方差量。已解释和未解释的方差加总起来等于总的方差。(这句话不对吧?)
如何评估回归线究竟在以一个变量预测另一个变量的工作中做得怎么样,可以将已解释的方差除以总方差,这个比值就叫做决定系数(Coefficient of determination),它代表了总方差被预测变量所解释或决定的比率。决定系数等于r2(Squared Pearson’s Correlation Coeficient),r2也称为“方差解释率”。
参考文献
[1] Cohen BH. Explaining psychological statistics[M]. New York, US:John Wiley & Sons, 2008. 中译本: 高定国等译, 心理统计学(第三版)[M]. 上海:华东师范大学出版社, 2011.
“解释”的两层含义
回归模型中的R2可以被称为“方差解释率”,那么这个“解释”要怎样理解(自我描述)。
举例,甲、乙二人同程一辆汽车,甲开车,乙坐车,这辆车以60km/h正常行驶在公路上。若用甲的时速解释乙的时速,可以这样理解:已知甲时速60km,他们同乘一辆车,则可以预测乙也是时速60km,强调他们二者之间的相关性;另一方面,已知甲时速60km,并且甲在开车,那么可以确定乙也是时速60km,强调二者的因果关系,因为甲开车时速60km才导致乙的时速是60km,可以理解为甲驱动乙的空间位移是60km/h。
所以,“解释”在回归模型中对于X和Y包含两层含义,X驱动Y或X预测Y。简言之,“解释”有驱动和预测的两层含义。
转自:http://blog.sciencenet.cn/blog-1148346-852482.html
[转载]R2: 已解释和未解释的方差的更多相关文章
- Checbox的操作含已选、未选及判断代码
Checbox的操作包括已选.未选.判断等等,下面有个不错的示例,使用jquery完成,感兴趣的朋友可以参考下 $("#chk1").attr("checked" ...
- 3.21电脑重装“operation not found system ”和xp分盘”分配表有标记为已使用的未用簇”
问题一.是用光盘重装系统后重启,提示operation not found system ①考虑是系统问题,没装好,还是引导文件丢失;换新盘装,若还是一样; ②分析认为是分区问题,必须是活动分区+主分 ...
- free - 显示系统中已用和未用的内存空间总和.
总览 (SYNOPSIS) free [-b | -k | -m] [-o] [-s delay ] [-t] [-V] 描述 (DESCRIPTION) free 显示 系统中 已用和未用的 物理内 ...
- 同一个事务里 查询 已删除可是未提交的数据[bug记录]
前几天犯了个低级错误.在一个事务方法里老是查询不到某条记录,可是debug卡住时,用db工具查.又能查出值. 经过一番折腾,原来是我在同一个事务里 查询 了已删除可是未提交的数据.当然查询不到了! . ...
- Android 高仿QQ滑动弹出菜单标记已读、未读消息
在上一篇博客<Android 高仿微信(QQ)滑动弹出编辑.删除菜单效果,增加下拉刷新功能>里,已经带着大家学习如何使用SwipeMenuListView这一开源库实现滑动列表弹出菜单,接 ...
- 《转载》化繁为简 如何向老婆解释MapReduce?
本文转载自http://server.zol.com.cn/329/3295529.html 昨天,我在Xebia印度办公室发表了一个关于MapReduce的演说.演说进行得很顺利,听众们都能够理解M ...
- 【转载】C# Graphics类具体解释
封装一个 GDI+ 画图图面. 此类不能被继承.System.Drawing 命名空间 名称 说明 Clip 获取或设置 Region.该对象限定此 Graphics 的画图区域. ClipBoun ...
- 【转载】 BIOS设置选项详细解释——CPU核心篇
原文地址: http://kuaibao.qq.com/s/20180226A1G1OC00?refer=spider ---------------------------------------- ...
- 转载:FreeRTOS 配置文件详细功能解释
原文链接:http://blog.sina.com.cn/s/blog_98ee3a930102wf8c.html 本章节为大家讲解FreeRTOS的配置文件FreeRTOSConfig.h中每个选项 ...
- Linux性能指标解释+Oracle性能指标解释
Linux性能指标解释 类别 计数器名称 计数器描述 业界同行认可的资源阀值 memory Free(KB) 可用物理内存数 swap-in/out =0 Swap(KB) 已使用的虚拟内存数.在Li ...
随机推荐
- PNG结构
参考此博客 PNG的文件头总是固定的八个字节 89 50 4E 47 0D 0A 1A 0A 数据块长度13 00 00 00 0D 文件头数据块标识IDCH 49 48 44 52 13位数据块(I ...
- gin 接口开发 - 用户输入自动 TrimSpace
最近在思考一个问题,针对用户的输入,能不能快速校验? 比方说下面的 struct,大家用过 gin 的就知道,支持指定某个字段为 required,用户如果不输入,就检验不通过. type Login ...
- Java 中的值传递和引用传递 ?
一. 介绍 值传递:值传递(Pass-by-Value)当我们向方法传递参数时,实际上是将该参数的值进行拷贝,并将拷贝后的值传递给方法内部.在方法内部对参数进行修改不会影响原始变量的值. 引用传递:引 ...
- Redis理论
什么是Redis Redis(Remote Dictionary Server)是使用C语言编写的,开源的(BSD许可)高性能非关系型(NoSQL)的键值对数据库. Redis可以存储键和五种不同类型 ...
- 洛谷 T356695 文字处理软件(重置版)
很简单了啊! 说普及- 我都不信 作者(也就是我)链接:https://www.luogu.com.cn/problem/T356695 好好想想!!!! 题目! 文字处理软件(重置版) 题目背景 A ...
- ABC295 D题 题解
题意简述 给定一个长度不超过\(\;5\times 10^5\;\)的,仅有数字构成的字符串,问存在多少段子串,使得子串内字符重新排序后,前半段与后半段相同? 做法分析 重组后前后两部分相同,其实也就 ...
- 《高级程序员 面试攻略 》RocketMQ 如何保证顺序性
RocketMQ 提供了一种称为顺序消息的机制来确保消息的顺序性.下面是一些关键的方法和概念: 1. 顺序消息:顺序消息是指在发送和消费过程中,消息按照特定的顺序进行处理.RocketMQ 通过将消息 ...
- Spring Cloud OpenFeign 的使用及踩坑指南
目录 Feign 和OpenFeign Feign OpenFeign openFeign的优势 OpenFeign应用 1. 导入依赖 2. 使用 3. 日志配置 4. 数据压缩 OpenFeign ...
- 【实践篇】DDD脚手架及编码规范
一.背景介绍 我们团队一直在持续推进业务系统的体系化治理工作,在这个过程中我们沉淀了自己的DDD脚手架项目.脚手架项目是体系化治理过程中比较重要的一环,它的作用有两点: (1)可以对新建的项目进行统一 ...
- 解决Eclipse中启动Tomcat报unable to start within 45 seconds问题
启动项目的时候报Server Tomcat v8.0 Server at localhost was unable to start within 45 seconds. If the server ...