Law of Iterated Expectations & Covariance
Law of Iterated Expectations
\(E[Y] = E_X[E[Y |X]].\)
The notation \(E_X[.]\) indicates the expectation over the values of \(X\). Note that \(E[Y|X]\)
is a function of \(X\).
Proof for Law of Iterated Expectations
Proof for discrete random variables:
\(E[E[Y|X]]=\sum\limits_{x} E[Y|X=x]P(X=x)
\\= \sum\limits_{x} \sum\limits_{y} yP(Y=y|X=x)P(X=x)
\\= \sum\limits_{x} \sum\limits_{y} \dfrac{yP(X=x,Y=y)}{P(X=x)}P(X=x)
\\= \sum\limits_{y} \sum\limits_{x} yP(X=x,Y=y)
\\= \sum\limits_{y} yP(Y=y)
\\= E(Y).\)
Proof for continuous random variables:
\(E[E[Y|X]]=\int_{-\infin}^{\infin}(\int_{-\infin}^{\infin}yf_{Y|X}(y|x)dy)f_X(x)dx
\\= \int_{-\infin}^{\infin}(\int_{-\infin}^{\infin}y\dfrac{f(x,y)}{f_X(x)}dy)f_X(x)dx
\\= \int_{-\infin}^{\infin} \int_{-\infin}^{\infin}yf(x,y)dxdy
\\= \int_{-\infin}^{\infin} y \int_{-\infin}^{\infin}f(x,y)dxdy
\\= \int_{-\infin}^{\infin} y f_Y(y)dy
\\= E(Y).\)
The process of the proving includes the concept of conditional expectation, which can be learned from this article.
Covariance
In any bivariate distribution,
\(Cov[X, Y] = Cov_X[X, E[Y| X]] = \int_x(x - E[X]) E[Y| X]f_X(x) dx.\)
(Note that this is the covariance of \(x\) and a function of \(x\).)
Proof for discrete random variables:
\(Cov[X,E[Y|X]] = E[X-E[X]][E[Y|X]-E[E[Y|X]]]
\\=E[X-E[X]][E[Y|X]-E[Y]]
\\=E\{[X-E[X]]E[Y|X]-[X-E[X]]E[Y]\}
\\=E[X-E[X]]E[Y|X]-E[X-E[X]]E[Y]
\\=E[XE[Y|X]-E[X]E[Y|X]]-E[X-E[X]]E[Y]
\\=E[XE[Y|X]]-E[X]E[E[Y|X]]-E[X-E[X]]E[Y]
\\=E[XE[Y|X]]-E[X]E[Y]-E[X-E[X]]E[Y]
\\=E[x\sum\limits_y y P(Y=y|X=x)]-E[X]E[Y]
\\=\sum\limits_x \{x[\sum\limits_y y P(Y=y|X=x)]P(X=x)\}-E[X]E[Y]
\\=\sum\limits_x \{x[\sum\limits_y \dfrac{yP(X=x,Y=y)}{P(X=x)}] P(X=x) \}-E[X]E[Y]
\\=\sum\limits_x \sum\limits_y x y P(X=x,Y=y)-E[X]E[Y]
\\=E[X Y]-E[X]E[Y]
\\=Cov[X,Y].\)
Key Steps: \(E[XE[Y|X]]=E[X Y]\), \(E[E[Y|X]]=E[Y]\).
Proof for continuous random variables:
\(Cov[X,E[Y|X]]=E[XE[Y|X]]-E[X]E[Y]
\\=E[x \int_{-\infin}^{\infin} y f_{Y|X}(y|x)dy]-E[X]E[Y]
\\=E[x \int_{-\infin}^{\infin} y \dfrac{f(x, y)}{f_X(x)}dy]-E[X]E[Y]
\\=\int_{-\infin}^{\infin}[x \int_{-\infin}^{\infin} y \dfrac{f(x, y)}{f_X(x)}dy]f_X(x)dx-E[X]E[Y]
\\=\int_{-\infin}^{\infin} \int_{-\infin}^{\infin} x y f(x, y)dydx-E[X]E[Y]
\\=E[X Y]-E[X]E[Y]
\\=Cov[X,Y].\)
Inference
If random variable \(\epsilon\) is mean independent of random variable \(X\), then \(\epsilon\) and \(X\) are linear irrelevant i.e. \(E[\epsilon|X] = E[\epsilon](=0) \Rightarrow \rho_{\epsilon X}=0\)
Proof
\(E[\epsilon|X] = E[\epsilon](=0), Cov(\epsilon, X)=Cov(E[\epsilon|X],X) = Cov(E[\epsilon],X) = 0 \Rightarrow \rho_{\epsilon X} = 0 .\)
Decomposition of Variance OR Law of Total Variance
In a joint distribution,
\(Var[Y] = Var_X[E[Y| X]] + E_X[Var[Y| X]].\)
Proof for Law of Total Variance
\(Var[E[Y|X]]+E[Var[Y|X]]
\\= E[E[Y|X]-E[Y]]^2+E[E[Y|X]^2-E^2[Y|X]]
\\= E[E^2[Y|X]]-E^2[Y]+E[E[Y^2|X]]-E[E^2[Y|X]]
\\= E[E[Y^2|X]]-E^2[Y]
\\= E[Y^2]-E^2[Y].\)
The proof above uses the law of iterated expectations several times. A deeper and more direct understanding of the Law of Total Variance and whose relation to the K-means cluster and OLS can be found in this article.
Law of Iterated Expectations & Covariance的更多相关文章
- Pattern recognition and machine learning 疑难处汇总
不断更新ing......... p141 para 1. 当一个x对应的t值不止一个时,Gaussian nosie assumption就不合适了.因为Gaussian 是unimodal的,这意 ...
- 齐夫定律, Zipf's law,Zipfian distribution
齐夫定律(英语:Zipf's law,IPA英语发音:/ˈzɪf/)是由哈佛大学的语言学家乔治·金斯利·齐夫(George Kingsley Zipf)于1949年发表的实验定律. 它可以表述为: 在 ...
- Ill-conditioned covariance create
http://www.mathworks.com/matlabcentral/answers/100210-why-do-i-receive-an-error-while-trying-to-gene ...
- Conway's law(康威定律)
Mel Conway 康威在加利福尼亚理工学院获得物理学硕士学位,在凯斯西储大学获得数学博士学位.毕业之后,他参与了很多知名的软件项目,如 Pascal 编辑器.在他的职业生涯中,康威观察到一个现象 ...
- 加州大学伯克利分校Stat2.2x Probability 概率初步学习笔记: Section 3 The law of averages, and expected values
Stat2.2x Probability(概率)课程由加州大学伯克利分校(University of California, Berkeley)于2014年在edX平台讲授. PDF笔记下载(Acad ...
- 墨菲定律-Murphy's Law (转载)
墨菲定律 “墨菲定律”(Murphy's Law)亦称莫非定律.莫非定理.或摩菲定理,是西方世界常用的俚语. “墨菲定律”:事情往往会向你所想到的不好的方向发展,只要有这个可能性.比如你衣袋里有两把钥 ...
- BendFord's law's Chi square test
http://www.siam.org/students/siuro/vol1issue1/S01009.pdf bendford'law e=log10(1+l/n) o=freq of first ...
- Educational Codeforces Round 13 D:Iterated Linear Function(数论)
http://codeforces.com/contest/678/problem/D D. Iterated Linear Function Consider a linear function f ...
- 帕金森定律(Parkinson's Law)
帕金森定律(Parkinson's Law)是官僚主义或官僚主义现象的一种别称, 是由英国历史学家.政治学家西里尔·诺斯古德·帕金森(Cyril Northcote Parkinson)通过长期调查研 ...
随机推荐
- FastJson序列化对象复杂时出错问题解决
FastJson序列化对象复杂时出错问题解决 针对复杂的对象,如Map<String, List<Map<String, XxxObject<A, B, C>>&g ...
- Bing 广告平台迁移到 .net6
原文链接 https://devblogs.microsoft.com/dotnet/bing-ads-campaign-platform-journey-to-dotnet-6/ 广告组件平台对于微 ...
- 自主创建mybtis管理应用,用以横向管理数据源
这个是我写的第一个随手小记,一晃眼做后端开发也有7年多了,现在也准备将一些杂七杂八的资料整理下.也算是回顾这7年中做的比较有意思的东西了. 这个需求是我17年做的,当时的应用场景是仓储库比较多,随时会 ...
- java集合框架复习----(3)Set
文章目录 四.set集合 1.hashSet[重点] 2.TreeSet 四.set集合 无序.无下标.元素不可重复 1.hashSet[重点] == 数组+链表+红黑树== 基于hashcode计算 ...
- Python学习三天计划-3
面向对象 一.类的定义 1.类定义 class是关键字,表示要定义类了 类的属性,即定义在类中的变量(成员变量) 类的行为,即定义在类中的函数(成员方法) 2.对象 创建类对象的语法: class S ...
- 5.pygame快速入门-精灵和精灵组
在之前案例中,图像加载.位置变化.绘制图像都需要编写代码分别处理 pygame提供了两个类简化开发步骤 pygame.sprite.Sprite #精灵,存储图像数据image和位置rect的对象 p ...
- 一、Vue.js介绍
一.介绍 Vue (读音 /vjuː/,类似于 view) 是一套用于构建用户界面的渐进式框架.与其它大型框架不同的是,Vue 被设计为可以自底向上逐层应用.Vue 的核心库只关注视图层,不仅易于上手 ...
- 京东云开发者|IoT运维 - 如何部署一套高可用K8S集群
环境 准备工作 配置ansible(deploy 主机执行) # ssh-keygen # for i in 192.168.3.{21..28}; do ssh-copy-id -i ~/.ssh/ ...
- 开源网络协议栈onps诞生记
小孩没娘,说来话长,一切都要从LwIP说起.大约是06年9月,本人在二姨的坛口发布了一篇小文--<uC/OS-II 平台下的 LwIP 移植笔记>.自此一发不可收拾,开启了一段我与LwIP ...
- CSS布局秘籍(2)-6脉神剑
HTML系列: 人人都懂的HTML基础知识-HTML教程(1) HTML元素大全(1) HTML元素大全(2)-表单 CSS系列: CSS基础知识筑基 常用CSS样式属性 CSS选择器大全48式 CS ...