Hern\(\'{a}\)n M. and Robins J. Causal Inference: What If.

这一章主要讨论的是, 观测得到的数据(而非随机实验)在什么条件下可以视为是随机试验.

outcome predictors: 一些会导致\(Y\)发生的诱因

3.1

  1. 我们所考虑的\(A\)和实验中实际的采取的手段\(A\)是相一致的.

  2. 采取何种手段\(A\)仅仅与\(L\)有关(这里考虑, \(L, A, Y\)三个元素).

  3. \(\mathrm{Pr}(A|L) > 0\), 即正定性.

下面是一点一点的分析这三个点的重要性.

3.2 Exchangeability

这个对应的是第二点, 即我们要探究是否\(A\)仅仅与\(L\)有关, 从而有可交换性:

\[Y^a \amalg A |L.
\]

一旦遇到上面的情况, 往往就没有上述可交换性的保证了.

3.3 Positivity

设想\(L\)代表的是一个人是否吸烟, 倘若一个医生仅仅给不吸烟的人进行心脏迁移手术, 即

\[\mathrm{Pr}[A=1|L=1] = 0,
\]

则我们就完全丢失了这部分信息, 自然也没办法计算casual effect, 因为

\[\mathrm{Pr}[Y|A=1, L=1]
\]

压根没有定义.

3.4 Consistency

一致性分类预期结果的一致性, 以及结果和观测数据的一致性

First

现在假设\(A \in \{0, 1\}\), 即代表是否进行心脏移植手术, 但是在实际中, \(A\)并非如此纯粹的0, 1.

实际上, 取决于器材, 外科医生的差别会衍生出不同版本的\(A\).

当然了, 这么讨论下去只会导致不可知论, 我们可以在某种程度上假设, 不过对\(A\)的描述越细致, 即越细分, 最后的结论也会更加精准.

Second

这个一致性, 用公式就是

\[Y^a = Y, A=a,
\]

这个很重要, 因为我们在计算causal effect的时候有这么一步

\[\mathrm{Pr}[Y|A=a, L] = \mathrm{Pr}[Y^a|A=a, L].
\]

这个一致性, 个人的理解是, 我们所观察的\(A=a\)有很多版本, 可能与我们所希望的\(Y^a\)并不一致, 导致\(Y^a \not = Y\).

这里有一个微妙的东西, 实在是不知道如何描述了.

Fine Point

3.1 Identifiability of causal effects

指, 倘若不是随机实验, 我们需要一些额外的假设来得以计算causal effect.

3.2 Crossover randomized experiments

p32

这个讨论的是在不同的时间点\(t=0, t=1\).

3.3 Possible worlds

p35

3.4 Attributable fraction

p38

Technical Point

3.1 Positivity for standardization and IP weighting

p32

上一章讲了利用standardization 和 IP weighting 在条件可交换的假定下, 我们可以计算causal effect.

但是, 实际上这同时是需要positivity的假定的.

standardization:

\[\sum_l \mathbb{E} [Y|A=a, L=l] \mathrm{Pr} [L=l],
\]

这个式子需要\(\mathbb{E}[Y|A=a, L=l]\), 但是这个在某些\(P(A=a|L=l)=0\)的情况下是没有定义的.

另一方面, IP weighting

\[\mathbb{E} [\frac{I(A=a)Y}{f(A|L)}] = \mathrm{Pr}[L \in Q(a)]\sum_{l} \mathbb{E} [Y|A=a, L=l, L\in Q(a)] \mathrm{Pr} [L=l|L \in Q(a)],
\]

其中\(Q(a) = \{l; \mathrm{Pr} (A=a|L=l)>0\}\).

相当于, 认为地目标的集合缩小了.

里头还说, 上述的与

\[\mathbb{E} [\frac{I(A=a)Y}{f(a|L)}]
\]

不同, 而且说后者是undefined的, 可是后决定后者才是等价于上面所说的啊.

不过我倒是觉得无所谓的, 毕竟我们应该关心我们所关心的, 限定在\(f(a|L)\not = 0\)才是合适的区域.

3.2 Cheating consistency

p40

Chapter 3 Observational Studies的更多相关文章

  1. descriptive statistics|inferential statistics|Observational Studies| Designed Experiments

    descriptive statistics:组织和总结信息,为自身(可以是population也可以是sample)审视和探索, inferential statistics.从sample中推论p ...

  2. Weighted Effect Coding: Dummy coding when size matters

    If your regression model contains a categorical predictor variable, you commonly test the significan ...

  3. hbase官方文档(转)

    FROM:http://www.just4e.com/hbase.html Apache HBase™ 参考指南  HBase 官方文档中文版 Copyright © 2012 Apache Soft ...

  4. HBase官方文档

    HBase官方文档 目录 序 1. 入门 1.1. 介绍 1.2. 快速开始 2. Apache HBase (TM)配置 2.1. 基础条件 2.2. HBase 运行模式: 独立和分布式 2.3. ...

  5. 【统计】Causal Inference

    [统计]Causal Inference 原文传送门 http://www.stat.cmu.edu/~larry/=sml/Causation.pdf 过程 一.Prediction 和 causa ...

  6. Propensity Scores

    目录 基本的概念 重要的结果 应用 Propensity Score Matching Stratification on the Propensity Score Inverse Probabili ...

  7. R数据分析:样本量计算的底层逻辑与实操,pwr包

    样本量问题真的是好多人的老大难,是很多同学科研入门第一个拦路虎,今天给本科同学改大创标书又遇到这个问题,我想想不止是本科生对这个问题不会,很多同学从上研究生到最后脱离科研估计也没能把这个问题弄得很明白 ...

  8. Modern C++ CHAPTER 2(读书笔记)

    CHAPTER 2 Recipe 2-1. Initializing Variables Recipe 2-2. Initializing Objects with Initializer Lists ...

  9. Android Programming: Pushing the Limits -- Chapter 7:Android IPC -- ApiWrapper

    前面两片文章讲解了通过AIDL和Messenger两种方式实现Android IPC.而本文所讲的并不是第三种IPC方式,而是对前面两种方式进行封装,这样我们就不用直接把Aidl文件,java文件拷贝 ...

随机推荐

  1. 学习java 7.24

    学习内容: Swing编程 由于Swing的所有组件完全采用Java 实现,不再调用本地平台的GUl,所以导致Swing图形界面的显示速度要比AWT图形界面的显示速度慢一些,但相对于快速发展的硬件设施 ...

  2. Flink(二)【架构原理,组件,提交流程】

    目录 一.运行架构 1.架构 2.组件 二.核心概念 TaskManager . Slots Parallelism(并行度) Task .Subtask Operator Chains(任务链) E ...

  3. 【STM32】使用DMA+SPI传输数据

    DMA(Direct Memory Access):直接存储器访问 一些简单的动作,例如复制或发送,就可以不透过CPU,从而减轻CPU负担 由于本人使用的是正点原子开发板,部分代码取自里面的范例 本篇 ...

  4. LeetCode1579题——圆圈中最后剩下的数字

    1.题目描述:0,1,,n-1这n个数字排成一个圆圈,从数字0开始,每次从这个圆圈里删除第m个数字.求出这个圆圈里剩下的最后一个数字.例如,0.1.2.3.4这5个数字组成一个圆圈,从数字0开始每次删 ...

  5. Spring Batch : 在不同steps间传递数据

    参考文档: How can we share data between the different steps of a Job in Spring Batch? Job Scoped Beans i ...

  6. 3.3 GO字符串处理

    strings方法 index 判断子字符串或字符在父字符串中出现的位置(索引)Index 返回字符串 str 在字符串 s 中的索引( str 的第一个字符的索引),-1 表示字符串 s 不包含字符 ...

  7. python爬取实习僧招聘信息字体反爬

    参考博客:http://www.cnblogs.com/eastonliu/p/9925652.html 实习僧招聘的网站采用了字体反爬,在页面上显示正常,查看源码关键信息乱码,如下图所示: 查看网页 ...

  8. df和du显示不同

    目录 一.简介 二.原因分析 三.解决方法 一.简介 Linux服务器,使用df -h查看文件系统使用率,可以看到/dev/xvdb1磁盘占用了约27G,挂载目录为/opt. 但进入到opt目录中执行 ...

  9. Linux网络编程入门

    (一)Linux网络编程--网络知识介绍 Linux网络编程--网络知识介绍客户端和服务端         网络程序和普通的程序有一个最大的区别是网络程序是由两个部分组成的--客户端和服务器端. 客户 ...

  10. GraphQL 到底有什么魔力?

    时间退回到 2012年的一个下午, 美国加利福尼亚州, facebook 的工程师们发现他们才上架没多久的移动端应用就收到了很多差评, 用户反映app响应慢,耗电严重等,经过分析后发现, 应用在第一次 ...