Hern\(\'{a}\)n M. and Robins J. Causal Inference: What If.

这一章介绍如何结合IP weighting 和 参数模型.

12.1 The causal question

12.2 Estimating IP weights via modeling

我们知道, IP weighting:

\[\frac{I(A_i=a)Y_i}{f(A_i|L)},
\]

相当于创建了一个伪集合, 即假设所有的人都进行了\(A=a\).

显然, 在这个伪集合中, \(A,L\)是相互独立的.

故我们有

\[\mathbb{E}_{ps}[Y|A=a]=\sum_l \mathbb{E} [Y|A=a,L=l] \mathrm{Pr}[L=l],
\]

当同时满足条件可交换性的时候, 我们就能够得到

\[\mathbb{E}_{ps}[Y|A=a] = \mathbb{E}[Y^a].
\]

所以我们只需要估计\(\hat{\mathbb{E}}_{ps} [Y|A=a]\)即可.

自然地, 我们可以假设其符合

\[\theta_0 + \theta_1 A
\]

的线性模型.

通过最小二乘法可以估计出上面的参数.

但是需要注意的是, 我们数据不是原始的数据, 而是在伪数据之上, 相当于每一个样本为

\[\frac{Y_i}{f(A_i|L)}.
\]

记\(W = 1 / f(A=1|L)\), 以及它的估计\(\hat{W}\)(因为\(f(A|L)\)我们也是不知道的, 我们同样可以用参数模型进行估计), 故

\[\hat{\mathbb{E}}_{ps}[Y|A=1] = \frac{1}{n}\sum_{A_i =1} \hat{W}_i Y_i.
\]

12.3 Stabilized IP weights

实际上, 我们不光可以设置\(W=1 / f(A|L)\), 实际上可以进一步为

\[\frac{p}{f(A|L)}
\]

只需要满足\(p\)与\(L\)无关即可.

书上说这种方式的选择会使得最后估计的置信区间更窄也就是跟robust.

12.4 Marginal structural models

\[\mathbb{E}[Y^a] = \beta_0 + \beta_1 a.
\]

注意到, 当满足条件可交换性的时候, 上面的推得的模型和这一节的是等价的.

12.5 Effect modification and marginal structural models

\[\mathbb{E}[Y^a|V] = \beta_0 + \beta_1 a + \beta_2 Va + \beta_3 V.
\]

这个时候, 我们可以通过\(SW^A (V) = \frac{f[A|V]}{f[A|V]}\)来估计.

12.6 Censoring and missing data

只需考虑\(Y^{a, c=0}\), 以及对应的\(W = W^A \times W^C\),

\[W^C = 1 / \mathrm{Pr} [C=0 | L, A].
\]

Fine Point

Setting a bad example

Checking positivity

Technical Point

Horvitz-Thomson estimators

我们常常会用

\[\hat{\mathbb{E}}[\frac{I(A=a)Y}{f(A|L)}]
\]

作为估计式子, 其等价于

\[\frac{\hat{\mathbb{E}}[\frac{I(A=a)Y}{f(A|L)}]}
{\hat{\mathbb{E}}[\frac{I(A=a)}{f(A|L)}]}.
\]

而且往往后者更稳定.

注: 在 stabilized IP weights中必须要用后者.

More on stabilized weights

\[SW^A = \frac{g(A)}{f[A|L]}.
\]
\[\frac{\hat{\mathbb{E}}[\frac{I(A=a)Y}{f(A|L)}g(A)]}
{\hat{\mathbb{E}}[\frac{I(A=a)}{f(A|L)}g(A)]}.
\]

Chapter 12 IP Weighting and Marginal Structural Model的更多相关文章

  1. 零元学Expression Blend 4 - Chapter 12 用实例了解布局容器系列-「Viewbox」

    原文:零元学Expression Blend 4 - Chapter 12 用实例了解布局容器系列-「Viewbox」 本系列将教大家以实做案例认识Blend 4 的布局容器,此章介绍的布局容器是Bl ...

  2. Think Python - Chapter 12 Tuples

    12.1 Tuples are immutable(元组是不可变的)A tuple is a sequence of values. The values can be any type, and t ...

  3. 西瓜书概念整理(chapter 1-2)

    括号表示概念出现的其他页码, 如有兴趣协同整理,请到issue中认领章节 完整版见我的github:ahangchen 觉得还不错的话可以点个star ^_^ 第一章 绪论 Page2: 标记(lab ...

  4. 西瓜书概念整理(chapter 1-2)熟悉机器学习术语

    括号表示概念出现的其他页码, 如有兴趣协同整理,请到issue中认领章节 完整版见我的github:ahangchen 觉得还不错的话可以点个star ^_^ 第一章 绪论 Page2: 标记(lab ...

  5. 《Java 8 in Action》Chapter 12:新的日期和时间API

    在Java 1.0中,对日期和时间的支持只能依赖java.util.Date类.同时这个类还有两个很大的缺点:年份的起始选择是1900年,月份的起始从0开始. 在Java 1.1中,Date类中的很多 ...

  6. Chapter 12 外观模式

    外观模式:为子系统中的一组接口提供一个一致的界面,此模式定义了一个高层接口,这个模式使得这一子系统更加容易使用. 外观模式三个阶段: 首先,在设计初期阶段,应该要有意识的将不同的两个层分离. 其次,在 ...

  7. 《算法导论》— Chapter 12 二叉查找树

    序 查找树是一种数据结构,它支持多种动态集合操作.包含Search.Minimum.Maximum.PreDecessor.Successor.Insert.Delete等.它既能够用作字典,也能够用 ...

  8. UNP总结 Chapter 12~14 IPv4与IPv6的互操作性、守护进程和inet超级服务器、高级I/O函数

    一.IPv4与IPv6的互操作性 1.IPv4客户与IPv6服务器 拥有双重协议栈的主机的一个基本特性就是:其上运行的IPv6服务器既能应付IPv4客户,又能应付IPv6客户.这是通过使用IPv4映射 ...

  9. C++ primer chapter 12

    动态内存:之前的程序使用对象有着严格定义的生存期,会自动销毁.C++支持动态分配对象,动态分配对象的生存期和他们在哪里创建是无关的,只有当显式的被释放,这些对象才会销毁.标准库定义了智能指针对象可以自 ...

随机推荐

  1. absent, absolute

    absent 1. A teacher asked in a class who killed Abraham Lincoln. A blonde said "It wasn't me, I ...

  2. academy

    academy at/in school都行,academy一般用at. The word comes from the Academy in ancient Greece, which derive ...

  3. day07 Nginx入门

    day07 Nginx入门 Nginx简介 Nginx是一个开源且高性能.可靠的http web服务.代理服务 开源:直接获取源代码 高性能:支持海量开发 可靠:服务稳定 特点: 1.高性能.高并发: ...

  4. 网卡命令ifconfig

    • ifconfig • service network restart • ifdown eth0 • ifdown eth0 #linux下run networkexport USER=lizhe ...

  5. KMP算法中的next函数

    原文链接:http://blog.csdn.net/joylnwang/article/details/6778316/ 其实后面大段的代码都可以不看 KMP的关键是next的产生 这里使用了中间变量 ...

  6. String.split()与StringUtils.split()的区别

    import com.sun.deploy.util.StringUtils; String s =",1,,2,3,4,,"; String[] split1 = s.split ...

  7. NSURLConnection和Runloop

    - 1.1 涉及知识点(1)两种为NSURLConnection设置代理方式的区别 //第一种设置方式: //通过该方法设置代理,会自动的发送请求 // [[NSURLConnection alloc ...

  8. 查询表名和表备注(中文名) 及 dba_tables、all_tables和user_tables的区别

    1. select a.* from ALL_TAB_COMMENTS a --查表名和表中文名select a.* from ALL_TAB_COLUMNS a --查询表字段属性select a. ...

  9. Spring Boot项目的不同启动方式

    方式一: 直接通过IntelliJ IDEA启动,直接执行Spring Boot项目的main()方法. 方法二: 将项目打包成jar包,首先需要在pom.xml文件的根节点下添加如下配置: < ...

  10. MySQL-核心技术

    1.基本查询语句 1.1使用select 语句查询一个数据表 select * from user; 1.2 查询表中的一列或多列 select id,ixdh from user; 1.3从一个表或 ...