Hern\(\'{a}\)n M. and Robins J. Causal Inference: What If.

上一章讲了confounding, 这种bias来源于treatment和outcome受同一个未观测的cause影响, 但是这种bias在随机实验中可以避免.

这一章要讲的试selection bias, 即便是在随机试验中, 也无法避免.

8.1 The structure of selection bias

这里, 作者给出了一个非常好的例子, 如上图所示:

\(A \in \{0, 1\}\) 表示是否注射叶酸, 而\(Y \in \{0, 1\}\) 表示胎儿是否心脏畸形, 而\(C \in \{0, 1\}\)则表示是否死亡.

这里, 虽然是否注射叶酸, 我们是随机选择的, 但是在实际调查中, 只有顺利出生(\(C=0\))的才会被记录是否心脏畸形.

所以, 我们必须在\(C=0\)的条件下估计causal effect.

但是注意到, \(A\)存在指向\(C\)的箭头(即\(A=1\)会降低死亡的风险).

此时, \(Y^a\)和\(A\)在给定\(C=1\)的条件下并不独立.

这就是本章讲的selection bias.

8.2 Examples of selection bias

8.3 Selection bias and confounding

8.4 Selection bias and censoring

虽然我们只有\(C=0\)的情况, 我们可以把\(C\)也看出一个treatment, 则我们只需要关注

\[Y^{a, c=0},
\]

即可.

8.5 How to adjust for selection bias

如何计算\(\mathbb{E}[Y^{a, c=0}]\), 这一节给出的是一种特殊的IP weighting的方法, 说实话没怎么看懂, 这里以上图为例给出我自己的理解.

\[\mathbb{E}[\frac{I(A=a, C=0)Y}{f(C|A,L)}] \\
=
\sum_l \sum_y \frac{I(A=a, C=0)Y}{f(C=0|A=a,L=l)} \mathrm{Pr}[Y|a,c,l] \mathrm{Pr}[C=0|a,l] \mathrm{Pr}[A=a, L=l] \\
=
\sum_l \sum_y I(A=a, C=0)Y^{a,0} \mathrm{Pr}[Y^{a,0}|l] \mathrm{Pr}[A=a, L=l] \\
=
\mathbb{E} [Y^{a, c=0}] \mathrm{Pr}[A=a].
\]

其实, 个人感觉如果是

\[\mathbb{E}[\frac{I(A=a, C=0)Y}{f(C,A|L)}] ,
\]

就直接可以得出结果了.

8.6 Selection without bias

这一节讲了给定\(Y\)的情况下, \(A, E\)产生关联的不同情况.

Fine Point

Selection bias in case-control studies

The strength and direction of selection bias

Technical Point

THe built-in selection bias of hazard bias

Multiplicative survival model

\[\mathrm{Pr}[Y=0|E=e, A=a] = g(e)h(a), \\
\mathrm{Pr}[Y=1|E=e, A=a] = 1 - g(e)h(a). \\
\]

Chapter 8 Selection Bias的更多相关文章

  1. Chapter 9 Measurement Bias

    目录 9.1 Measurement Error The structure of measurement error 9.3 Mismeasured confounders 9.4 Intentio ...

  2. Cross-Validation & Nested Cross-Validation

    分享stackexchange的一篇问答:https://stats.stackexchange.com/questions/11602/training-with-the-full-dataset- ...

  3. 学习笔记之Machine Learning Crash Course | Google Developers

    Machine Learning Crash Course  |  Google Developers https://developers.google.com/machine-learning/c ...

  4. CFA一级知识点总结

    更多来自:   www.vipcoursea.com   Ethics 部分 Objective of codes and standard:永远是为了maintain public trust in ...

  5. Oracle12c版本中未归档隐藏参数

    In this post, I will give a list of all undocumented parameters in Oracle 12.1.0.1c. Here is a query ...

  6. 【软件分析与挖掘】ELBlocker: Predicting blocking bugs with ensemble imbalance learning

    摘要: 提出一种方法——ELBlocker,用于自动检测出Blocking Bugs(prevent other bugs from being fixed). 难度在于这些Blocking Bugs仅 ...

  7. PostgreSQL配置文件--QUERY TUNING

    5 QUERY TUNING 5.1 Planner Method Configuration. 下列参数控制查询优化器是否使用特定的存取方法.除非对优化器特别了解,一般情况下,使用它们默认值即可. ...

  8. PostgreSQL.conf文件配置详解[转]

    一.连接配置与安全认证 1.连接Connection Settings   listen_addresses (string) 这个参数只有在启动数据库时,才能被设置.它指定数据库用来监听客户端连接的 ...

  9. AB实验的高端玩法系列4- 实验渗透低?用户未被触达?CACE/LATE

    CACE全称Compiler Average Casual Effect或者Local Average Treatment Effect.在观测数据中的应用需要和Instrument Variable ...

随机推荐

  1. Shell 指定行处理head、tail、sed

    目录 Shell 指定行处理 head.tail.sed head 前几行 tail sed 删除.替换.新增.选取 案例 删除行 插入行 查看某行 替换某行 部分数据的查找并替换 读写操作 Shel ...

  2. Hadoop入门 完全分布式运行模式-准备

    目录 Hadoop运行环境 完全分布式运行模式(重点) scp secure copy 安全拷贝 1 hadoop102上的JDK文件推给103 2 hadoop103从102上拉取Hadoop文件 ...

  3. 『学了就忘』Linux启动引导与修复 — 68、Linux系统运行级别

    目录 1.Linux系统运行级别介绍 2.查看运行级别 3.修改当前系统的运行级别 4.系统默认运行级别 5./etc/rc.d/rc.local文件说明 1.Linux系统运行级别介绍 Linux默 ...

  4. 100个Shell脚本——【脚本8】每日生成一个文件

    [脚本8]每日生成一个文件 要求:请按照这样的日期格式(xxxx-xx-xx)每日生成一个文件,例如今天生成的文件为)2017-07-05.log, 并且把磁盘的使用情况写到到这个文件中,(不用考虑c ...

  5. Android Handler 消息机制原理解析

    前言 做过 Android 开发的童鞋都知道,不能在非主线程修改 UI 控件,因为 Android 规定只能在主线程中访问 UI ,如果在子线程中访问 UI ,那么程序就会抛出异常 android.v ...

  6. VIM中把^M替换为真正的换行符

    :%s/\r/\r/g 或者:%s/^M/\r/g 红色的^M不是直接打出,而是按住ctrl再依次按下V和M

  7. vim编码设置(转)

    vim里面的编码主要跟三个参数有关:enc(encoding).fenc(fileencoding).fence(fileencodings) fenc是当前文件的编码,也就是说,一个在vim里面已经 ...

  8. fastjson过滤多余字段

    /**     * Description:过滤实体中的字段     * @param src 需要过滤的对象,如 list,entity     * @param clazz 实体的class    ...

  9. ORACLE CACHE BUFFER CHAINS原理

    原理图如下: 一个cache buffer chains 管理多个hash bucket,受隐含参数:_db_block_hash_buckets(控制管理几个hash bucket)

  10. jquery的each和js原生for循环性能对比

    <html xmlns="http://www.w3.org/1999/xhtml"> <head runat="server"> &l ...