Hern\(\'{a}\)n M. and Robins J. Causal Inference: What If.

上一章讲了confounding, 这种bias来源于treatment和outcome受同一个未观测的cause影响, 但是这种bias在随机实验中可以避免.

这一章要讲的试selection bias, 即便是在随机试验中, 也无法避免.

8.1 The structure of selection bias

这里, 作者给出了一个非常好的例子, 如上图所示:

\(A \in \{0, 1\}\) 表示是否注射叶酸, 而\(Y \in \{0, 1\}\) 表示胎儿是否心脏畸形, 而\(C \in \{0, 1\}\)则表示是否死亡.

这里, 虽然是否注射叶酸, 我们是随机选择的, 但是在实际调查中, 只有顺利出生(\(C=0\))的才会被记录是否心脏畸形.

所以, 我们必须在\(C=0\)的条件下估计causal effect.

但是注意到, \(A\)存在指向\(C\)的箭头(即\(A=1\)会降低死亡的风险).

此时, \(Y^a\)和\(A\)在给定\(C=1\)的条件下并不独立.

这就是本章讲的selection bias.

8.2 Examples of selection bias

8.3 Selection bias and confounding

8.4 Selection bias and censoring

虽然我们只有\(C=0\)的情况, 我们可以把\(C\)也看出一个treatment, 则我们只需要关注

\[Y^{a, c=0},
\]

即可.

8.5 How to adjust for selection bias

如何计算\(\mathbb{E}[Y^{a, c=0}]\), 这一节给出的是一种特殊的IP weighting的方法, 说实话没怎么看懂, 这里以上图为例给出我自己的理解.

\[\mathbb{E}[\frac{I(A=a, C=0)Y}{f(C|A,L)}] \\
=
\sum_l \sum_y \frac{I(A=a, C=0)Y}{f(C=0|A=a,L=l)} \mathrm{Pr}[Y|a,c,l] \mathrm{Pr}[C=0|a,l] \mathrm{Pr}[A=a, L=l] \\
=
\sum_l \sum_y I(A=a, C=0)Y^{a,0} \mathrm{Pr}[Y^{a,0}|l] \mathrm{Pr}[A=a, L=l] \\
=
\mathbb{E} [Y^{a, c=0}] \mathrm{Pr}[A=a].
\]

其实, 个人感觉如果是

\[\mathbb{E}[\frac{I(A=a, C=0)Y}{f(C,A|L)}] ,
\]

就直接可以得出结果了.

8.6 Selection without bias

这一节讲了给定\(Y\)的情况下, \(A, E\)产生关联的不同情况.

Fine Point

Selection bias in case-control studies

The strength and direction of selection bias

Technical Point

THe built-in selection bias of hazard bias

Multiplicative survival model

\[\mathrm{Pr}[Y=0|E=e, A=a] = g(e)h(a), \\
\mathrm{Pr}[Y=1|E=e, A=a] = 1 - g(e)h(a). \\
\]

Chapter 8 Selection Bias的更多相关文章

  1. Chapter 9 Measurement Bias

    目录 9.1 Measurement Error The structure of measurement error 9.3 Mismeasured confounders 9.4 Intentio ...

  2. Cross-Validation & Nested Cross-Validation

    分享stackexchange的一篇问答:https://stats.stackexchange.com/questions/11602/training-with-the-full-dataset- ...

  3. 学习笔记之Machine Learning Crash Course | Google Developers

    Machine Learning Crash Course  |  Google Developers https://developers.google.com/machine-learning/c ...

  4. CFA一级知识点总结

    更多来自:   www.vipcoursea.com   Ethics 部分 Objective of codes and standard:永远是为了maintain public trust in ...

  5. Oracle12c版本中未归档隐藏参数

    In this post, I will give a list of all undocumented parameters in Oracle 12.1.0.1c. Here is a query ...

  6. 【软件分析与挖掘】ELBlocker: Predicting blocking bugs with ensemble imbalance learning

    摘要: 提出一种方法——ELBlocker,用于自动检测出Blocking Bugs(prevent other bugs from being fixed). 难度在于这些Blocking Bugs仅 ...

  7. PostgreSQL配置文件--QUERY TUNING

    5 QUERY TUNING 5.1 Planner Method Configuration. 下列参数控制查询优化器是否使用特定的存取方法.除非对优化器特别了解,一般情况下,使用它们默认值即可. ...

  8. PostgreSQL.conf文件配置详解[转]

    一.连接配置与安全认证 1.连接Connection Settings   listen_addresses (string) 这个参数只有在启动数据库时,才能被设置.它指定数据库用来监听客户端连接的 ...

  9. AB实验的高端玩法系列4- 实验渗透低?用户未被触达?CACE/LATE

    CACE全称Compiler Average Casual Effect或者Local Average Treatment Effect.在观测数据中的应用需要和Instrument Variable ...

随机推荐

  1. 日常Java 2021/10/20

    Java提供了一套实现Collection接口的标准集合类 bstractCollection 实现了大部分的集合接口. AbstractList 继承于AbstractCollection并且实现了 ...

  2. java中类实现Serializable接口的原因

    背景:一个java中的类只有实现了Serializable接口,它的对象才是可序列化的.如果要序列化某些类的对象,这些类就必须实现Serializable接口.Serializable是一个空接口,没 ...

  3. 【Go】【Basic】MacOS上搭建GO开发环境

    1. GO下载 1.1. 下载地址:https://www.golangtc.com/download (需要科学上网) 1.1.1. PKG安装: 下载这个包:go1.9.2.darwin-amd6 ...

  4. go 代理

    环境变量中设置 #GO111MODULE=auto GOPROXY=https://goproxy.io 如果不第一次,则在命令行设置 go env -w GO111MODULE=on go env ...

  5. Dubbo中CompletableFuture异步调用

    使用Future实现异步调用,对于无需获取返回值的操作来说不存在问题,但消费者若需要获取到最终的异步执行结果,则会出现问题:消费者在使用Future的get()方法获取返回值时被阻塞.为了解决这个问题 ...

  6. springboot中如何向redis缓存中存入数据

    package com.hope;import com.fasterxml.jackson.core.JsonProcessingException;import com.fasterxml.jack ...

  7. AI 2021 年度报告

    建议大伙有空还是自己亲自读一下,虽然有点长,188页ppt. https://docs.google.com/presentation/d/1bwJDRC777rAf00Drthi9yT2c9b0Ma ...

  8. Nginx模块之stub_status

    目录 一.介绍 二.使用 三.参数 一.介绍 Nginx中的stub_status模块主要用于查看Nginx的一些状态信息. 当前默认在nginx的源码文件中,不需要单独下载 二.使用 本模块默认是不 ...

  9. 别被调查汇总郁闷到——有Excel呢!

    年初的某天,我在家待得好好的,好吧,其实也不是待得好好的,这事大家都知道,新冠病毒嘛,都锁家里了,还好本妖向来宅--呃--跑题了--肥来! 其实我能在家好好地待着,有水有电有Wi-Fi,那是有多少人冒 ...

  10. 日历优先级(Project)

    <Project2016 企业项目管理实践>张会斌 董方好 编著 好了,这下我们一共有三个日历了:"项目日历"(默认的日历)."任务日历"(与任务关 ...