Chapter 8 Selection Bias
上一章讲了confounding, 这种bias来源于treatment和outcome受同一个未观测的cause影响, 但是这种bias在随机实验中可以避免.
这一章要讲的试selection bias, 即便是在随机试验中, 也无法避免.
8.1 The structure of selection bias

这里, 作者给出了一个非常好的例子, 如上图所示:
\(A \in \{0, 1\}\) 表示是否注射叶酸, 而\(Y \in \{0, 1\}\) 表示胎儿是否心脏畸形, 而\(C \in \{0, 1\}\)则表示是否死亡.
这里, 虽然是否注射叶酸, 我们是随机选择的, 但是在实际调查中, 只有顺利出生(\(C=0\))的才会被记录是否心脏畸形.
所以, 我们必须在\(C=0\)的条件下估计causal effect.
但是注意到, \(A\)存在指向\(C\)的箭头(即\(A=1\)会降低死亡的风险).
此时, \(Y^a\)和\(A\)在给定\(C=1\)的条件下并不独立.
这就是本章讲的selection bias.
8.2 Examples of selection bias
8.3 Selection bias and confounding
8.4 Selection bias and censoring
虽然我们只有\(C=0\)的情况, 我们可以把\(C\)也看出一个treatment, 则我们只需要关注
\]
即可.

8.5 How to adjust for selection bias

如何计算\(\mathbb{E}[Y^{a, c=0}]\), 这一节给出的是一种特殊的IP weighting的方法, 说实话没怎么看懂, 这里以上图为例给出我自己的理解.
=
\sum_l \sum_y \frac{I(A=a, C=0)Y}{f(C=0|A=a,L=l)} \mathrm{Pr}[Y|a,c,l] \mathrm{Pr}[C=0|a,l] \mathrm{Pr}[A=a, L=l] \\
=
\sum_l \sum_y I(A=a, C=0)Y^{a,0} \mathrm{Pr}[Y^{a,0}|l] \mathrm{Pr}[A=a, L=l] \\
=
\mathbb{E} [Y^{a, c=0}] \mathrm{Pr}[A=a].
\]
其实, 个人感觉如果是
\]
就直接可以得出结果了.
8.6 Selection without bias

这一节讲了给定\(Y\)的情况下, \(A, E\)产生关联的不同情况.
Fine Point
Selection bias in case-control studies
The strength and direction of selection bias
Technical Point
THe built-in selection bias of hazard bias
Multiplicative survival model
\mathrm{Pr}[Y=1|E=e, A=a] = 1 - g(e)h(a). \\
\]
Chapter 8 Selection Bias的更多相关文章
- Chapter 9 Measurement Bias
目录 9.1 Measurement Error The structure of measurement error 9.3 Mismeasured confounders 9.4 Intentio ...
- Cross-Validation & Nested Cross-Validation
分享stackexchange的一篇问答:https://stats.stackexchange.com/questions/11602/training-with-the-full-dataset- ...
- 学习笔记之Machine Learning Crash Course | Google Developers
Machine Learning Crash Course | Google Developers https://developers.google.com/machine-learning/c ...
- CFA一级知识点总结
更多来自: www.vipcoursea.com Ethics 部分 Objective of codes and standard:永远是为了maintain public trust in ...
- Oracle12c版本中未归档隐藏参数
In this post, I will give a list of all undocumented parameters in Oracle 12.1.0.1c. Here is a query ...
- 【软件分析与挖掘】ELBlocker: Predicting blocking bugs with ensemble imbalance learning
摘要: 提出一种方法——ELBlocker,用于自动检测出Blocking Bugs(prevent other bugs from being fixed). 难度在于这些Blocking Bugs仅 ...
- PostgreSQL配置文件--QUERY TUNING
5 QUERY TUNING 5.1 Planner Method Configuration. 下列参数控制查询优化器是否使用特定的存取方法.除非对优化器特别了解,一般情况下,使用它们默认值即可. ...
- PostgreSQL.conf文件配置详解[转]
一.连接配置与安全认证 1.连接Connection Settings listen_addresses (string) 这个参数只有在启动数据库时,才能被设置.它指定数据库用来监听客户端连接的 ...
- AB实验的高端玩法系列4- 实验渗透低?用户未被触达?CACE/LATE
CACE全称Compiler Average Casual Effect或者Local Average Treatment Effect.在观测数据中的应用需要和Instrument Variable ...
随机推荐
- MySQL自我保护参数
上文(MySQL自我保护工具--pt-kill )提到用pt-kill工具来kill相关的会话,来达到保护数据库的目的,本文再通过修改数据库参数的方式达到阻断长时间运行的SQL的目的. 1.参数介绍 ...
- C++11的auto自动推导类型
auto是C++11的类型推导关键字,很强大 例程看一下它的用法 #include<vector> #include<algorithm> #include<functi ...
- 4.1 python中调用rust程序
概述 使用rust-cpython将rust程序做为python模块调用: 通常为了提高python的性能: 参考 https://github.com/dgrunwald/rust-cpython ...
- IDEA 超实用使用技巧分享
前言 工欲善其事 必先利其器 最近受部门的邀请,给入职新人统一培训IDEA,发现有很多新人虽然日常开发使用的是IDEA,但是还是很多好用的技巧没有用到,只是用到一些基本的功能,蛮浪费IDEA这个优 ...
- 图的存储(Java)以及遍历
// 深搜 private void dfs(int v) { visited[v] = true; System.out.print(v+" "); for (int i = 0 ...
- zabbix之修改中文
#在zabbix服务器安装中文名包 root@ubuntu:~# sudo apt-get install language-pack-zh* #:修改环境变量 root@ubuntu:~# sudo ...
- Dubbo中CompletableFuture异步调用
使用Future实现异步调用,对于无需获取返回值的操作来说不存在问题,但消费者若需要获取到最终的异步执行结果,则会出现问题:消费者在使用Future的get()方法获取返回值时被阻塞.为了解决这个问题 ...
- window 查看端口占用情况
查看哪个进程在用 netstat -aon|findstr "8080" TCP 0.0.0.0:8080 0.0.0.0:0 ...
- 图书管理系统总结——数据库操纵(二):DML语句
这里以最基本的DML语句作为例子,其他各种复杂的DML语句可以根据这些基本JDBC语句得到. 一.查询表格 这里以两张表关联查询为例,采用动态方式,根据输入的条件在WHERE语句后面接上相应的各种条件 ...
- java使用在线api实例
字符串 strUrl为访问地址和参数 public String loadAddrsApi() { StringBuffer sb; String strUrl = "https://api ...