biobank 英国的基金数据
因果推断和不同的研究互相论证,而非一个研究得到的接了就行。
数据融合,data fusion,同一个因果问题不同数据不同结论,以及历史上的数据,来共同得到更稳健、更高效的推断。敏感性分析(评价假定的方法)。多方验证。统计中的meta analysis荟萃分析。讨论这个做法背后的模型、假定是如何解释这个结果。
敏感性分析(评价假定的方法)。
1.实现你的方法,论证你的方法;
2.论证你的模型、假定,以及解释你的结果。三者缺一不可。单单的方法是不行的。
大规模数据处理面对比较高维的数据时,skrining 作为标准预处理的一个步骤。与其配套的是敏感性分析,敏感性分析就是看你的假定,如果说错了,错到什么程度会影响结论,会得到不一样的结论;二者是配套的,也即你有一个抢的假定,同时也要有一个,评价假定的方法--敏感性分析。
相关的主要目的是为了做预测,只要预测好就行。因果关系母的不一样,因果关系要特别在意解释型;要直到到底哪些因素导致了明天的股票上涨。相关的主要目的是为了做预测,只要预测好就行。因果关系母的不一样,因果关系要特别在意解释型;要直到到底哪些因素导致了明天的股票上涨。
时空数据相关的发展到了什么程度?最近的一些进展?也即时序数据上有一套不太一样的因果推断方法,如果把这样的方法放到时空数据里面,是否也有一套比较特定的好方法来解决它?时空数据、相关性数据的因果推断。
confounding,selective bias为第一梯队要研究的,inference,midiation,ide,以及异质化为第二梯队要研究的。真正的拿因果关系的因素去预测,不一定比用相关关系的预测效果更好。
二者的目标不太一致;ML:主要关注的是预测、分类等类似的问题;而因果推断天生的就是关注模型的解释性,参数的识别性,定义,因果参数,因果的意义是什么;二者目标不太一致。对于预测来讲,你拿真正的因果关系去预测,不一定比拿相关关系去预测更好。反之,相关关系不能代表因果关系。当然现在大家正在把可解释性和可预测性,预测能力结合在一起;这可能是因果推断和深度学习能够深入融合的地方,而不仅仅是换汤不换药的模式。如何把预测、可解释性、参数的推断把目标给融合到一起,可能是一个方向。需要找到一条线,使得预测的目标和因果推理的目标能够对齐。之前做预测可能相对来讲大家再用一个比较简单的数据集(e.g. i.i.d,随机分割等这样的交叉验证的数据集来做,),正是由于此导致今天很多的方法,在不符合这个假定条件下的真实的场景下边就会出现各种问题 。因果推理和ML里面都有很多的假定。假如把这个假定换一下,换的更实用些、更realistic,可能就需要用一些更本质的统计的逻辑或结构可能才能够做到这种事情;这种情况下可能更需要去借鉴一些更严格的统计的手段和方法来解决这样的问题。让ML或预测更加的stable。
除了读书教书方面,学术研究有几个方面让其收益很大;1.写作交流表达能力一定要重视起来,记录单词,积累句子等。2.拓宽自己的视野;不一定只是盯着前沿的东西,一定要对自己所在的领域有一个全局的认识。3.扩展一些兴趣,应用方面的以及交叉领域相关领域的一些事情,来拓宽自己的视野;不同的问题、方法交汇融合。4.加强阅读,多读多写。

青源Talk第8期|苗旺:因果推断,观察性研究和2021年诺贝尔经济学奖的更多相关文章

  1. 【因果推断经典论文】Direct and Indirect Effects - Judea Pearl

    Direct and Indirect Effects Author: Judea Pearl UAI 2001 加州大学洛杉矶分校 论文链接:https://dl.acm.org/doi/pdf/1 ...

  2. Spark Streaming源码解读之Receiver生成全生命周期彻底研究和思考

    本期内容 : Receiver启动的方式设想 Receiver启动源码彻底分析 多个输入源输入启动,Receiver启动失败,只要我们的集群存在就希望Receiver启动成功,运行过程中基于每个Tea ...

  3. 一位IT牛人的十年经验之谈

    1.分享第一条经验:“学历代表过去.能力代表现在.学习力代表未来.” 其实这是一个来自国外教育领域的一个研究结果.相信工作过几年.十几年的朋友对这个道理有些体会吧.但我相信这一点也很重要:“重要的道理 ...

  4. 2017TSC世界大脑与科技峰会,多角度深入探讨关于大脑意识

    TSC·世界大脑与科技峰会是全世界范围内的集会,多角度深入探讨关于大脑意识体验来源这一根本话题,我们是谁,现实的本质是什么,我们所处宇宙空间的本质为何.该峰会由亚利桑那大学意识研究中心主办. 会议时间 ...

  5. 一位IT男的7年工作经验总结

    一位IT男的7年工作经验总结 1.分享第一条经验:"学历代表过去.能力代表现在.学习力代表未来." 其实这是一个来自国外教育领域的一个研究结果.相信工作过几年.十几年的朋友对这个道 ...

  6. 习题集1b: 额外练习 (可选)

    1.练习:4.样本特点 用来描述样本的数字叫做? □ 参数   (√)□ 统计量 □ 变量 □ 常数 2.练习:5.大一学生体重情况 Freidman 博士在一所大学任教,她记录了所在大学每位大一新生 ...

  7. 习题集1a:研究方法入门

    1.课程实践编号 课程实践编号 随着对习题集“PS 1a:研究方法入门”和其他习题集的了解,你可能会发现进度栏中的习题编号并非一直是连续的. 对于存在两个习题集的课程,如果一个习题集看上去“缺失”习题 ...

  8. Framingham风险评估

    Framingham风险评分: Framingham 心脏研究和其他流行病学队列研究改变了20世纪后半部分对疾病的关注点,即从治疗已经存在的心血管疾病到预防处于疾病危险的状态.该策略的关键因素是识别那 ...

  9. AI Gossip

    本文作者:七牛云人工智能实验室-林亦宁原文地址:https://zhuanlan.zhihu.com/p/26168331 什么是智能 回到几万年前的东非大草原,谁能意识到,那个到处被欺负的,被表哥从 ...

随机推荐

  1. 【FAQ】运动健康服务REST API接口使用过程中常见问题和解决方法总结

    华为运动健康服务(HUAWEI Health Kit)为三方生态应用提供了REST API接口,通过其接口可访问数据库,为用户提供运动健康类数据服务.在实际的集成过程中,开发者们可能会遇到各种问题,这 ...

  2. python爬虫之JS逆向

    Python爬虫之JS逆向案例 由于在爬取数据时,遇到请求头限制属性为动态生成,现将解决方式整理如下: JS逆向有两种思路: 一种是整理出js文件在Python中直接使用execjs调用js文件(可见 ...

  3. JVM学习笔记-从底层了解程序运行(二)

    解决JVM运行中的问题 一个案例理解常用工具 测试代码: /** * 从数据库中读取信用数据,套用模型,并把结果进行记录和传输 */ public class T15_FullGC_Problem01 ...

  4. 强化学习-学习笔记8 | Q-learning

    上一篇笔记认识了Sarsa,可以用来训练动作价值函数\(Q_\pi\):本篇来学习Q-Learning,这是另一种 TD 算法,用来学习 最优动作价值函数 Q-star,这就是之前价值学习中用来训练 ...

  5. MyBatis项目创建

    一.开发环境的准备 总览: mybatis搭建过程: 1.导入jar 2.创建mybatis的核心(全局)配置文件mybatis-config.xml,并配置 3.创建映射文件XxxMapper.xm ...

  6. 静态static关键字修饰成员方法和静态static的内存图

    当 static 修饰成员方法时,该方法称为类方法 .静态方法在声明中有 static ,建议使用类名来调用,而不需要 创建类的对象.调用方式非常简单 ~类方法:使用 static关键字修饰的成员方法 ...

  7. 全面吃透JAVA Stream流操作,让代码更加的优雅

    全面吃透JAVA Stream流操作,让代码更加的优雅 在JAVA中,涉及到对数组.Collection等集合类中的元素进行操作的时候,通常会通过循环的方式进行逐个处理,或者使用Stream的方式进行 ...

  8. String类型函数传递问题

    String类型函数传递问题 问题 以前没有注意过的一个问题, 最近在使用String类型作为函数入参的时候, 发现函数内对于String类型的改变并不会影响到外层调用对象本身; 结论 (先说结论) ...

  9. 小C的记事本_via牛客网

    题目 链接:https://ac.nowcoder.com/acm/contest/28537/G 来源:牛客网 时间限制:C/C++ 2秒,其他语言4秒 空间限制:C/C++ 131072K,其他语 ...

  10. @DS("slave") 多数据源兼容事务问题解决方案

    SpringBoot项目中用到多数据源,在方法上又必须加事务处理,此时可以对使用了@DS的方法或类添加@Transactional并添加事务隔离级别 举例: 1.这是一个方法,方法内需要实现多数据源查 ...