FDR校正
一、假设检验
假设检验的基本思路是:
设立零假设(null hypothesis)H0,以及与零假设H0相对应的非零假设(alternative hypothesis)H1,在假设H0成立的前提下,计算出H0发生的概率,若H0的发生概率很低,基于小概率事件几乎不可能发生,所以可以拒绝零假设。
科学研究一般会把我们希望得到的结论当作非零假设,而期望否定的结论当作零假设。只要我们证明零假设发生的概率很小,我们就有理由拒绝零假设,从而接受非零假设。
例如,我希望得到的结论是早上能够八点起床。那么零假设可以设为:早上八点起不来,如果我计算出来早上八点起不来床的概率非常低,我们就可以接受非零假设:我能够八点起床。
二、假阳性
假阳性:简单打个比喻,就是你本来健健康康的,却被辣鸡医院检测出来你得了病,这就是假阳性。
假阳性率:是对于所有阳性的样本而言,其中是假阳性的有多少。比如,公司体检100个人,检测出来10个人有病,但真正有病的是8个人,那么假阳性率就是0.2。
三、 p值和q值
p值衡量的是原本我们应该接受H0,但实际接受的是H1的概率,它是针对单次统计推断的一个置信度评估。还是之前的例子,如果p=0.05,意味着:能够八点起床 这个假设出错的概率为5%。
q值衡量的是在进行多次统计推断后的假阳性率。
四、 FDR校正
之前的例子中,如果我们检验次数多达10000次,那么犯错的概率将500多次。这里虽然犯错的概率没变(5%),但是随着检验次数的增多,我们犯错的次数增多了。因此就需要多重检验校正来减低假阳性的次数。
FDR校正就是为了控制假阳性率。例如,对应于脑网络研究中,假设大脑总共有10000个体素,通过假设检验发现有2000个体素的P<0.05。那么FDR<0.02说的是在2000个激活的体素中,假阳性的体素不超过2000*0.02=40个。
五、 如何计算FDR
使用最多的是Benjaminiand Hochberg的方法,简称BH法。
BH 方法首先对p值进行升序排列,对于给定的阈值的,找到最大的k值,使得:q = (p*m)/k <α成立
其中的p为p值,m为检验次数,k为此次检验的p值在所有检验次数中的排名。
假设检验了5次 ,阈值α=0.05 ,按p值的大小升序排列
p(1) = 0.01 p(2) = 0.015 p(3) = 0.02 p(4) = 0.025 p(5) = 0.03
q(1) = (0.01*5)/1 = 0.05 q(2) = (0.015*5)/2 = 0.0375
q(3) = (0.02*5)/3 = 0.0333 q(4) = (0.025*5)/4 = 0.03125
q(5) = (0.03*5)/5 = 0.03
所以最大的k为3,即认为在FDR<0.05的情况下,1、2、3可以视作为真阳性。对应于脑网络中的那个例子,原本是五个体素都激活,但
经过FDR校正之后,只有3个激活了。
FDR校正的更多相关文章
- 学习笔记50—多重假设检验与Bonferroni校正、FDR校正
总结起来就三句话: (1)当同一个数据集有n次(n>=2)假设检验时,要做多重假设检验校正 (2)对于Bonferroni校正,是将p-value的cutoff除以n做校正,这样差异基因筛选的p ...
- matlab FDR校正
http://home.52brain.com/forum.php?mod=viewthread&tid=27066&page=1#pid170857 http://www.mathw ...
- SPM FDR校正
来源: http://blog.sciencenet.cn/blog-479412-572049.html,http://52brain.com/thread-15512-1-1.html SPM8允 ...
- 学习笔记49—matlab FDR校正
matlab自带函数mafdr,当ttest数较多时,可直接用[FDR, Q]=mafdr(P):但是Storey procedure在p值少于1000个时会崩溃,此时应改用BH FDR方法:mafd ...
- 假设检验:p-value,FDR,q-value
来源:http://blog.sina.com.cn/s/blog_6b1c9ed50101l02a.html,http://wenku.baidu.com/link?url=3mRTbARl0uPH ...
- MCP|MZL|Accurate Estimation of Context- Dependent False Discovery Rates in Top- Down Proteomics 在自顶向下蛋白组学中精确设定评估条件估计假阳性
一. 概述: 自顶向下的蛋白质组学技术近年来也发展成为高通量蛋白定性定量手段.该技术可以在一次的实验中定性上千种蛋白,然而缺乏一个可靠的假阳性控制方法阻碍了该技术的发展.在大规模流程化的假阳性控制手段 ...
- 浅谈多重检验校正FDR
浅谈多重检验校正FDR Posted: 四月 12, 2017 Under: Basic By Kai no Comments 例如,在我们对鉴定到的差异蛋白做GO功能注释后,通常会计算一个p值 ...
- FDR错误发现率-P值校正学习[转载]
转自:https://baike.baidu.com/item/FDR/16312044?fr=aladdin https://blog.csdn.net/taojiea1014/article/d ...
- regression | p-value | Simple (bivariate) linear model | 线性回归 | 多重检验 | FDR | BH | R代码
P122, 这是IQR method课的第一次作业,需要统计检验,x和y是否显著的有线性关系. Assignment 1 1) Find a small bivariate dataset (pref ...
随机推荐
- Netty源码解析 -- 事件循环机制实现原理
本文主要分享Netty中事件循环机制的实现. 源码分析基于Netty 4.1 EventLoop 前面分享服务端和客户端启动过程的文章中说过,Netty通过事件循环机制(EventLoop)处理IO事 ...
- 【Java GC系列】垃圾收集简介(1)
说明: 在本文中, Garbage Collection 翻译为 "垃圾收集", garbage collector 翻译为 "垃圾收集器"; 一般认为, 垃圾 ...
- JIRA、Confluence等产品明年2月停售本地化版本,将影响中国近90%的客户!
作为目前应用最为广泛的软件开发管理软件,JIRA.Confluence等产品几乎被所有的科技型公司所应用.我们的每天的任务管理.文档编写等工作几乎都在这些软件的帮助下进行和管理.当然我也不例外,在读书 ...
- Python中列表逆序
1.list.reverse() 该方法是直接在原来的列表里面将元素进行逆序排列,不需要创建新的副本用于存储结果. 这种方式,有好处也有坏处.好处是节省内存使用,因为我们不需要重新申请空间来保存最后的 ...
- 利用GitHub和Hexo打造免费的个人博客
每个程序猿都需要一个个人博客,目前广泛出现在大家视野里的有CSDN.博客园.简书,但是他们却没有给用户一个专属的站点.一个好记的域名.你需要一个https://xxx.xxx.xxx/格式的网址,一个 ...
- EF6 Code First 博客学习记录
学习一下ef6的用法 这个学习过程时按照微软官网的流程模拟了一下 就按照下面的顺序来写吧 1.连接数据库 自动生成数据库 2.数据库迁移 3.地理位置以及同步/异步处理(空了再补) 4.完全自动迁移 ...
- 对ESP8266的例子进行编译时报错check_python_dependencies的问题的解决
尝试对ESP8266的例子进行编译时报错: make: *** 没有规则可制作目标"check_python_dependencies" 解决方法: 1.安装python pip包 ...
- 内网渗透 day9-免杀基础
免杀1 目录 1. 会话提升的几种方式 1 2. armitage的熟悉 2 3. handler生成监听器的方法 6 4. 防止会话假死 6 5. 控制台设置编码 7 6. upx加壳 7 7. m ...
- Uipath_考证学习之路
写在前面 第一次考证的时候,就是为了考证而考证,从网上获取了试题,修改了一下,就通过了,对 REFramework的了解甚少,经过几周的学习,决定赶在 4.30号考证收费之前再重新考一次. 原文章发表 ...
- java-Queue方法
Collection>Queue // 1. 新增 add/ offer boolean add(E e); // 队列满,IllegalStateException boolean offer ...