【转载】Fisher精确检验的通俗理解
一直以来都很欣赏把东西讲得通俗简单的文章,今天碰巧翻到一篇,
讲Fisher检验的,内容虽然不深,但是体验很好,能感受到作者想方设法想要读者明白的那种心思~
Fisher精确检验原理描述:
假设检验用来检验一次随机实验的结果是否支持对于某个随机实验的假设。具体如下:随机事件发生的概率小于0.05则认定该事件为小概率事件。一般原则认为在某个假设前提下,一次随机实验的结果不会出现小概率事件。若一次随机实验的结果出现了小概率事件则认定该假设不被支持。
- 理论依据是:超几何分布(无放回产品抽样实验):非卡方检验的范畴。超几何分布的一个形象例子是:有N件物品,M件为次品,求取n件,其中有k件为次品的概率。=(M,k)*(N-M,n-k)/(N,n)
- 基本思想是:在2*2列联表中,四格表周边和(即边际分布)计数固定不变的条件下,计算表内4个实际频数变动时的各种组合之概率Pi;而这个具体的实例可以分解出8个类似产品抽样实验的具体实例结果。根据给出的数据可以计算出每个抽样结果基于假设的超几何分布概率。根据其中之一抽样结果的概率,通过假设检验的原则即可推定假设是否成立。
注:以上两条来源:http://blog.sina.com.cn/s/blog_6b1c9ed50101kh2f.html
超几何分布是统计学上一种离散概率分布。它描述了由有限个物件中抽出n个物件,成功抽出指定种类的物件的次数(不归还)。称为超几何分布,是因为其形式与“超几何函数”的级数展式的系数有关。
例如 判断节食与性别是否相关:
男 女
节食 a b
不节食 c d
四格表周边和(即边际分布)计数固定不变的条件下(男性总数固定(a+c),女性总数不变(b+d),节食总人数不变(a+b),不节食总人数不变(c+d)),可以分解出下列超几何分布抽样:
- 一共 (a+b+c+d)人,其中男性(a+c)人, 节食有(a+b)人,则其中节食男性为a人的概率;
- 一共 (a+b+c+d)人,其中男性(a+c)人, 不节食有(c+d)人,则其中不节食男性为c人的概率;
3. 一共 (a+b+c+d)人,其中女性(b+d)人, 节食有(a+b)人,则其中节食女性为b人的概率;
4. 一共 (a+b+c+d)人,其中女性(b+d)人, 不节食有(c+d)人,则其中不节食女性为d人的概率;
5. 一共 (a+b+c+d)人,其中节食(a+b)人, 男性(a+c)人,则其中节食男性为a人的概率;
6. 一共 (a+b+c+d)人,其中节食(a+b)人, 女性(b+d)人,则其中节食女性为b人的概率;
7. 一共 (a+b+c+d) 人,其中不节食(c+d)人, 男性(a+c)人,则其中不节食男性为c人的概率;
8. 一共 (a+b+c+d)人,其中不节食(c+d)人, 女性(b+d)人,则其中不节食女性为d人的概率;
Fisher精确检验是统计显著性检验方法,用于检查两个二进制变量的相关性。所谓二进制变量就是变量的值域只有两个值,例如:性别为男或女;在特定场景下规定变量只有两个可用值,如:规定出行方式为火车或飞机,收入为高或低等。
Fisher精确检验的例子:
1. 两个候选人的得票是否和投票人性别相关。
2. 性别和是否节食是否相关。
3. 收入高低是否和出行方式(火车/飞机)相关。
Fisher精确检验适用于样本量n<40或者理论频数T<1的情况。
其中n为22列联表的实际发生的总频数(a+b+c+d),理论频数T是指如果原假设成立则每个格子中理论上应该出现的频数。
对于上述22列联表而言:a,b,c,d是实际测试的各个格子实际发生的频数,n为22列联表的实际发生的总频数(a+b+c+d)
理论频数是指总体的频数,可以根据检验假设的样本数据推断出近似值。 具体方法是,假设原假设成立,两组样本数据差别仅是由抽样误差所致,则两组样本数据的并集的男性所占比率可以作为总体数据中男性所占比率,即理论频率,如下例:
男 女
节食&不节食 a+c b+d ----- 男性所占比率:P=(a+c)/n
则 总体理论上男的所占频率(比率)可以用 P 来近似表示。因为原假设成立节食与否与男女性别无关,因此在节食的人中男性比率也应该是P。以此为依据便可推算出四格表中相应的四格的理论数。对于a格的理论频数 (a+b)P = (a+b)(a+c)/n,即所在行的频数之和所在列的频数之和/总频数。
【转载】Fisher精确检验的通俗理解的更多相关文章
- Fisher精确检验【转载】
转自:https://en.wikipedia.org/wiki/Fisher%27s_exact_test https://www.cnblogs.com/Dzhouqi/p/3440575.htm ...
- fisher精确检验(fisher’s exat test)和超几何分布
- 通俗理解T检验和F检验
来源: http://blog.sina.com.cn/s/blog_4ee13c2c01016div.html 1,T检验和F检验的由来 一般而言,为了确定从样本(sample)统计结果推论至总 ...
- 通俗理解T检验与F检验的区别【转】
转自:http://blog.sina.com.cn/s/blog_4ee13c2c01016div.html1,T检验和F检验的由来一般而言,为了确定从样本(sample)统计结果推论至总体时所犯错 ...
- Fisher's exact test( 费希尔精确检验)
Fisher's exact test[1][2][3] is a statistical significance test used in the analysis ofcontingency t ...
- Effective Java通俗理解(下)
Effective Java通俗理解(上) 第31条:用实例域代替序数 枚举类型有一个ordinal方法,它范围该常量的序数从0开始,不建议使用这个方法,因为这不能很好地对枚举进行维护,正确应该是利用 ...
- CNN笔记:通俗理解卷积神经网络【转】
本文转载自:https://blog.csdn.net/v_july_v/article/details/51812459 通俗理解卷积神经网络(cs231n与5月dl班课程笔记) 1 前言 2012 ...
- CNN笔记:通俗理解卷积神经网络
CNN笔记:通俗理解卷积神经网络 2016年07月02日 22:14:50 v_JULY_v 阅读数 250368更多 分类专栏: 30.Machine L & Deep Learning 机 ...
- 范式通俗理解:1NF、2NF、3NF和BNCF
https://blog.csdn.net/wyh7280/article/details/83350722 范式通俗理解:1NF.2NF.3NF和BNCF原创hongiii 最后发布于2018-10 ...
- Redis Hyperloglog的原理及数学理论的通俗理解
redis中有一种数据格式,hyperloglog,本文就此数据结构的作用.redis的实现及其背后的数学原理作一个整理.当然本文不包含任何数学公式,而是希望用直观的例子帮大家理解. 主要内容如下: ...
随机推荐
- A表某字段==B表某字段 更新A表的数据
update mls_supplytask t1 -- 供应商认证任务 JOIN mls_sup_cert_report t2 -- 供应商认证报告 on t1.id = t2.certTaskId ...
- C++的switch/case,需要大括号
如果,switch/case的某一条case语句包含初始化定义变量,例如int i. 那么case后面的语句,需要用大括号包装起来. 原因如下: https://stackoverflow.com/q ...
- Fortran笔记之过程重载,多态,泛型编程
参考自Introduction to Modern Fortran for the Earth System Sciences 过程重载 OOP中的另一个重要技术是过程重载(Procedure Ove ...
- ADT 更新遇到的一个BUG解决方案【转】
蠻長一陣子沒有更新ADT,正好Android 5.0 Release有一段時間,就順勢更新: 當按下Next後進行更新ADT 23.0.4 途中卻發生如下圖的問題: An error occurred ...
- Oracle JDK 和 OpenJDK 有什么区别?
OpenJDK是Sun在2006年末把Java开源而形成的项目,这里的"开源"是通常意义上的源码开放形式,即源码是可被复用的,例如IcedTea.UltraViolet都是从Ope ...
- Unit mysqld.service could not be found.
具体命令 service mysqld status systemctl status mysqld 结果 Unit mysqld.service could not be found. 查看mysq ...
- 权昌TSC条码打印机终极使用教程与开发版本代码大全
本教程使用的打印机型号:TSC TTP-244 Plus 官方文档 一.TSC打印机安装 1.机器安装 根据官方快速安装指南安装打印机,此处不详细说明,也可以看视频教程,唯一需要注意的地方就是碳带的方 ...
- Echarts中国地图下钻
//各省份的地图json文件 var provinces = { '上海': '/asset/get/s/data-1482909900836-H1BC_1WHg.json', '河北': '/ass ...
- Solution - ARC152D Halftree
首先 \(n\) 为偶数时无解,这是显然的,因为一次加两条边,总边数一定是偶数. 下面我们证明 \(n\) 为奇数时一定有解,直接进行构造. 首先将每一个点编号加上 \(k\) 再模 \(n\) 的答 ...
- 397. 整数替换 (Medium
问题描述 397. 整数替换 (Medium) 给定一个正整数 n ,你可以做如下操作: 如果 n 是偶数,则用 n / 2 替换 n. 如果 n 是奇数,则可以用 n + 1 或 n - 1 替换 ...