一直以来都很欣赏把东西讲得通俗简单的文章,今天碰巧翻到一篇,

讲Fisher检验的,内容虽然不深,但是体验很好,能感受到作者想方设法想要读者明白的那种心思~

原文在这里:

https://blog.csdn.net/z54572/article/details/61199246[https://blog.csdn.net/z54572/article/details/61199246]

Fisher精确检验原理描述:

假设检验用来检验一次随机实验的结果是否支持对于某个随机实验的假设。具体如下:随机事件发生的概率小于0.05则认定该事件为小概率事件。一般原则认为在某个假设前提下,一次随机实验的结果不会出现小概率事件。若一次随机实验的结果出现了小概率事件则认定该假设不被支持。

  1. 理论依据是:超几何分布(无放回产品抽样实验):非卡方检验的范畴。超几何分布的一个形象例子是:有N件物品,M件为次品,求取n件,其中有k件为次品的概率。=(M,k)*(N-M,n-k)/(N,n)
  1. 基本思想是:在2*2列联表中,四格表周边和(即边际分布)计数固定不变的条件下,计算表内4个实际频数变动时的各种组合之概率Pi;而这个具体的实例可以分解出8个类似产品抽样实验的具体实例结果。根据给出的数据可以计算出每个抽样结果基于假设的超几何分布概率。根据其中之一抽样结果的概率,通过假设检验的原则即可推定假设是否成立。

注:以上两条来源:http://blog.sina.com.cn/s/blog_6b1c9ed50101kh2f.html

超几何分布是统计学上一种离散概率分布。它描述了由有限个物件中抽出n个物件,成功抽出指定种类的物件的次数(不归还)。称为超几何分布,是因为其形式与“超几何函数”的级数展式的系数有关。

例如 判断节食与性别是否相关:

                 男        女

节食          a         b

不节食         c         d

四格表周边和(即边际分布)计数固定不变的条件下(男性总数固定(a+c),女性总数不变(b+d),节食总人数不变(a+b),不节食总人数不变(c+d)),可以分解出下列超几何分布抽样:

  1. 一共 (a+b+c+d)人,其中男性(a+c)人, 节食有(a+b)人,则其中节食男性为a人的概率;
  2. 一共 (a+b+c+d)人,其中男性(a+c)人, 不节食有(c+d)人,则其中不节食男性为c人的概率;

    3. 一共 (a+b+c+d)人,其中女性(b+d)人, 节食有(a+b)人,则其中节食女性为b人的概率;

    4. 一共 (a+b+c+d)人,其中女性(b+d)人, 不节食有(c+d)人,则其中不节食女性为d人的概率;

    5. 一共 (a+b+c+d)人,其中节食(a+b)人, 男性(a+c)人,则其中节食男性为a人的概率;

    6. 一共 (a+b+c+d)人,其中节食(a+b)人, 女性(b+d)人,则其中节食女性为b人的概率;

    7. 一共 (a+b+c+d) 人,其中不节食(c+d)人, 男性(a+c)人,则其中不节食男性为c人的概率;

    8. 一共 (a+b+c+d)人,其中不节食(c+d)人, 女性(b+d)人,则其中不节食女性为d人的概率;

Fisher精确检验是统计显著性检验方法,用于检查两个二进制变量的相关性。所谓二进制变量就是变量的值域只有两个值,例如:性别为男或女;在特定场景下规定变量只有两个可用值,如:规定出行方式为火车或飞机,收入为高或低等。

Fisher精确检验的例子:

1.   两个候选人的得票是否和投票人性别相关。

2.   性别和是否节食是否相关。

3.   收入高低是否和出行方式(火车/飞机)相关。

Fisher精确检验适用于样本量n<40或者理论频数T<1的情况。

其中n为22列联表的实际发生的总频数(a+b+c+d),理论频数T是指如果原假设成立则每个格子中理论上应该出现的频数。

对于上述2
2列联表而言:a,b,c,d是实际测试的各个格子实际发生的频数,n为22列联表的实际发生的总频数(a+b+c+d)

理论频数是指总体的频数,可以根据检验假设的样本数据推断出近似值。 具体方法是,假设原假设成立,两组样本数据差别仅是由抽样误差所致,则两组样本数据的并集的男性所占比率可以作为总体数据中男性所占比率,即理论频率,如下例:

                                男        女

   节食&不节食          a+c     b+d       ----- 男性所占比率:P=(a+c)/n

    则 总体理论上男的所占频率(比率)可以用 P 来近似表示。因为原假设成立节食与否与男女性别无关,因此在节食的人中男性比率也应该是P。以此为依据便可推算出四格表中相应的四格的理论数。对于a格的理论频数 (a+b)
P = (a+b)(a+c)/n,即所在行的频数之和所在列的频数之和/总频数。

【转载】Fisher精确检验的通俗理解的更多相关文章

  1. Fisher精确检验【转载】

    转自:https://en.wikipedia.org/wiki/Fisher%27s_exact_test https://www.cnblogs.com/Dzhouqi/p/3440575.htm ...

  2. fisher精确检验(fisher’s exat test)和超几何分布

  3. 通俗理解T检验和F检验

    来源: http://blog.sina.com.cn/s/blog_4ee13c2c01016div.html   1,T检验和F检验的由来 一般而言,为了确定从样本(sample)统计结果推论至总 ...

  4. 通俗理解T检验与F检验的区别【转】

    转自:http://blog.sina.com.cn/s/blog_4ee13c2c01016div.html1,T检验和F检验的由来一般而言,为了确定从样本(sample)统计结果推论至总体时所犯错 ...

  5. Fisher's exact test( 费希尔精确检验)

    Fisher's exact test[1][2][3] is a statistical significance test used in the analysis ofcontingency t ...

  6. Effective Java通俗理解(下)

    Effective Java通俗理解(上) 第31条:用实例域代替序数 枚举类型有一个ordinal方法,它范围该常量的序数从0开始,不建议使用这个方法,因为这不能很好地对枚举进行维护,正确应该是利用 ...

  7. CNN笔记:通俗理解卷积神经网络【转】

    本文转载自:https://blog.csdn.net/v_july_v/article/details/51812459 通俗理解卷积神经网络(cs231n与5月dl班课程笔记) 1 前言 2012 ...

  8. CNN笔记:通俗理解卷积神经网络

    CNN笔记:通俗理解卷积神经网络 2016年07月02日 22:14:50 v_JULY_v 阅读数 250368更多 分类专栏: 30.Machine L & Deep Learning 机 ...

  9. 范式通俗理解:1NF、2NF、3NF和BNCF

    https://blog.csdn.net/wyh7280/article/details/83350722 范式通俗理解:1NF.2NF.3NF和BNCF原创hongiii 最后发布于2018-10 ...

  10. Redis Hyperloglog的原理及数学理论的通俗理解

    redis中有一种数据格式,hyperloglog,本文就此数据结构的作用.redis的实现及其背后的数学原理作一个整理.当然本文不包含任何数学公式,而是希望用直观的例子帮大家理解. 主要内容如下: ...

随机推荐

  1. 1.PS基本操作

    1.图片颜色变淡 1.新建一个白色的画板 什么尺寸都可以 只要能装得下你这张图 2.把这张图拖进去放到画板上 3.在右边找到这张图的图层 更改透明度到你觉得合适的程度 (我初步估计可能20%左右吧)

  2. 吴恩达老师机器学习课程chapter09——异常检测

    吴恩达老师机器学习课程chapter09--异常检测 本文是非计算机专业新手的自学笔记,高手勿喷. 本文仅作速查备忘之用,对应吴恩达(AndrewNg)老师的机器学期课程第十五章. 目录 吴恩达老师机 ...

  3. 看K线学炒股(0803)

    高位板块的高位个股要回避,即便走反抽行情也要慎重.像容捷股份. 同是房地产行业的荣盛发展和西藏城投,差别怎么这么大?荣盛发展市净率0.4,西藏城投是4.8,市盈率更是一个天上一个地下,但股价呢?所以股 ...

  4. pdf2docx:可将 PDF 转换成 docx 文件的 Python 库

    pdf2docx:https://github.com/dothinking/pdf2docx 可将 PDF 转换成 docx 文件的 Python 库. from pdf2docx import p ...

  5. fix: because the volume group on the selected device also consist of physical volumes on other devices

    because the volume group on the selected device also consist of physical volumes on other devices 目标 ...

  6. vue 使用 swiper vue-awesome-swiper

    文档地址 https://github.com/surmon-china/vue-awesome-swiper 演示地址 https://v1.github.surmon.me/vue-awesome ...

  7. SQL Server性能优化

    源代码文件 1,什么是性能问题? 现有资源没有达到最大吞吐量的前提下,系统不能满足合理的预期表现,则可以定义为有性能问题.性能指标包括:响应时间,吞吐量,可扩展性. 2,初探优化 2.1优化论 一般遇 ...

  8. pgsql 查询结果转换为json数组

    select array_to_json(array_agg(row_to_json(t))) from (SELECT * FROM test) t

  9. 【论文写作】Vancouver style

    参考文献引用风格之 Vancouver style 需要在引用出使用阿拉伯数字(1,2,3...)标注参考文献序号. 示例: Deep Learning [1]. Reference [1] LeCu ...

  10. Jemter 压测基础(一)

    Jemter   压测基础(一) 1.压力测试的基本概念: 1.吞吐率(Requestspersecond) 服务器并发处理能力的量化描述,单位是reqs/s,指的是某个并发用户数下单位时间内处理的请 ...