这里用Venn diagram来不严谨地推导一下贝叶斯定理。

假设A和B为两个不相互独立的事件。

交集(intersection): 

上图红色部分即为事件A和事件B的交集。

并集(union): 

由Venn diagram可以看出,在事件B已经发生的情况下,事件A发生的概率为事件A和事件B的交集除以事件B:

同理,在事件A已经发生的情况下,事件B发生的概率为事件A和事件B的交集除以事件A:

注:表示 A,B 事件同时发生的概率,如果 A 和 B 是相互独立的两个事件,那么:

由上面的公式可以得到:

然后,我们就可以得到贝叶斯定理

其中: 先验概率(prior probability)条件概率(conditional probability)后验概率(posterior probability)联合概率(joint probability),通常写成P(A,B)

注:条件概率 P(B|A) ---> 给定事件A,事件B发生的概率(probability of event B occuring given event A)。

又根据Law of Total Probability: 

注:表示事件A不发生的概率。

这个可以用probability tree来帮助理解一下:

因此,贝叶斯定理可以扩展为: 

贝叶斯定理通常用于由已知的先验概率和条件概率,推算出后验概率。

举一个简单的例子:某地平时下雨的概率是0.3,小明平时带伞的概率是0.4,小明下雨天带伞的概率是0.8。某一天小明带了伞,请问这天下雨的概率是多少?

解答:也就是需要求P(下雨|小明带伞),把上面的数字代入公式即:

这个例子的先验概率是平时下雨的概率0.3,由于我们已知小明带了伞这一信息,因此我们可以估算出后验概率,也就是当天下雨的概率是0.6。

先验概率是怎么得来的呢?通常是人们的经验总结或者说是估算,比如说某地一个月里面下了3天雨,我们就估算某地平时下雨的概率是0.3。

如果条件不止一个呢?让我们把上面的例子改一下:某地平时下雨的概率是0.3,平时刮风的概率是0.4,下雨天刮风的概率是0.6,小明平时带伞的概率是0.4,小明下雨天带伞的概率是0.8。某一天小明带了伞,且当天在刮风,请问这天下雨的概率是多少?

解答:也就是需要求P(下雨|小明带伞,刮风),把上面的数字代入公式即:

注:这里假设小明带伞和刮风之间没有关联,两条件互不影响(条件独立假设),因此属于朴素贝叶斯的范畴。

长久以来,人们信奉的是频率主义。比如把一枚硬币抛10000次,有5000次正面朝上,5000次反面朝上,那么我们就可以得知抛这枚硬币,其正面朝上的概率是0.5。通常,我们需要某一事件发生足够多的次数,我们才可以观察到它的规律。

在现实生活中,很多事件并不会在相对较短的时间内多次发生。这时候,贝叶斯定理就发挥作用了。比如说我们想知道刮风天下雨的概率是多少,我们不用等10000个刮风天,看其中有几天下了雨。我们只需要估算出下雨天会刮风的概率,平时下雨的概率,平时刮风的概率,就可以估算出刮风天会下雨的概率是多少了。先验概率估算得不准确并没有关系,人们可以通过未来事件的发生情况,不断对后验概率做出调整。

贝叶斯定理推导(Bayes' Theorem Induction)的更多相关文章

  1. 【概率论】2-3:贝叶斯定理(Bayes' Theorem)

    title: [概率论]2-3:贝叶斯定理(Bayes' Theorem) categories: Mathematic Probability keywords: Bayes' Theorem 贝叶 ...

  2. (main)贝叶斯统计 | 贝叶斯定理 | 贝叶斯推断 | 贝叶斯线性回归 | Bayes' Theorem

    2019年08月31日更新 看了一篇发在NM上的文章才又明白了贝叶斯方法的重要性和普适性,结合目前最火的DL,会有意想不到的结果. 目前一些最直觉性的理解: 概率的核心就是可能性空间一定,三体世界不会 ...

  3. 读Bayes' Theorem

    Bayes' Theorem定理的原理说明,三个简单的例子来说明用法及一些练习. Bayes' Theorem就是概率问题,论文相对比较好理解,也不必做什么笔记.

  4. Bayes' theorem (贝叶斯定理)

    前言 AI时代的到来一下子让人感觉到数学知识有些捉襟见肘,为了不被这个时代淘汰,我们需要不断的学习再学习.其中最常见的就是贝叶斯定理,这个定理最早由托马斯·贝叶斯提出. 贝叶斯方法的诞生源于他生前为解 ...

  5. Naive Bayes Theorem and Application - Theorem

    Naive Bayes Theorm And Application - Theorem Naive Bayes model: 1. Naive Bayes model 2. model: discr ...

  6. PRML读书笔记——机器学习导论

    什么是模式识别(Pattern Recognition)? 按照Bishop的定义,模式识别就是用机器学习的算法从数据中挖掘出有用的pattern. 人们很早就开始学习如何从大量的数据中发现隐藏在背后 ...

  7. ML(3): 贝叶斯方法

    对于分类问题,我们每个人每天都在执行分类操作,只是我们没有意识到罢了.例如,当你看到一个陌生人,你的脑子下意识判断TA是男是女:你可能经常会走在路上对身旁的朋友说“这个人一看就很有钱.那边有个非主流” ...

  8. 如何通俗理解贝叶斯推断与beta分布?

    有一枚硬币(不知道它是否公平),假如抛了三次,三次都是“花”: 能够说明它两面都是“花”吗? 1 贝叶斯推断 按照传统的算法,抛了三次得到三次“花”,那么“花”的概率应该是: 但是抛三次实在太少了,完 ...

  9. Bayesian Statistics for Genetics | 贝叶斯与遗传学

    Common sense reduced to computation - Pierre-Simon, marquis de Laplace (1749–1827) Inventor of Bayes ...

随机推荐

  1. log4j打印堆栈信息

    原文地址:https://blog.csdn.net/xianyu_0418/article/details/6043174 大家都知道,网站在运行的过程中,打印必要的log对记录网站的运行情况.从而 ...

  2. SQL Server(2000,2005,2008):恢复/回滚时间比预期长(译)

    我已经讨论了各种确定恢复状态的方法,但是本周我参与了一个围绕回滚的有趣讨论.交易已经运行了14个小时,然后发出了KILL SPID.SPID进入回滚,并发生2天和4小时. 自然的问题是为什么不14小时 ...

  3. 用python表白了!!!

    用python 画一颗心,代码:   import numpy as np import matplotlib.pyplot as plt x = np.linspace(-8 , 8, 1024) ...

  4. mysql有多大内存?能存多少数据?

    Mysql: MySQL 3.22 限制的表大小为4GB. MyISAM 存储引擎: 最大表尺寸增加到了65536TB(2567 – 1字节).由于允许的表尺寸更大,MySQL数据库的最大有效表尺寸通 ...

  5. Redis使用和部分源码剖析以及Django缓存和redis的关系

    0.特点: a.持久化 b.单进程.单线程 c.5大数据类型    d.用于操作内存的软件.    e.虽然是缓存数据库但是可以做持久化的工作 MySQL是一个软件,帮助开发者对一台机器的硬盘进行操作 ...

  6. oracle导出用户下单表或者多表,导入到别的服务器用户下

      导出   exp 用户名/密码 file=存放dmp的名称的目录 statistics=none tables =(表名,表名,表名) exp creditfw/credit file=d:\te ...

  7. 将Myeclipse项目改成Eclipse项目

    由于项目需求,需要将原来Myeclipse项目转移到Eclipse中去.搞了半天才搞出来,分享给大家,希望对大家有用. 首先导入一个从Myeclipse导出的项目 然后无法进行tomcat发布. 但是 ...

  8. tomcat8.0部署启动

    http://tomcat.apache.org/download-80.cgi 打开命令行提示符窗口, 进入Tomcat安装目录, 进入bin目录下, 输入:service.bat install  ...

  9. Html5使用canvas作图

    以下例子是项目中实际用到的.不足之处请大家指正,设计到画线,写文字,填充,文字旋转. <!DOCTYPE html> <html> <head lang="en ...

  10. Linux 下面 PG 的 uuid-ossp 包安装办法

    1. pgsql 安装 时报错, 如图示: 详细信息为: 执行SQL为: CREATE EXTENSION IF NOT EXISTS "uuid-ossp" 错误纤细信息为: C ...