贝叶斯定理推导(Bayes' Theorem Induction)
这里用Venn diagram来不严谨地推导一下贝叶斯定理。
假设A和B为两个不相互独立的事件。
交集(intersection): 

上图红色部分即为事件A和事件B的交集。
并集(union): 


由Venn diagram可以看出,在事件B已经发生的情况下,事件A发生的概率为事件A和事件B的交集除以事件B:

同理,在事件A已经发生的情况下,事件B发生的概率为事件A和事件B的交集除以事件A:

注:
表示 A,B 事件同时发生的概率,如果 A 和 B 是相互独立的两个事件,那么:
。
由上面的公式可以得到:

然后,我们就可以得到贝叶斯定理:

其中:
是先验概率(prior probability),
是条件概率(conditional probability),
是后验概率(posterior probability)。
是联合概率(joint probability),通常写成P(A,B)。
注:条件概率 P(B|A) ---> 给定事件A,事件B发生的概率(probability of event B occuring given event A)。
又根据Law of Total Probability: 
注:
表示事件A不发生的概率。
这个可以用probability tree来帮助理解一下:

因此,贝叶斯定理可以扩展为: 
贝叶斯定理通常用于由已知的先验概率和条件概率,推算出后验概率。
举一个简单的例子:某地平时下雨的概率是0.3,小明平时带伞的概率是0.4,小明下雨天带伞的概率是0.8。某一天小明带了伞,请问这天下雨的概率是多少?
解答:也就是需要求P(下雨|小明带伞),把上面的数字代入公式即:
这个例子的先验概率是平时下雨的概率0.3,由于我们已知小明带了伞这一信息,因此我们可以估算出后验概率,也就是当天下雨的概率是0.6。
先验概率是怎么得来的呢?通常是人们的经验总结或者说是估算,比如说某地一个月里面下了3天雨,我们就估算某地平时下雨的概率是0.3。
如果条件不止一个呢?让我们把上面的例子改一下:某地平时下雨的概率是0.3,平时刮风的概率是0.4,下雨天刮风的概率是0.6,小明平时带伞的概率是0.4,小明下雨天带伞的概率是0.8。某一天小明带了伞,且当天在刮风,请问这天下雨的概率是多少?
解答:也就是需要求P(下雨|小明带伞,刮风),把上面的数字代入公式即:

注:这里假设小明带伞和刮风之间没有关联,两条件互不影响(条件独立假设),因此属于朴素贝叶斯的范畴。
长久以来,人们信奉的是频率主义。比如把一枚硬币抛10000次,有5000次正面朝上,5000次反面朝上,那么我们就可以得知抛这枚硬币,其正面朝上的概率是0.5。通常,我们需要某一事件发生足够多的次数,我们才可以观察到它的规律。
在现实生活中,很多事件并不会在相对较短的时间内多次发生。这时候,贝叶斯定理就发挥作用了。比如说我们想知道刮风天下雨的概率是多少,我们不用等10000个刮风天,看其中有几天下了雨。我们只需要估算出下雨天会刮风的概率,平时下雨的概率,平时刮风的概率,就可以估算出刮风天会下雨的概率是多少了。先验概率估算得不准确并没有关系,人们可以通过未来事件的发生情况,不断对后验概率做出调整。
贝叶斯定理推导(Bayes' Theorem Induction)的更多相关文章
- 【概率论】2-3:贝叶斯定理(Bayes' Theorem)
title: [概率论]2-3:贝叶斯定理(Bayes' Theorem) categories: Mathematic Probability keywords: Bayes' Theorem 贝叶 ...
- (main)贝叶斯统计 | 贝叶斯定理 | 贝叶斯推断 | 贝叶斯线性回归 | Bayes' Theorem
2019年08月31日更新 看了一篇发在NM上的文章才又明白了贝叶斯方法的重要性和普适性,结合目前最火的DL,会有意想不到的结果. 目前一些最直觉性的理解: 概率的核心就是可能性空间一定,三体世界不会 ...
- 读Bayes' Theorem
Bayes' Theorem定理的原理说明,三个简单的例子来说明用法及一些练习. Bayes' Theorem就是概率问题,论文相对比较好理解,也不必做什么笔记.
- Bayes' theorem (贝叶斯定理)
前言 AI时代的到来一下子让人感觉到数学知识有些捉襟见肘,为了不被这个时代淘汰,我们需要不断的学习再学习.其中最常见的就是贝叶斯定理,这个定理最早由托马斯·贝叶斯提出. 贝叶斯方法的诞生源于他生前为解 ...
- Naive Bayes Theorem and Application - Theorem
Naive Bayes Theorm And Application - Theorem Naive Bayes model: 1. Naive Bayes model 2. model: discr ...
- PRML读书笔记——机器学习导论
什么是模式识别(Pattern Recognition)? 按照Bishop的定义,模式识别就是用机器学习的算法从数据中挖掘出有用的pattern. 人们很早就开始学习如何从大量的数据中发现隐藏在背后 ...
- ML(3): 贝叶斯方法
对于分类问题,我们每个人每天都在执行分类操作,只是我们没有意识到罢了.例如,当你看到一个陌生人,你的脑子下意识判断TA是男是女:你可能经常会走在路上对身旁的朋友说“这个人一看就很有钱.那边有个非主流” ...
- 如何通俗理解贝叶斯推断与beta分布?
有一枚硬币(不知道它是否公平),假如抛了三次,三次都是“花”: 能够说明它两面都是“花”吗? 1 贝叶斯推断 按照传统的算法,抛了三次得到三次“花”,那么“花”的概率应该是: 但是抛三次实在太少了,完 ...
- Bayesian Statistics for Genetics | 贝叶斯与遗传学
Common sense reduced to computation - Pierre-Simon, marquis de Laplace (1749–1827) Inventor of Bayes ...
随机推荐
- log4j打印堆栈信息
原文地址:https://blog.csdn.net/xianyu_0418/article/details/6043174 大家都知道,网站在运行的过程中,打印必要的log对记录网站的运行情况.从而 ...
- SQL Server(2000,2005,2008):恢复/回滚时间比预期长(译)
我已经讨论了各种确定恢复状态的方法,但是本周我参与了一个围绕回滚的有趣讨论.交易已经运行了14个小时,然后发出了KILL SPID.SPID进入回滚,并发生2天和4小时. 自然的问题是为什么不14小时 ...
- 用python表白了!!!
用python 画一颗心,代码: import numpy as np import matplotlib.pyplot as plt x = np.linspace(-8 , 8, 1024) ...
- mysql有多大内存?能存多少数据?
Mysql: MySQL 3.22 限制的表大小为4GB. MyISAM 存储引擎: 最大表尺寸增加到了65536TB(2567 – 1字节).由于允许的表尺寸更大,MySQL数据库的最大有效表尺寸通 ...
- Redis使用和部分源码剖析以及Django缓存和redis的关系
0.特点: a.持久化 b.单进程.单线程 c.5大数据类型 d.用于操作内存的软件. e.虽然是缓存数据库但是可以做持久化的工作 MySQL是一个软件,帮助开发者对一台机器的硬盘进行操作 ...
- oracle导出用户下单表或者多表,导入到别的服务器用户下
导出 exp 用户名/密码 file=存放dmp的名称的目录 statistics=none tables =(表名,表名,表名) exp creditfw/credit file=d:\te ...
- 将Myeclipse项目改成Eclipse项目
由于项目需求,需要将原来Myeclipse项目转移到Eclipse中去.搞了半天才搞出来,分享给大家,希望对大家有用. 首先导入一个从Myeclipse导出的项目 然后无法进行tomcat发布. 但是 ...
- tomcat8.0部署启动
http://tomcat.apache.org/download-80.cgi 打开命令行提示符窗口, 进入Tomcat安装目录, 进入bin目录下, 输入:service.bat install ...
- Html5使用canvas作图
以下例子是项目中实际用到的.不足之处请大家指正,设计到画线,写文字,填充,文字旋转. <!DOCTYPE html> <html> <head lang="en ...
- Linux 下面 PG 的 uuid-ossp 包安装办法
1. pgsql 安装 时报错, 如图示: 详细信息为: 执行SQL为: CREATE EXTENSION IF NOT EXISTS "uuid-ossp" 错误纤细信息为: C ...