概率图模型（PGM）学习笔记（二）贝叶斯网络-语义学与因子分解

概率分布（Distributions）

如图1所看到的，这是最简单的联合分布案例，姑且称之为学生模型。

图1

当中包括3个变量。各自是：I（学生智力，有0和1两个状态）、D（试卷难度，有0和1两个状态）、G（成绩等级，有1、2、3三个状态）。

表中就是概率的联合分布了，表中随便去掉全部包括某个值的行。就能对分布表进行缩减。

比如能够去掉全部G不为1的行。这样就仅仅剩下了1、4、7、10行，这样他们的概率之和就不为1了，所以能够又一次标准化（Renormalization）。如图2所看到的。

watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQveWNoZW5nX3NqdHU=/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/SouthEast" alt="">

图2

反之也能够把全部含有某个值得行相加。就是边缘化（Marginalization），如图3所看到的。

图3

条件概率分布（Conditional ProbabilityDistribution, CPD）

已知学生的智力和试卷难度。学生得分的分布就是条件概率。

如图4所看到的。

图4

因子（Factors）

因子是随机变量的函数。

因子是处理概率分布的的基本手段。

因子是高维空间中用以定义概率分布的基本单元。

$\Phi\left( {{X_1}, \ldots ,{X_k}} \right)$

因子能够相乘（图5）、边缘化（图6）以及缩减（图7）。

图5

图6

watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQveWNoZW5nX3NqdHU=/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/SouthEast" alt="">

图7

前面提到的学生模型，其条件概率分布能够画在一张图里面。如图8.

每一个节点代表一个因子，当中有些CPD已经蜕化成非条件概率了。

watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQveWNoZW5nX3NqdHU=/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/SouthEast" alt="">

图8

贝叶斯网络的链式法则（Chain Rule）

如图9所看到的。概率分布由因子的积来定义。

$P\left({D,I,G,S,L} \right) = P\left( D \right)P\left( I \right)P\left( {G\left| {I,D}\right.} \right)P\left( {S\left| I \right.} \right)P\left( {L\left| G \right.}\right)$

图9

比如

$P\left({{d^0},{i^1},{g^3},{s^1},{l^1}} \right) = 0.6 \times 0.3 \times 0.02 \times0.01 \times 0.8$

因此，通过链式法则。贝叶斯网络可以表示联合概率分布：

$P\left({{X_1}, \ldots ,{X_n}} \right) = \prod\limits_i {P\left( {{X_i}\left|{Pa{r_G}\left( {{X_i}} \right)} \right.} \right)}$

贝叶斯网络的重要性质是概率和为1

$\begin{array}{l}\sum\limits_{D,I,G,S,L}{P\left( {D,I,G,S,L} \right)} =\sum\limits_{D,I,G,S,L} {P\left( D \right)P\left( I \right)P\left( {G\left|{I,D} \right.} \right)P\left( {S\left| I \right.} \right)P\left( {L\left| G\right.} \right)} \\ = \sum\limits_{D,I,G,S,L} {P\left( D\right)P\left( I \right)P\left( {G\left| {I,D} \right.} \right)P\left( {S\left|I \right.} \right)\sum\limits_L {P\left( {L\left| G \right.} \right)} } \\ = \sum\limits_{D,I,G,S,L} {P\left( D\right)P\left( I \right)P\left( {G\left| {I,D} \right.} \right)\sum\limits_S{P\left( {S\left| I \right.} \right)} } \\{\rm{= }}\sum\limits_{D,I,G,S,L} {P\left( D \right)P\left( I \right)P\left( {G\left|{I,D} \right.} \right)} \\ = \sum\limits_{D,I,G,S,L} {P\left( D\right)P\left( I \right) = 1}\end{array}$

一个简单的概率图是血型模型

当中G指基因型，B指血型。

能够看到血型仅仅由自己的基因型决定，而基因型则由父母两人的基因型决定。如图10.

图10

欢迎參与讨论并关注本博客和微博以及知乎个人主页，兴许内容继续更新哦~

转载请您尊重作者的劳动，完整保留上述文字以及本文链接。谢谢您的支持！

概率图模型（PGM）学习笔记（二）贝叶斯网络-语义学与因子分解的更多相关文章

Stanford概率图模型：第一讲有向图-贝叶斯网络
原文链接(系列):http://blog.csdn.net/yangliuy/article/details/8067261 概率图模型(Probabilistic Graphical Model)系 ...
[ML学习笔记] 朴素贝叶斯算法（Naive Bayesian)
[ML学习笔记] 朴素贝叶斯算法(Naive Bayesian) 贝叶斯公式 \[P(A\mid B) = \frac{P(B\mid A)P(A)}{P(B)}\] 我们把P(A)称为"先 ...
贝叶斯网络与LDA
一.一些概念互信息: 两个随机变量x和Y的互信息,定义X, Y的联合分布和独立分布乘积的相对熵. 贝叶斯公式: 贝叶斯带来的思考: 给定某些样本D,在这些样本中计算某结论出现的概率,即给定样本D ...
机器学习之朴素贝叶斯&贝叶斯网络
贝叶斯决决策论在所有相关概率都理想的情况下,贝叶斯决策论考虑基于这些概率和误判损失来选择最优标记,基本思想如下: (1)已知先验概率和类条件概率密度(似然) (2)利用贝叶斯转化为后验概 ...
概率图模型（PGM）学习笔记（四）-贝叶斯网络-伯努利贝叶斯-多项式贝叶斯
之前忘记强调了一个重要差别:条件概率链式法则和贝叶斯网络链式法则的差别条件概率链式法则贝叶斯网络链式法则,如图1 图1 乍一看非常easy认为贝叶斯网络链式法则不就是大家曾经学的链式法则么,事实上 ...
概率图形模型（PGM）学习笔记（四）-贝叶斯网络-伯努利贝叶斯-贝叶斯多项式
之前忘记强调重要的差异:链式法则的条件概率和贝叶斯网络的链式法则之间的差异条件概率链式法则 P\left({D,I,G,S,L} \right) = P\left( D \right)P\left( ...
机器学习&数据挖掘笔记_18（PGM练习二：贝叶斯网络在遗传图谱在的应用）
前言: 这是coursera课程:Probabilistic Graphical Models上的第二个实验,主要是用贝叶斯网络对基因遗传问题进行一些计算.具体实验内容可参考实验指导教材:bayes ...
概率图模型（PGM） —— 贝叶斯网络（Bayesian Network）
概率图模型是图论与概率方法的结合产物.Probabilistic graphical models are a joint probability distribution defined over ...
PGM学习之二 PGM模型的分类与简介
废话:和上一次的文章确实隔了太久,希望趁暑期打酱油的时间,将之前学习的东西深入理解一下,同时尝试用Python写相关的机器学习代码. 一 PGM模型的分类通过上一篇文章的介绍,相信大家对PGM的定义 ...

随机推荐

updatepanel中使用alert弹出框方法
原文发布时间为:2009-05-17 -- 来源于本人的百度文章 [由搬家工具导入] ScriptManager.RegisterStartupScript(this.UpdatePa ...
[LeetCode] Minimum Depth of Binary Tree 二叉树最小深度
Given a binary tree, find its minimum depth. The minimum depth is the number of nodes along the shor ...
linux2.4内核调度
进程调度需要兼顾3种进程:交互进程,批处理进程,实时进程,在设计一个进程调度机制时需要考虑具体问题 (1)调度时机? 答:进程在用户空间可以pause()或者让内核设置进程为睡眠状态,以此调度,调度还 ...
洛谷——1115 最大子段和（区间DP）
题目描述给出一段序列,选出其中连续且非空的一段使得这段和最大. 输入输出格式输入格式: 输入文件maxsum1.in的第一行是一个正整数N,表示了序列的长度. 第2行包含N个绝对值不大于10000 ...
webpack常用配置项配置文件介绍
一.webpack基础 1.在项目中生成package.json:在项目根目录中输入npm init,根据提示输入相应信息.(也可以不生成package.json文件,但是package.json是很 ...
Java泛型构造函数
1.概述我们之前讨论过Java Generics的基础知识.在本文中,我们将了解Java中的通用构造函数. 泛型构造函数是至少需要有一个泛型类型参数的构造函数.我们将看到泛型构造函数并不都是在泛型类 ...
超实用的Nginx极简教程，覆盖了常用场景
概述安装与使用安装使用 nginx 配置实战 http 反向代理配置负载均衡配置网站有多个 webapp 的配置 https 反向代理配置静态站点配置搭建文件服务器跨域解决方案参考 ...
BUG_ON&&WARN_ON&BUILD_BUG_ON
转载:http://wenx05124561.blog.163.com/blog/static/124000805201223112811490/ 一．BUG_ON Linux中BUG_ON,WARN ...
聊聊、Zookeeper Linux 集群服务
今天是平安夜,先祝大家平安夜快乐.这篇文章我们来谈谈 Zookeeper Linux 集群. 为什么要集群呢?因为一台服务不够.集群是为了系统扩容,系统稳定.一台服务挂了,没关系,我还有其他的服务.集 ...
Genymotion下载模拟器失败解决方案
下载模拟器的时候经常出现下面的问题:(Connection timeout occurred) 解决方法: 1.查看你要下载的模拟器的版本,我要下的版本是6.0.0 2.到C:\Users\yourn ...

概率图模型（PGM）学习笔记（二）贝叶斯网络-语义学与因子分解

概率图模型（PGM）学习笔记（二）贝叶斯网络-语义学与因子分解的更多相关文章

随机推荐

热门专题