概率图模型（PGM）学习笔记（二）贝叶斯网络-语义学与因子分解

概率分布（Distributions）

如图1所看到的，这是最简单的联合分布案例，姑且称之为学生模型。

图1

当中包括3个变量。各自是：I（学生智力，有0和1两个状态）、D（试卷难度，有0和1两个状态）、G（成绩等级，有1、2、3三个状态）。

表中就是概率的联合分布了，表中随便去掉全部包括某个值的行。就能对分布表进行缩减。

比如能够去掉全部G不为1的行。这样就仅仅剩下了1、4、7、10行，这样他们的概率之和就不为1了，所以能够又一次标准化（Renormalization）。如图2所看到的。

watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQveWNoZW5nX3NqdHU=/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/SouthEast" alt="">

图2

反之也能够把全部含有某个值得行相加。就是边缘化（Marginalization），如图3所看到的。

图3

条件概率分布（Conditional ProbabilityDistribution, CPD）

已知学生的智力和试卷难度。学生得分的分布就是条件概率。

如图4所看到的。

图4

因子（Factors）

因子是随机变量的函数。

因子是处理概率分布的的基本手段。

因子是高维空间中用以定义概率分布的基本单元。

$\Phi\left( {{X_1}, \ldots ,{X_k}} \right)$

因子能够相乘（图5）、边缘化（图6）以及缩减（图7）。

图5

图6

watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQveWNoZW5nX3NqdHU=/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/SouthEast" alt="">

图7

前面提到的学生模型，其条件概率分布能够画在一张图里面。如图8.

每一个节点代表一个因子，当中有些CPD已经蜕化成非条件概率了。

watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQveWNoZW5nX3NqdHU=/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/SouthEast" alt="">

图8

贝叶斯网络的链式法则（Chain Rule）

如图9所看到的。概率分布由因子的积来定义。

$P\left({D,I,G,S,L} \right) = P\left( D \right)P\left( I \right)P\left( {G\left| {I,D}\right.} \right)P\left( {S\left| I \right.} \right)P\left( {L\left| G \right.}\right)$

图9

比如

$P\left({{d^0},{i^1},{g^3},{s^1},{l^1}} \right) = 0.6 \times 0.3 \times 0.02 \times0.01 \times 0.8$

因此，通过链式法则。贝叶斯网络可以表示联合概率分布：

$P\left({{X_1}, \ldots ,{X_n}} \right) = \prod\limits_i {P\left( {{X_i}\left|{Pa{r_G}\left( {{X_i}} \right)} \right.} \right)}$

贝叶斯网络的重要性质是概率和为1

$\begin{array}{l}\sum\limits_{D,I,G,S,L}{P\left( {D,I,G,S,L} \right)} =\sum\limits_{D,I,G,S,L} {P\left( D \right)P\left( I \right)P\left( {G\left|{I,D} \right.} \right)P\left( {S\left| I \right.} \right)P\left( {L\left| G\right.} \right)} \\ = \sum\limits_{D,I,G,S,L} {P\left( D\right)P\left( I \right)P\left( {G\left| {I,D} \right.} \right)P\left( {S\left|I \right.} \right)\sum\limits_L {P\left( {L\left| G \right.} \right)} } \\ = \sum\limits_{D,I,G,S,L} {P\left( D\right)P\left( I \right)P\left( {G\left| {I,D} \right.} \right)\sum\limits_S{P\left( {S\left| I \right.} \right)} } \\{\rm{= }}\sum\limits_{D,I,G,S,L} {P\left( D \right)P\left( I \right)P\left( {G\left|{I,D} \right.} \right)} \\ = \sum\limits_{D,I,G,S,L} {P\left( D\right)P\left( I \right) = 1}\end{array}$

一个简单的概率图是血型模型

当中G指基因型，B指血型。

能够看到血型仅仅由自己的基因型决定，而基因型则由父母两人的基因型决定。如图10.

图10

欢迎參与讨论并关注本博客和微博以及知乎个人主页，兴许内容继续更新哦~

转载请您尊重作者的劳动，完整保留上述文字以及本文链接。谢谢您的支持！

概率图模型（PGM）学习笔记（二）贝叶斯网络-语义学与因子分解的更多相关文章

Stanford概率图模型：第一讲有向图-贝叶斯网络
原文链接(系列):http://blog.csdn.net/yangliuy/article/details/8067261 概率图模型(Probabilistic Graphical Model)系 ...
[ML学习笔记] 朴素贝叶斯算法（Naive Bayesian)
[ML学习笔记] 朴素贝叶斯算法(Naive Bayesian) 贝叶斯公式 \[P(A\mid B) = \frac{P(B\mid A)P(A)}{P(B)}\] 我们把P(A)称为"先 ...
贝叶斯网络与LDA
一.一些概念互信息: 两个随机变量x和Y的互信息,定义X, Y的联合分布和独立分布乘积的相对熵. 贝叶斯公式: 贝叶斯带来的思考: 给定某些样本D,在这些样本中计算某结论出现的概率,即给定样本D ...
机器学习之朴素贝叶斯&贝叶斯网络
贝叶斯决决策论在所有相关概率都理想的情况下,贝叶斯决策论考虑基于这些概率和误判损失来选择最优标记,基本思想如下: (1)已知先验概率和类条件概率密度(似然) (2)利用贝叶斯转化为后验概 ...
概率图模型（PGM）学习笔记（四）-贝叶斯网络-伯努利贝叶斯-多项式贝叶斯
之前忘记强调了一个重要差别:条件概率链式法则和贝叶斯网络链式法则的差别条件概率链式法则贝叶斯网络链式法则,如图1 图1 乍一看非常easy认为贝叶斯网络链式法则不就是大家曾经学的链式法则么,事实上 ...
概率图形模型（PGM）学习笔记（四）-贝叶斯网络-伯努利贝叶斯-贝叶斯多项式
之前忘记强调重要的差异:链式法则的条件概率和贝叶斯网络的链式法则之间的差异条件概率链式法则 P\left({D,I,G,S,L} \right) = P\left( D \right)P\left( ...
机器学习&数据挖掘笔记_18（PGM练习二：贝叶斯网络在遗传图谱在的应用）
前言: 这是coursera课程:Probabilistic Graphical Models上的第二个实验,主要是用贝叶斯网络对基因遗传问题进行一些计算.具体实验内容可参考实验指导教材:bayes ...
概率图模型（PGM） —— 贝叶斯网络（Bayesian Network）
概率图模型是图论与概率方法的结合产物.Probabilistic graphical models are a joint probability distribution defined over ...
PGM学习之二 PGM模型的分类与简介
废话:和上一次的文章确实隔了太久,希望趁暑期打酱油的时间,将之前学习的东西深入理解一下,同时尝试用Python写相关的机器学习代码. 一 PGM模型的分类通过上一篇文章的介绍,相信大家对PGM的定义 ...

随机推荐

【SPOJ61】Brackets（线段树）
题意:给出一个括号序列,要求维护两种操作: 1.将第x位上的括号取反 2.查询当前整个括号序列是否匹配 n<=3e4 思路:线段树维护区间内没有匹配的左右括号数量 pushup时t[p].r=t ...
CODEVS【3372】选学霸
题目描述 Description 老师想从N名学生中选M人当学霸,但有K对人实力相当,如果实力相当的人中,一部分被选上,另一部分没有,同学们就会抗议.所以老师想请你帮他求出他该选多少学霸,才能既不让同 ...
SqlServer不允许更改字段类型（表中已有数据）
工具-选项-设计器-阻止保存要求重新创建表的更改,√去掉.
Linux：supervisor命令的使用
supervisor是Linux下一个便利的启动和监控服务的命令. 举例来说:假如我想同时管理一堆的服务,包括他们的运行和停止.我就可以使用supervisor来管理. supervisor包括两 ...
Java发送邮件--web.xml配置，Java代码配置
前言:我目前总结的使用java发送邮件的方式有两种,分别是在spring框架xml配置文件使用bean标签,另一种方法是把发送功能封装成一个对象,废话不多说上代码, 边看代码边讲解,希望对需要的人能有 ...
524. Longest Word in Dictionary through Deleting
Given a string and a string dictionary, find the longest string in the dictionary that can be formed ...
Unique Binary Search Trees II - LeetCode
Given n, generate all structurally unique BST's (binary search trees) that store values 1...n. For e ...
Maven 多模块父子工程 (含Spring Boot示例)
一.为什么要用Maven多模块假设有这样一个项目,很常见的Java Web应用.在这个应用中,我们分了几层: Dao Service Web 对应的,在一个项目中,我们会看到一些包名: org.xx ...
Java线程池原理解读
引言引用自<阿里巴巴JAVA开发手册> [强制]线程资源必须通过线程池提供,不允许在应用中自行显式创建线程. 说明:使用线程池的好处是减少在创建和销毁线程上所消耗的时间以及系统资源的开销 ...
SVN的Status字段含义
执行SVN up和svn merge等命令出现在首位置的各字母含义如下: “ ” 无修改 “A” 新增 “C” 冲突 “D” 删除 “G” 合并 “I” 忽略 “M” 改变 “R” 替换 “X” 未纳 ...

概率图模型（PGM）学习笔记（二）贝叶斯网络-语义学与因子分解

概率图模型（PGM）学习笔记（二）贝叶斯网络-语义学与因子分解的更多相关文章

随机推荐

热门专题