http://blog.csdn.net/pipisorry/article/details/52578631

本文讨论(完备数据的)贝叶斯网的参数估计问题:贝叶斯网的MLE最大似然估计和贝叶斯估计。假定网络结构是固定的,且假定数据集D包含了网络变量的完全观测实例。

参数估计的主要方法有两种:一种基于最大的似然的估计;一种是使用贝叶斯方法。

贝叶斯网的MLE参数估计

最大似然估计MLE

[参数估计:最大似然估计MLE]

简单示例:局部似然函数

仅包含两个二元变量的网络,即弧

从上看出,似然函数被分解为两项,且每一项对应一个变量。每一项都是一个局部的似然函数,度量了在给定其父节点时预测变量的性能。每一项都只依赖于变量的CPD的参数。

考虑分解的两个单独项

第一项与前面的多项式似然函数一样。

第二项进一步分解:似然函数的可分解性

局部似然函数分解

同理可得theta y0|x0。但是后面有一个更简单更紧凑的使用CPD表方式快速同时计算这两个参数的方法。

变量集合的各种赋值的计数

全局似然分解:转换为局部似然函数

注意,贝叶斯网中节点代表的是随机变量(也就是每个样本的维度,而不是每个样本)。样本数目为m,维度数为i。

似然函数的全局分解

全局似然分解成局部似然函数乘积

Note: 方括号中的每一项表示网络中一个特定变量在给定父节点时的条件似然。

结论

CPD表:进一步分解局部似然函数

参数的选择决定了我们最大化每个局部似然函数的方法。现考虑一种可能是CPD最简单的参数化:CPD表(table-CPD)。

贝叶斯网局部MLE的进一步分解

方框项独立最大化

也就是说,之前简单的示例中我们是分别计算p(x0|u0)p(x1|u0),现在通过式17.5出现次数(更紧凑的表示)一次同时计算出2个参数p(x0|u0)p(x1|u0)了。

Note: 式17.5就是通过MLE估计出的贝叶斯网的参数计算公式。

数据碎片与过拟合:缺少可靠的大量估计参数的数据

高斯贝叶斯网*

。。。

专栏17.B——概念:非参数模型

作为M-投影的最大似然估计*

。。。

皮皮blog

MAP估计

[参数估计:文本分析的参数估计方法]

皮皮blog

贝叶斯网的贝叶斯参数估计

贝叶斯框架要求在未知的参数和数据实例上指定一个联合分布。与单个参数的情况一样,可以将参数和数据上的联合分布理解为一个贝叶斯网。

贝叶斯参数估计

[参数估计:贝叶斯思想和贝叶斯参数估计]

参数独立性与全局分解

简单的例子

图7中的b

全局参数独立性:假设要估计参数之间独立

这里有一个假设:网络结构体现出单个参数变量的先验是先验独立的(没有观测到数据时就是独立的)。即我们认为知道其中一个参数的参数值并不能告诉我们另一个参数的任何信息。更确切的有如下定义

同时,如果参数变量是先验独立的,那么观测到数据时,也可以得到它们是后验独立的。也就是说,如果这两个参数是独立的先验,那么它们也是独立的后验。

也就是后验可以用紧凑的因子分解的形式表达。

一般的网络

假定已经给定了一个具有参数theta的网络结构G。

所以,从上面最终的公式中可以看出,这个和MLE很相似,剩下要做的就是先验p(thetax|pax)的确定上了(其中p(thetax我们已经知道了,如Dirichlet分布))。

预测

局部分解和贝叶斯网学习的先验分布

通过对局部贝叶斯估计问题求解来得到全局贝叶斯解。

theta x的后验

theta y|x的后验

上面独立先验的证明:

theta y|x的狄利克雷分布先验

预测和参数估计

此式应该也就是贝叶斯网的贝叶斯参数估计计算公式。


贝叶斯网学习的先验分布参数的确定

专家赋值、K2先验(相同的固定先验)、利用先验数据集(等价于MLE了)、BDe先验分布。

先验对参数估计的影响:MLE和不同强度alpha贝叶斯估计的比较

专栏17.C

检验了MLE方法和一些贝叶斯方法,所有方法使用了统一的先验均值和不同的先验强度alpha。

from: http://blog.csdn.net/pipisorry/article/details/52578631

ref: [《Probabilistic Graphical Models:Principles and Techniques》(简称PGM)]

PGM:贝叶斯网的参数估计的更多相关文章

  1. PGM:贝叶斯网的参数估计2

    http://blog.csdn.net/pipisorry/article/details/52599321 没时间看了,下次再看... 具有共享参数的学习模型 全局参数共享 局部参数共享 具有 共 ...

  2. PGM:贝叶斯网表示之朴素贝叶斯模型naive Bayes

    http://blog.csdn.net/pipisorry/article/details/52469064 独立性质的利用 条件参数化和条件独立性假设被结合在一起,目的是对高维概率分布产生非常紧凑 ...

  3. 概率图模型(PGM):贝叶斯网(Bayesian network)初探

    1. 从贝叶斯方法(思想)说起 - 我对世界的看法随世界变化而随时变化 用一句话概括贝叶斯方法创始人Thomas Bayes的观点就是:任何时候,我对世界总有一个主观的先验判断,但是这个判断会随着世界 ...

  4. 贝叶斯网(1)尝试用Netica搭建简单的贝叶斯网并使用贝叶斯公式解释各个bar的结果

    近来对贝叶斯网十分感兴趣,按照博客<读懂概率图模型:你需要从基本概念和参数估计开始>给出的第一个例子,试着搭建了一个student网. (1)点击绿F,对条件概率表予以输入(包括两个祖先节 ...

  5. 贝叶斯网引论 by 张连文

    贝叶斯网(Bayesian networks)是一种描述随机变量之间关系的语言,构造贝叶斯网是为了概率推理,理论上概率推理基于联合概率分布就行了,但是联合概率分布(基于表)的复杂度会呈指数增长,贝叶斯 ...

  6. 贝叶斯网(2)Netica:从数据中学习CPT

    1. 离散节点 在官方Tutorial中是有详细的案例的,就是B篇3.3节,你可以动手把天气预报这个实现一下: http://www.norsys.com/tutorials/netica/secB/ ...

  7. 基于贝叶斯网(Bayes Netword)图模型的应用实践初探

    1. 贝叶斯网理论部分 笔者在另一篇文章中对贝叶斯网的理论部分进行了总结,在本文中,我们重点关注其在具体场景里的应用. 2. 从概率预测问题说起 0x1:条件概率预测模型之困 我们知道,朴素贝叶斯分类 ...

  8. PGM:有向图模型:贝叶斯网络

    http://blog.csdn.net/pipisorry/article/details/52489270 为什么用贝叶斯网络 联合分布的显式表示 Note: n个变量的联合分布,每个x对应两个值 ...

  9. PGM学习之五 贝叶斯网络

    本文的主题是“贝叶斯网络”(Bayesian Network) 贝叶斯网络是一个典型的图模型,它对感兴趣变量(variables of interest)及变量之间的关系(relationships) ...

随机推荐

  1. Hive优化案例

    1.Hadoop计算框架的特点 数据量大不是问题,数据倾斜是个问题. jobs数比较多的作业效率相对比较低,比如即使有几百万的表,如果多次关联多次汇总,产生十几个jobs,耗时很长.原因是map re ...

  2. spark-shell报错:Exception in thread "main" java.lang.NoClassDefFoundError: org/apache/hadoop/fs/FSDataInputStream

    环境: openSUSE42.2 hadoop2.6.0-cdh5.10.0 spark1.6.0-cdh5.10.0 按照网上的spark安装教程安装完之后,启动spark-shell,出现如下报错 ...

  3. Android ART、Dalvik在multidex上的差异、关联

    为提升应用运行性能,谷歌官方从5.0(api level:21)版本开始,将虚拟机运行环境默认为ART, 此处主要研究ART.Dalvik在multidex处理上的差异和关联,做了一个简单的手绘,如下 ...

  4. TF-IDF In Scikit-Learn

    TF-IDF In Scikit-Learn 2017年9月30日补充   其实在算下面TF-IDF的步骤之前,还有一步,就是计算Term Frequency 也就是词频.当然,scikit-lear ...

  5. Lazy Loading | Explicit Loading | Eager Loading in EntityFramework and EntityFramework.Core

    EntityFramework Eagerly Loading Eager loading is the process whereby a query for one type of entity ...

  6. [ZJOI 2010]Perm 排列计数

    Description 题库链接 询问有多少个 \(1\sim N\) 的排列 \(P\) 满足" \(\forall i\in[2,N], P_i>P_{\frac{i}{2}}\) ...

  7. ●POJ 2774 Long Long Message

    题链: http://poj.org/problem?id=2774题解: 后缀自动机 使用后缀自动机匹配,思路如下: 即如果当前的x字符匹配失败了,就可以从当前已经匹配的串的后缀去继续匹配. 然后不 ...

  8. linux内核中的链表

    1.内核中的链表 linux内核链表与众不同,他不是把将数据结构塞入链表,而是将链表节点塞入数据,在2.1内核中引入了官方链表,从此内核中所有的链表使用都采用此链表,千万不要在重复造车轮子了!链表实现 ...

  9. [Codeforces Round #431]简要题解

    来自FallDream的博客,未经允许, 请勿转载,谢谢. 好久没写cf题解了zzz 代码比较丑不贴了,cf上都可以看 Div2A. 给你一个长度为n(n<=100)的序列 判断是否可以分成奇数 ...

  10. C语言程序设计第一次作业1

    (一)实验总结 1. 圆面积问题 1:求圆面积和周长 (1)输入圆的半径,计算圆的周长和面积. (2) (3) 2:判断闰年 (1)输入一个四位年份,判断其是否是闰年.闰年的判别条件是该年年份能被4整 ...