pgm4
这部分 cover 两个比较特殊的情形,一个是 Gaussian networks,一个是 exponential family。
正态分布常见的参数化策略是均值 和协方差矩阵
,另一种是使用 information matrix/precision matrix,即
,另可以用所谓 potential vector 代替
,即
。小结一下如下
针对 Gaussian 分布有些常见的结论,比如 margin/conditional distribution,相关与独立性的关系这里不再赘述。
常见的 Gaussian Bayesian network 是指所有的 r.v.s 是 Gaussian,且 CPD 都是 LG(linear Gaussian)。可以证明对任意在 上的 Gaussian 分布,以及任意的 ordering(这里假定就是顺序的),可以构造对应的 BN 和图,使得
的 parent 是
,CPD 都是 LG 且对应的图是 minimal I-map。
如果从 MRF 的角度来看,二次型部分定义了一个 pairwise Markov network,我们称为 GMRF,我们可以容易的证明,
- 如果
是 attractive 的,即
- 或者
是严格主对角占优的,即
;
- 或者
是 pairwise normalizable,即
对应
对角元非负,且子二次型半正定
都能证明这是一个合法的 GMRF。
这里的指数族方面的分析并不从具体的例子(如 Gaussian 或者 Bernoulli)开始。我们直接定义
其中 是充分统计量(feature),参数空间
是凸子集,而
是自然参数函数(从 moment parameter 映射到 canonical parameter?),而
是辅助测度,这可以看成是一个 MRF。当
是 identity function 时,这是一个 log-linear model。这样我们根据这些 sufficient statistics 就能知道这个 MRG 的结构了。值得注意的是一般说来 BN 通过合适的 CPD 可能能得到 exponential family,但是一般都不是线性关系。
有了一般形式后,我们可以方便计算这个分布的熵
这提示我们一般来说对于一个 MRF 而言其 entropy 具有类似的形式(log partition function – sum of expectation of log factor)。事实上对于 BN 来说,由于 为 1,相反更简单,并且由于 decouple 之后我们可以用条件熵表达出最后的联合熵。这样很容易证明,任意一个与某个 BN consistent 的分布的熵处于对此结构分别最大或者最小化熵之间。
对任意的分布 ,我们可以获得对一个 exponential family 的相对熵(KL divergence):
特别的,如果 ,则
类似可以导出 BN 的情形。
我们根据以上定义的 relative entropy 可以定义两个方向的投影(将分布 投影到分布集合
上):
- I-projection(information projection):
- M-projection(moment projection):
为什么这么称呼这两种投影呢?我们知道 M-projection 中 导致我们尽量的在
的 support 处增大
,这样就会得到一个相对较平的近似(方差较大);而 I-projection 对应
,会某种程度上要求减少 entropy,即相对更集中的反应
mode 区域的性质。
从理论上研究的话 M-projection 更容易一些,因为 I-projection 里面两项都存在贡献,而如果我们不能对 做一些假设就很难进行下去。对 M-projection 来说,我们可以限定
在某些简单的分布族上,比如 exponential family。
一个有趣的结论是如果我们限定 是任意独立的,那么 M-projection 就是
的 marginal distribution 的乘积。如果限定在指数族上,则得到的
满足
,即充分统计量(feature)一阶矩在两个分布下能够 matching。对于给定图的 BN 的限定来说我们得到的
必须满足
对应的条件分布。
我们可以回想一下一些常见的做法:
- EM 算法里面我们选择的
是 I-projection,即正好是后验分布本身。
- variational Bayesian 我们选择的变分后验(由于真实后验难以计算)也是真实后验的 I-projection,限定在我们给定分解(如全部独立)的情形下的解。
- expectation propagation 我们选择的 moment matching,亦即选择的是通过 exponential family 做 M-projection,根据以上分析,EP 的优化等价于寻找合适的指数族分布使得在充分统计量上具有相同的一阶矩。
后面我们将开始学习 inference,正式进入第二部分。
——————-
And God said to him in a dream, Yes, I know that you did this in the integrity of your heart; for I also withheld you from sinning against me: therefore suffered I you not to touch her.
pgm4的更多相关文章
随机推荐
- day51
JS基础操作 一.分支结构 1.if语句 if 基础语法 if (条件表达式) { 代码块; } // 当条件表达式结果为true,会执行代码块:反之不执行 // 条件表达式可以为普通表达式 // 0 ...
- php操作文件类的函数
<?php /** // 一行一行读取一个文件 (文件内容很大的时候,适用.file_get_contents此场景就不太好) $re = fopen("index.php" ...
- 带你看懂大数据采集引擎之Flume&采集目录中的日志
一.Flume的介绍: Flume由Cloudera公司开发,是一种提供高可用.高可靠.分布式海量日志采集.聚合和传输的系统,Flume支持在日志系统中定制各类数据发送方,用于采集数据:同时,flum ...
- Codeforces round 1100
Div 2 532 我对交互一无所知 只能寄期望与NOI和省选不出交互吧... E 这个题,真的是耻辱... 其实非常简单,就是二分+判环... 那么就直接二分答案+拓扑排序即可... (我居然在考试 ...
- WPF Good UI
<Window x:Class="WpfApplication1.Window1" xmlns="http://schemas.microsoft.co ...
- 20155206赵飞 基于《Arm试验箱的国密算法应用》课程设计个人报告
20155206赵飞 基于<Arm试验箱的国密算法应用>课程设计个人报告 课程设计中承担的任务 完成试验箱测试功能1,2,3 . 1:LED闪烁实验 一.实验目的 学习GPIO原理 ...
- Unused Method(不再使用的方法)——Dead Code(死亡代码)
系列文章目录: 使用Fortify进行代码静态分析(系列文章) Unused Method(不再使用的方法) 示例: private bool checkLevel(strin ...
- adb连接手机的两种方式
adb连接手机进行调试有两种方式,一种使用USB线,一种使用无线WiFi. 第一种 使用USB线连接 1. 在手机上启用USB调试 2. CMD窗口输入adb devices,此时可以看到自己的设备 ...
- HTML-JS 循环 函数 递归
[循环结构的执行步骤] 1.声明循环变量 2.判断循环条件 3.执行循环体操作 4.更新循环变量 然后,循环执行2-4,直到条件不成立时,跳出循环. while循环()中的表达式,运算结果可以是各种类 ...
- Docker原理探究
问题思考:-------------------------------------Docker浅显原理理解-------------------------------------P1. ubunt ...