机器学习&数据挖掘笔记_22(PGM练习六:制定决策)
前言:
本次实验是将一些简单的决策理论和PGM推理结合,实验内容相对前面的图模型推理要简单些。决策理论采用的是influence diagrams,和常见图模型本质一样,
其中的决策节点也可以用CPD来描述,做决策时一般是采用最大期望效用准则(MEU)。实验内容参考参考的内容是coursera课程:Probabilistic Graphical Models中的assignment 5. 实验code可参考网友的:code.
实验中一些函数简单说明:
Fnew = VariableElimination(F, Z):
给定factorlist F和需要消除的变量集Z,采用sum-product的方法消除这些变量后得到factor集Fnew.内部需调用函数EliminateVar()。
EU = SimpleCalcExpectedUtility(I):
实验1的内容。I为influence diagrams中的所有factor,包含I.RandomFactors、 I.DecisionFactors、 I.UtilityFactors三种。计算时可以把RandomFactors和DecisionFactors结合在一起,看出是一个BN,然后对该BN进行变量消除,将那些不是效用节点父节点的变量消除掉,得到的factor中就只包含效用节点父节点了。
最后将其与UtilityFactors相乘就可以得到期望效用了,计算公式如下:

EUF = CalculateExpectedUtilityFactor( I ):
实验2的内容。EUF是指期望效用factor. 将前面的EU计算公式变形后如下:

而所求的EUF就是公式中的:
注意与实验1中的SimpleCalcExpectedUtility()区分开来,这里是消除掉与决策节点无关的那些变量(实验1消除的是与效用节点无关的变量)。所以EUF中的var只剩下决策节点及其父节点。
[MEU OptimalDecisionRule] = OptimizeMEU( I ):
实验3的内容。求的MEU为最大期望效用。除决策factor中的变量外,其它变量组合的每一个assignment下,决策D下的不同决策将得到不同的效用,此
assignment下当然是取效用最大的那个决策。因此这样就好构成一个新的factor,为OptimalDecisionRule.factor中所有的val之和就为MEU. 该函数内部需要调用CalculateExpectedUtilityFactor().
[MEU OptimalDecisionRule] = OptimizeWithJointUtility( I ):
实验4的内容。该实验处理参数和实验3一样,不同的是这里需要处理有多个效用节点的情形。因为效用值具有可加性,所以只需将这些效用节点所在的factor相加起来构成一个新的效用factor,然后直接调用OptimizeMEU()输出就ok了。
[MEU OptimalDecisionRule] = OptimizeLinearExpectations( I ):
实验5的内容。所完成的功能和实验4是一样的,函数接口也相同,只是采用的方法不同。实验4中是先将所有的效用factor相加,然后采用实验3的函数来计算。而实验5是直接将效用计算公式变形,如下:

先将EUF整合,然后采用类似OptimizeMEU()的方法来求解。
相关知识点:
Arrhythmogenic Right Ventricular Dysplasia (ARVD): 心律失常性右室心肌病
implantable cardioverter defibrillator(ICD):植入型心律转复除颤器,与手术治疗ARVD有关。
ARVD的influence diagrams如下:
其中的ARVD变量节点为X,其表示是否得有ARVD;它受先验X3影响;对ARVD的一些观察结果用T表示;决策变量为D(有时候也用A表示),决定是否进行ICD手术,
它与T相关;节点O为是否出现bad outcome,由X和D决定;最后的效用节点D由O和D决定。
简单决策包括下面几个部分:一个动作序列A,一般用矩形表示;一个状态序列X,一般用椭圆表示;一个分布P(X|A);一个效用函数U(X,A);效用节点U一般用菱形表示。
Expected utility(期望效用)表示做出某个决策后的期望效用,效用值不一定是概率,它是一个实数,可以为负。其计算公式如下:

MEU(最大期望效用):也就是说做出某个决策后得到的效用最大。此时的决策a计算公式为:
Information edge:指那些与动作节点相连的状态节点之间的edge.这些information edge构成了一个决策规则,用CPD来描述。有information edge的期望效用计算
公式为:

对应的最大期望效用计算公式为:

决策理论可以将PGM中的一些inference方法引进来。
多属性效用函数(Multi-Attribute Utilities):通常情况下效用值受多个变量影响,可以将这些变量整合到一个效用函数中。关于多属性效用函数更详细的理解可参考网友demonstrate 的 blog:PGM 读书笔记节选(十七).
效用不能单纯从概率上来看,效用函数应该能体现用户对结果的偏好,它一般需考虑做决策时的风险。
VPI(value of perfect information ):增加一条information edge到决策变量前后的MEU变化量。VPI>=0成立。
参考资料:
coursera课程:Probabilistic Graphical Models
Daphne Koller,Probabilistic Graphical Models Principles and Techniques书籍第22章
机器学习&数据挖掘笔记_22(PGM练习六:制定决策)的更多相关文章
- 机器学习&数据挖掘笔记_14(GMM-HMM语音识别简单理解)
为了对GMM-HMM在语音识别上的应用有个宏观认识,花了些时间读了下HTK(用htk完成简单的孤立词识别)的部分源码,对该算法总算有了点大概认识,达到了预期我想要的.不得不说,网络上关于语音识别的通俗 ...
- 机器学习&数据挖掘笔记(常见面试之机器学习算法思想简单梳理)
机器学习&数据挖掘笔记_16(常见面试之机器学习算法思想简单梳理) 作者:tornadomeet 出处:http://www.cnblogs.com/tornadomeet 前言: 找工作时( ...
- [转]机器学习&数据挖掘笔记_16(常见面试之机器学习算法思想简单梳理)
机器学习&数据挖掘笔记_16(常见面试之机器学习算法思想简单梳理) 转自http://www.cnblogs.com/tornadomeet/p/3395593.html 前言: 找工作时(I ...
- 机器学习&数据挖掘笔记_16(常见面试之机器学习算法思想简单梳理)
前言: 找工作时(IT行业),除了常见的软件开发以外,机器学习岗位也可以当作是一个选择,不少计算机方向的研究生都会接触这个,如果你的研究方向是机器学习/数据挖掘之类,且又对其非常感兴趣的话,可以考虑考 ...
- 机器学习&数据挖掘笔记_25(PGM练习九:HMM用于分类)
前言: 本次实验是用EM来学习HMM中的参数,并用学好了的HMM对一些kinect数据进行动作分类.实验内容请参考coursera课程:Probabilistic Graphical Models 中 ...
- 机器学习&数据挖掘笔记_24(PGM练习八:结构学习)
前言: 本次实验包含了2部分:贝叶斯模型参数的学习以及贝叶斯模型结构的学习,在前面的博文PGM练习七:CRF中参数的学习 中我们已经知道怎样学习马尔科夫模型(CRF)的参数,那个实验采用的是优化方法, ...
- 机器学习&数据挖掘笔记_20(PGM练习四:图模型的精确推理)
前言: 这次实验完成的是图模型的精确推理.exact inference分为2种,求边缘概率和求MAP,分别对应sum-product和max-sum算法.这次实验涉及到的知识点很多,不仅需要熟悉图模 ...
- 机器学习&数据挖掘笔记_23(PGM练习七:CRF中参数的学习)
前言: 本次实验主要任务是学习CRF模型的参数,实验例子和PGM练习3中的一样,用CRF模型来预测多张图片所组成的单词,我们知道在graph model的推理中,使用较多的是factor,而在grap ...
- 机器学习&数据挖掘笔记_21(PGM练习五:图模型的近似推理)
前言: 这次练习完成的是图模型的近似推理,参考的内容是coursera课程:Probabilistic Graphical Models . 上次实验PGM练习四:图模型的精确推理 中介绍的是图模型的 ...
随机推荐
- document.write 摘抄
页面载入过程中用实时脚本创建页面内容,以及用延时脚本创建本窗口或新窗口的内容.该方法需要一个字符串参数,它是写到窗口或框架中的HTML内容.这些字符串参数可以是变量或值为字符串的表达式,写入的内容常常 ...
- Jquery的multifile使用随记
1.多文件上传: 2.如上几个验证不重复,和限制上传数量的验证显示的是英文,改成中文文本时,如果不用国标解码,到时候提示框会出现乱码现象.所以一般需要中文显示的时候,我们应该这样做: 拿denied做 ...
- python if
根据用户从控制如输入数据,使用if语句实现用户登录功能 代码如下: name = "zy"password = "123"_name = input(" ...
- Git撤销提交
本文链接:http://volnet.github.io/#!docs/git/reset-to-old-version.md 在使用Git进行版本管理的时候,经常会遇到一些错误的提交. 在开始演示之 ...
- Ember.js之动态创建模型
本人原文地址发布在:点击这里 What problem did we meet? As ember document suggestion, we may define a model as a st ...
- Java虚拟机7:内存分配原则
前言 对象的内存分配,往大的方向上讲,就是在堆上分配,少数情况下也可能会直接分配在老年代中,分配的规则并不是百分之百固定的,其细节决定于当前使用的是哪种垃圾收集器组合,当然还有虚拟机中与内存相关的参数 ...
- 《你必须知道的.NET》读书笔记三:体验OO之美
此篇已收录至<你必须知道的.Net>读书笔记目录贴,点击访问该目录可以获取更多内容. 一.依赖也是哲学 (1)本质诠释:“不要调用我们,我们会调用你” (2)依赖和耦合: ①无依赖,无耦合 ...
- Javascript函数节流
最近在做网页的时候有个需求,就是浏览器窗口改变的时候需要改一些页面元素大小,于是乎很自然的想到了window的resize事件,于是乎我是这么写的 <!DOCTYPE html> < ...
- php json与xml序列化/反序列化
在web开发中对象的序列化与反序列化经常使用,比较主流的有json格式与xml格式的序列化与反序列化,今天想写个jsop的小demo,结果发现不会使用php序列化,查了一下资料,做个笔记 简单数组js ...
- zk系列-zookeeper概述
接触zk是2年前了,最近工作又比较依赖于zk,所以准备起个系列文章,系统的总结下. zookeeper是一个分布式的用于协调的服务,起源于Hadoop中的一个组件.分布式系统可以用zookeeper实 ...