Expectation maximization - EM算法学习总结

原创博客，转载请注明出处 Leavingseason http://www.cnblogs.com/sylvanas2012/p/5053798.html

EM框架是一种求解最大似然概率估计的方法。往往用在存在隐藏变量的问题上。我这里特意用"框架"来称呼它，是因为EM算法不像一些常见的机器学习算法例如logistic regression， decision tree，只要把数据的输入输出格式固定了，直接调用工具包就可以使用。可以概括为一个两步骤的框架：

E-step：估计隐藏变量的概率分布期望函数（往往称之为Q函数，它的定义在下面会详细给出）；

M-step：求出使得Q函数最大的一组参数

实际使用过程中，我们先要根据不同的问题先推导出Q函数，再套用E-M两步骤的框架。

下面来具体介绍为什么要引入EM算法？

不妨把问题的全部变量集（complete data）标记为X，可观测的变量集为Y，隐藏变量集为Z，其中X = (Y , Z) . 例如下图的HMM例子, S是隐变量，Y是观测值：

又例如，在GMM模型中（下文有实例），Y是所有观测到的点，z_i 表示 y_i 来自哪一个高斯分量，这是未知的。

问题要求解的是一组参数，使得最大。在求最大似然时，往往求的是对数最大：（1）

对上式中的隐变量做积分（求和）：

（2）式往往很难直接求解。于是产生了EM方法，此时我们想要最大化全变量（complete data）X的对数似然概率：假设我们已经有了一个模型参数的估计（第0时刻可以随机取一份初始值），基于这组模型参数我们可以求出一个此时刻X的概率分布函数。有了X的概率分布函数就可以写出的期望函数，然后解出使得期望函数最大的值，作为更新的参数。基于这个更新的再重复计算X的概率分布，以此迭代。流程如下：

Step 1：随机选取初始值

Step 2：给定和观测变量Y，计算条件概率分布

Step 3：在step4中我们想要最大化，但是我们并不完全知道X（因为有一些隐变量），所以我们只好最大化的期望值，而X的概率分布也在step 2 中计算出来了。所以现在要做的就是求期望，也称为Q函数：

其中，表示给定观测值y时所有可能的x取值范围，即

Step 4 求解

Step 5 回到step 2，重复迭代下去。

为什么要通过引入Q函数来更新theta的值呢？因为它和我们的最大化终极目标（公式（1））有很微妙的关系：

定理1：

证明：在step4中，既然求解的是arg max，那么必然有。于是：

其中，（3）到（4）是因为X=(Y , Z), y=T(x), T是某种确定函数，所以当x确定了，y也就确定了（但反之不成立）；即：而（4）中的log里面项因为不包含被积分变量x，所以可以直接提到积分外面。

所以E-M算法的每一次迭代，都不会使目标值变得更差。但是EM的结果并不能保证是全局最优的，有可能收敛到局部最优解。所以实际使用中还需要多取几种初始值试验。

实例：高斯混合模型GMM

假设从一个包含k个分量的高斯混合模型中随机独立采样了n个点，现在要估计所有高斯分量的参数。例如图（a）就是一个k=3的一维GMM。

高斯分布函数为：

令为第m次迭代时，第i个点来自第j个高斯分量的概率，那么：

并且

因为每个点是独立的，不难证明有：

于是首先写出每个：

忽略常数项，求和，完成E-step：

为简化表达，再令，

Q函数变为：

现在到了M-step了，我们要解出使得Q函数最大化的参数。最简单地做法是求导数为0的值。

首先求w。因为w有一个约束：

可以使用拉格朗日乘子方法。除去和w无关的项，写出新的目标函数：

求导：

很容易解出w：

同理解出其他参数：

总结：个人觉得，EM算法里面最难懂的是Q函数。初次看教程的时候，很能迷惑人，要弄清楚是变量，是需要求解的；是已知量，是从上一轮迭代推导出的值。

Expectation maximization - EM算法学习总结的更多相关文章

EM（Expectation Maximization）算法
EM(Expectation Maximization)算法参考资料: [1]. 从最大似然到EM算法浅解 [2]. 简单的EM算法例子 [3]. EM算法)The EM Algorithm(详尽 ...
EM算法学习资料备忘
将学习EM算法过程中看到的好的资料汇总在这里,供以后查询.也供大家參考. 1. 这是我学习EM算法最先看的优秀的入门文章,讲的比較通俗易懂,并且举了样例来说明当中的原理.不错! http://blog ...
EM算法学习笔记
转载请注明出处: http://www.cnblogs.com/gufeiyang 首先考虑这么一个问题.操场东边有100个男生,他们的身高符合高斯分布.操场西边有100个女生,她们的身高也符合高斯分 ...
EM算法(Expectation Maximization)
1 极大似然估计假设有如图1的X所示的抽取的n个学生某门课程的成绩,又知学生的成绩符合高斯分布f(x|μ,σ2),求学生的成绩最符合哪种高斯分布,即μ和σ2最优值是什么? 图1 学生成绩的分 ...
机器学习五 EM 算法
目录引言经典示例 EM算法 GMM 推导参考文献: 引言 Expectation maximization (EM) 算法是一种非常神奇而强大的算法. EM算法于 1977年由Dempster ...
Expectation Maximization and GMM
Jensen不等式 Jensen不等式给出了积分的凸函数值必定大于凸函数(convex)的积分值的定理.在凸函数曲线上的任意两点间连接一条线段,那么线段会位于曲线之上,这就是将Jensen不等式应用到 ...
EM算法详解
EM算法详解 1 极大似然估计假设有如图1的X所示的抽取的n个学生某门课程的成绩,又知学生的成绩符合高斯分布f(x|μ,σ2),求学生的成绩最符合哪种高斯分布,即μ和σ2最优值是什么? 图1 学生成 ...
EM算法(Expectation Maximization Algorithm)
EM算法(Expectation Maximization Algorithm) 1. 前言这是本人写的第一篇博客(2013年4月5日发在cnblogs上,现在迁移过来),是学习李航老师的< ...
最大期望算法 Expectation Maximization概念
在统计计算中,最大期望(EM,Expectation–Maximization)算法是在概率(probabilistic)模型中寻找参数最大似然估计的算法,其中概率模型依赖于无法观测的隐藏变量(Lat ...

随机推荐

yum安装mariadb
安装mysql yum install mariadb mariadb-server MySQL-python mysql-devel Package MySQL-python-1.2.5-1.ibm ...
Angular动态注册组件(controller,service...)
使用angular的场景一般是应用类网站这也意味着会有很多的controller,service,directive等等正常情况下我们要把这些内容一次性下载并注册,由于文件较多,对首次加载的效率影 ...
MySQL 如何修改字符集 utf8 改为 utf8mb4
在实行sql server 向 mysql 迁移数据时,报错: Incorrect string value: '\xF0\x9F\x98\x8A' 原因是mysql 采用的是 utf8 的字符集,而 ...
由IP和掩码计算广播地址
public static IPAddress GetBroadcast(IPAddress ipAddress, IPAddress subnetMask) { var ip = ipAddress ...
sigemptyset,sigfillset,sigaddset,sigdelset,sigismember,sigprocmask,sigpendmask作用
SYNOPSIS #include <signal.h> int sigemptyset(sigset_t *set); int sigfillset(sigset_t *set); in ...
SQL Server 2012 AlwaysOn集群配置指南
1. AlwaysOn介绍 AlwaysOn是SQL Server 2012提供的全新综合.灵活.高效经济的高可用性和灾难恢复解决方案.它整合了镜像和群集的功能,基于OS 故障转移群集(Windows ...
Oracle查询字符集
select * from nls_database_parameters 备忘一下.
Ngrok远程桌面及ssh配置
上一篇Ngrok 内网穿透利器使用教程我们讲到Ngrok的基本使用教程,这篇描述一下Ngrok的远程桌面及ssh配置 Step 1 修改配置文件ngrok.cfg server_addr: &quo ...
css中table tr:nth-child(even)改变tr背景颜色： IE7,8无效
例如: .my_table tr:nth-child(even){ background:#E6EDF5; } .my_table tr:nth-child(odd){ background:#F0F ...
第24章 SEH结构化异常处理_异常处理及软件异常
24.1 程序的结构 (1)try/except框架 __try{ //被保护的代码块 …… } __except(except fileter/*异常过滤程序*/){ //异常处理程序 } (2) ...

Expectation maximization - EM算法学习总结

Expectation maximization - EM算法学习总结的更多相关文章

随机推荐

热门专题