摘要

　　EM算法全称为Expectation Maximization Algorithm，既最大期望算法。它是一种迭代的算法，用于含有隐变量的概率参数模型的最大似然估计和极大后验概率估计。EM算法经常用于机器学习和机器视觉的聚类领域，是一个非常重要的算法。而EM算法本身从使用上来讲并不算难，但是如果需要真正的理解则需要许多知识的相互串联。

引言

　　EM算法是机器学习十大经典算法之一。EM算法既简单有复杂，简单的在于他的思想而复杂则在于他的数学推理和复杂的概率公式。作为我这个新手来讲，决定先捡大的部分，因此文章我们会更加着重概念的理解，至于公式的推导，在上过课以后其实也不是那么的困难，主要一点是你需要有非常扎实的数学功底，EM算法的推导过程基本上涵盖了我们前面所有讲到的数学知识。因此，如果看不懂EM算法大概是因为基础知识太弱了需要补习。

预备知识：

　　贝叶斯网络、概率论与数理统计、凸优化

一、EM算法

　　实际问题：随机挑选10000位志愿者，测量他们的身高：若样本中存在男性和女性，身高分别服从N(μ1,σ1)和N(μ2,σ2)的分布，试估计μ1,σ1,μ2,σ2。

　　1、提出

　　假定有训练集，包含m个独立样本，希望从中找到该组主句的模型的参数。

　　2、建立目标函数

　　我们利用极大似然估计来建立目标函数：，z是隐随机变量，不方便直接找到参数估计。

　　策略：计算下界，求该下界的最大值；重复该过程，直到收敛到局部最大值。

　　利用利用Jesenbu不等式，寻找尽量紧的下界，寻找尽量紧的下界。

　　令是z的某一个分布，有：

　　为了使等号成立：

　　有：

　　根据上述推导，有EM算法框架：

　　E-step（求条件分布）

　　M-step（求期望）

　　相互迭代，求的。

二、高斯混合模型GMM

　　目的：随机变量X是有K个高斯分布混合而成，取各个高斯分布的概率为π1π2...πK，第i个高斯分布的均值为μi，方差为Σi。若观测到随机变量X的一系列样本x1,x2,...,xn，试估计参数π，μ，Σ。

　　1、直观求解：

　　对数似然函数：

　　由于在对数函数里面又有加和，我们没法直接用求导解方程的办法直接求得极大值。为了解决这个问题，我们分成两步。

　　第一步：估计数据由每个组份生成的概率

　　对于每个样本xi，它由第k个组份生成的概率为：

　　上式中的μ和Σ也是待估计的值，因此采样迭代法：在计算γ(i,k)时假定μ和Σ已知；γ(i,k)亦可看成组份k在生成数据xi时所做的贡献。

　　第二步：估计每个组份的参数

　　对于所有的样本点，对于组份k而言，可看做生成了这些点。组份k是一个标准的高斯分布，利用上面的结论：

　　2、EM方法求解：

　　E-step:

　　M-step：将多项分布和高斯分布的参数带入

　　对均值求偏导：

　　令上式等于0，解的均值：

　　高斯分布的方差：求偏导，等于0

　　详细参考：http://blog.csdn.net/zouxy09/article/details/8537620

机器学习之EM算法（五）的更多相关文章

斯坦福大学机器学习，EM算法求解高斯混合模型
斯坦福大学机器学习,EM算法求解高斯混合模型.一种高斯混合模型算法的改进方法---将聚类算法与传统高斯混合模型结合起来的建模方法, 并同时提出的运用距离加权的矢量量化方法获取初始值,并采用衡量相似度的 ...
关于机器学习－EM算法新解
我希望自己能通俗地把它理解或者说明白,但是,EM这个问题感觉真的不太好用通俗的语言去说明白,因为它很简单,又很复杂.简单在于它的思想,简单在于其仅包含了两个步骤就能完成强大的功能,复杂在于它的数学推理 ...
【机器学习】EM算法详细推导和讲解
今天不太想学习,炒个冷饭,讲讲机器学习十大算法里有名的EM算法,文章里面有些个人理解,如有错漏,还请读者不吝赐教. 众所周知,极大似然估计是一种应用很广泛的参数估计方法.例如我手头有一些东北人的身高的 ...
【机器学习】--EM算法从初识到应用
一.前述 Em算法是解决数学公式的一个算法,是一种无监督的学习. EM算法是一种解决存在隐含变量优化问题的有效方法.EM算法是期望极大(Expectation Maximization)算法的简称,E ...
机器学习笔记—EM 算法
EM 算法所面对的问题跟之前的不一样,要复杂一些. EM 算法所用的概率模型,既含有观测变量,又含有隐变量.如果概率模型的变量都是观测变量,那么给定数据,可以直接用极大似然估计法,或贝叶斯估计法来估计 ...
机器学习：EM算法
EM算法各类估计最大似然估计 Maximum Likelihood Estimation,最大似然估计,即利用已知的样本结果,反推最有可能(最大概率)导致这样结果的参数值的计算过程. 直白来讲,就 ...
机器学习——EM算法
1 数学基础在实际中,最小化的函数有几个极值,所以最优化算法得出的极值不确实是否为全局的极值,对于一些特殊的函数,凸函数与凹函数,任何局部极值也是全局极致,因此如果目标函数是凸的或凹的,那么优化算法 ...
机器学习五 EM 算法
目录引言经典示例 EM算法 GMM 推导参考文献: 引言 Expectation maximization (EM) 算法是一种非常神奇而强大的算法. EM算法于 1977年由Dempster ...
简单易学的机器学习算法——EM算法
简单易学的机器学习算法——EM算法一.机器学习中的参数估计问题在前面的博文中,如“简单易学的机器学习算法——Logistic回归”中,采用了极大似然函数对其模型中的参数进行估计,简单来讲即对于一系 ...

随机推荐

【shiro】(5)---基于Shiro的权限管理
基于Shiro的权限管理项目搭建前面写了四篇有关权限的文章,算是这篇文章的铺垫了.这篇文章采用开发环境 JDK1.8 Eclipse Mav ...
全网最详细的基于Ubuntu14.04/16.04 + Anaconda2 / Anaconda3 + Python2.7/3.4/3.5/3.6安装Tensorflow详细步骤（图文）（博主推荐）
不多说,直接上干货! 前言建议参照最新的tensorflow安装步骤(Linux,官方网站经常访问不是很稳定,所以给了一个github的地址): https://github.com ...
border-image属性把边框的背景设置为图片
一.浏览器对它的支持Firefox3.5-Firefox15 需要加-moz-前缀Firefox15以上同样支持-moz-前缀的css代码,但是必须在css代码中加 ...
Elasticsearch实践（一）：基础入门
本文以 Elasticsearch 6.2.4为例. 注:最新(截止到2018-09-23)的 Elasticsearch 是 6.4.1.5.x系列和6.x系列虽然有些区别,但基本用法是一样的. 官 ...
MFC应用技术之CTreeControl的使用
MFC应用技术之CTreeControl的使用一丶MFC添加树控件.添加父节点跟子节点. MFC上面放一个树控件.并未这个树控件绑定变量.然后添加一个按钮.按钮的作用就是添加父节点跟子节点. PS: ...
【原创】深入理解c++的右值引用
0 左值和右值一个左值表达式代表的是对象本身,而右值表达式代表的是对象的值:变量也是左值. 1 右值引用作用为了支持移动操作(包括移动构造函数和移动赋值函数),C++才引入了一种新的引 ...
spring-boot (三) spring data jpa
学习文章来自:http://www.ityouknow.com/spring-boot.html spring data jpa介绍首先了解JPA是什么? JPA(Java Persistence ...
痞子衡嵌入式：SEGGER J-Link仿真器硬件版本变迁
大家好,我是痞子衡,是正经搞技术的痞子.今天痞子衡给大家介绍的是J-Link仿真器版本变迁. 硬件版本主控芯片固件升级工具 V7 ARM7TDMI, 55MHz Atmel AT91SAM7S64 ...
给HTML页面指定元素添加属性，添加父元素
给HTML页面指定元素添加属性,添加父元素下面拿一个给富文本中所有的图片增加layer弹窗效果. 思路: 给富文本父元素设置属性. 获取父元素里所有的img 此处用到querySelectorA ...
Logback中使用TurboFilter实现日志级别等内容的动态修改
可能看到这个标题,读者会问:要修改日志的级别,不是直接修改log.xxx就好了吗?为何要搞那么复杂呢?所以,先说一下场景,为什么要通过TurboFilter去动态的修改日志级别.我们在使用Java开发 ...

机器学习之EM算法（五）

摘要

引言

一、EM算法

二、高斯混合模型GMM

机器学习之EM算法（五）的更多相关文章

随机推荐

热门专题