最近感觉对EM算法有一点遗忘，在表述的时候，还是有一点说不清，于是重新去看了这篇<CS229 Lecture notes>笔记. 于是有了这篇小札.

关于Jensen's inequality不等式:

　　Corollary(推论)：

　　如果函数f(x)为凸函数,那么在 f(x) 上任意两点X1,X2所作割线一定在这两点间的函数图象的上方，即：

　　其中t表示【x1,x2】的位置

举例子：当t=1/2 ; 1/2*f(x1) + 1/2*f(x2) >= f( 1/2*x1 + 1/2*x2 );

或者我们直接抽象的表示为： E[f(X)] ≥ f(EX) ，其中E表示期望.

那么这个 Jensen's inequality（Jensen's 不等式在EM算法中起到什么作用呢？）这里我们先不表.

关于极大似然评估(MLE)：

　　假定存在一个样本集 D= {x1,x2,...,Xm },为M个独立分布的样本. 假设似然函数为: 联合概率密度函数P(D ; θ) ，其中(P(D ; θ)这种表示相当于P(D),只是存在未知参数θ)

　　我们知道了似然函数之后，将样本数据展开:

　　　　　　　　　　　　　　 P(D ; θ) = p(x1,x2,...,Xm;θ) = ∏^m_i=1p(xi ; θ)

　　我们令 L( Z ) = ∏^m_i=1p(xi ; θ) ,如果存在θi 使得 L(θ)最大，我们认为θi为θ的极大似然估计量,同时我们认为θi(x1,x2,...,xm)为样本集D的极大似然函数估计量

关于求解极大似然函数：

　　　　　　求使得出现该组样本的概率最大的θ值。

　　　　 θi = argmax(L(θ)) = argmax( ∏^m_i=1p(xi ; θ) );

继续回到上面的公式：

　　　　　　L( θ ) = ∏^m_i=1p(xi ; θ); 要使得L(θ)最大，那么对这个公式进一步化解：

　　　　　 等价于：　log( L(θ) ) = log( ∏^m_i=1p(xi ; θ) ) = ∑^m _i=1 P(xi ;θ)

　　　　　　　(∑^m _i=1 P(xi ;θ))' = d( ∑^m _i=1 P(xi ;θ) ) / d(θ) =0 ; 求导得 θ的解 　　　　　　　　　　　　　　　　　　

关于极大似然求解的步骤：

　　　（1）写出似然函数；

（2）对似然函数取对数，并整理；

（3）求导数；

（4）解似然方程。

我们先来看文章给出的这样一个问题：

　　　　 比如我们有一个训练集合X={ x1 , x2 , .... , Xm};里面包含M个样本. 我们希望将模型p(x，z)的参数与训练集合数据进行拟合，其中的函数-对数似然是:

　　我们想上面求解极大似然函数一样来求解这个似然函数：

　　　　　　　　对它进行微分方程，求导 d( L(θ) ) / d( θ ) =0; ？我们很快就发现无法求解，因为存在新的未知变量Z(隐变量)；如何来解释这个隐变量Z呢？

比如这样一个例子:

　　　　　　比如有A,B两个人比赛随机打靶，每个人每次打4枪，当命中九环以内，包括九环,是记录为1，否则记录为0; 但是由于裁判熬夜玩游戏，比赛完成是，收集比赛结果时，搞混了靶纸。于是整理出如下结果:

靶纸结果
人名	结果
未知	1011
未知	0011
未知	1101
未知	0101
未知	1011
未知	0010
未知	1111
未知	1011

问A命中九环的概率pa，B命中九环的概率pb?

而这里的隐变量Z就是人名的顺序。

面对这个问题，显然使用极大似然函数去正面扛困难重重,EM算法为这个问题，提供了一个很好的思路：

　　　　求解分两步走：

　　　　　　　　 E step 期望阶段：

　　　　　　　　　　　　先假定，即初始化A,B命中的概率pa0=0.2 , pb0=0.5;

　　　　　　　　求出8次打靶中，该次打靶的结果是A,B的可能性即概率:

　　　　　　　　　　第一次打靶：如果是A的打靶结果： 0.2*0.8*0.2*0.2=0.0064

　　　　如果是B的打靶结果: 0.5^4 =0.0625

第i次是A,B打靶的结果概率
第i次打靶	A	B
1	0.0064	0.0625
2	0.0256	0.0625
3	0.0064	0.0625
4	0.0256	0.0625
5	0.0064	0.0625
6	0.1024	0.0625
7	0.0016	0.0625
8	0.0064	0.0625

如此，我们依据极大似然函数，来确定每一轮是谁打的

　　1轮: P(A1)<P(B1),

由上面这个表，我们在假定的前提下，计算出了A或者B的出现每轮打靶结果的概率；我们可以依据这个结果，进一步计算第i次是A,B打靶的相对概率

求出8次打靶中，该次打靶的结果是A,B的相对可能性即概率:

　　　　　　　　　　第一次打靶：如果是A的打靶结果： 0.0064/(0.0064 + 0.0625) =0.0928

　　　　如果是B的打靶结果: 0.0625/(0.0064 + 0.0625) =0.9072

第i次是A,B打靶结果的概率
第i次打靶	A	B
1	0.0928	0.9072
2	0.290	0.710
3	0.0928	0.9072
4	0.290	0.710
5	0.0928	0.9072
6	0.620	0.380
7	0.0249	0.9751
8	0.0928	0.9072

　　　　我们先假定A，B命中的概率pa1,pb1，然后去推到它们比赛的顺序，再依据比赛的顺序，来计算A,B命中的概率Pa2,pb2. 当pa2,pb2和pa1,pb2结果相差时较大时，

将pa2,pb2代入，继续推到它们的比赛顺序，计算A,B命中的概率

读吴恩达算-EM算法笔记的更多相关文章

吴恩达(Andrew Ng)——机器学习笔记1
之前经学长推荐,开始在B站上看Andrew Ng的机器学习课程.其实已经看了1/3了吧,今天把学习笔记补上吧. 吴恩达老师的Machine learning课程共有113节(B站上的版本https:/ ...
吴恩达机器学习CS229课程笔记学习
监督学习(supervised learning) 假设我们有一个数据集(dataset),给出居住面积和房价的关系如下: 我们以居住面积为横坐标,房价为纵坐标,组成数据点,如(2104, 400), ...
Coursera 吴恩达深度学习学习笔记
神经网络和深度学习 Week 1-2 神经网络基础 Week 3 浅层神经网络 Week 4 深层神经网络改善深层神经网络 Week 1 深度学习的实用层面 Week 2 优化算法 Week 3 超 ...
吴恩达Machine Learning学习笔记（四）--BP神经网络
解决复杂非线性问题 BP神经网络模型表示 theta->weights sigmoid->activation function input_layer->hidden_layer ...
吴恩达Machine Learning学习笔记（一）
机器学习的定义 A computer program is said to learn from experience E with respect to some class of tasks T ...
吴恩达Machine Learning学习笔记（三）--逻辑回归+正则化
分类任务原始方法:通过将线性回归的输出映射到0-1,设定阈值来实现分类任务改进方法:原始方法的效果在实际应用中表现不好,因为分类任务通常不是线性函数,因此提出了逻辑回归逻辑回归假设表示--引入 ...
吴恩达Machine Learning学习笔记（二）--多变量线性回归
回归任务多变量线性回归公式 h为假设,theta为模型参数(代表了特征的权重),x为特征的值参数更新梯度下降算法影响梯度下降算法的因素 (1)加速梯度下降:通过让每一个输入值大致在相同的范围 ...
吴恩达《机器学习》课程笔记——第六章：Matlab/Octave教程
上一篇 ※※※※※※※※ [回到目录] ※※※※※※※※ 下一篇这一章的内容比较简单,主要是MATLAB的一些基础教程,如果之前没有学过matlab建议直接找一本相关书籍,边做边学,matl ...
笔记：《机器学习训练秘籍》——吴恩达deeplearningai微信公众号推送文章
说明该文为笔者在微信公众号:吴恩达deeplearningai 所推送<机器学习训练秘籍>系列文章的学习笔记,公众号二维码如下,1到15课课程链接点这里该系列文章主要是吴恩达先生在机器 ...

随机推荐

SVM：利用SVM算法实现手写图片识别(数据集50000张图片)—Jason niu
import mnist_loader # Third-party libraries from sklearn import svm def svm_baseline(): training_dat ...
Kafka 概念、单机搭建与使用
目录 Kafka 概念.单机搭建与使用基本概念介绍 Topic Producer Consumer Kafka单机配置,一个Broker 环境: 配置zookeeper 配置Kafka 使用Kafk ...
解决Command "python setup.py egg_info" failed with error code 1 in /tmp/pip-install-f8IeEI/MYSQL-python/
Command "python setup.py egg_info" failed with error code 1 in /tmp/pip-install-f8IeEI/MYS ...
ord() expected string of length 1, but int found
源代码是这样: s=b'^SdVkT#S ]`Y\\!^)\x8f\x80ism' key='' for i in s: i=ord(i)-16 key+=chr(i^32) prin ...
在UnrealEngine中用Custom节点实现毛玻璃的效果
本人在论坛上找到了一篇实现毛玻璃效果的文章:https://forums.unrealengine.com/showthread.php?70143-So-Blurred-glass-material ...
Java并发编程（五）-- Java内存模型补充
前面我们已经介绍了:当对象和变量存储到计算机的各个内存区域时,必然会遇到的两个问题及解决方法共享对象的可见性-- 解决方法:使用java volatile关键字共享对象的竞争现象 -- 解决方法: ...
2011 ACM 0和1思想
题目:http://acm.hdu.edu.cn/showproblem.php?pid=2011 题意:求1 - 1/2 + 1/3 - 1/4 + 1/5 - 1/6 + ...前n项的和. 思路 ...
Android的系统属性：build.propSystemProperties
获取build.prop的键值信息: String sn = SystemProperties.get(SN_INFO); 其中key值为: public static final String SN ...
等差数列 [USACO Training Section 1.4]
题目描述一个等差数列是一个能表示成a, a+b, a+2b,…, a+nb (n=0,1,2,3,…)的数列. 在这个问题中a是一个非负的整数,b是正整数.写一个程序来找出在双平方数集合(双平方数集 ...
multiprocess模块
什么是进程什么是进程进程是计算机中的程序关于某数据集合一次运行活动,是系统进行资源分配和调度的基本单位,是操作系统结构的基础,进程与进程之间数据隔离,执行过程异步为什么会出现进程的概念合理利用 ...

读吴恩达算-EM算法笔记

我们先来看文章给出的这样一个问题：

读吴恩达算-EM算法笔记的更多相关文章

随机推荐

热门专题