Hidden Markov Models笔记

Andrew Ng CS229 讲义： https://pan.baidu.com/s/12zMYBY1NLzkluHNeMNO6MQ

HMM模型常用于NLP、语音等领域。

马尔科夫模型（Markov Model）

只有状态序列z。状态转移矩阵A。

有限视野假设（limited horizon assumption），Markov性：

静态过程假设（stationary process assumption），参数时不变性：

两个问题：1）概率问题，2）学习问题

问题1）概率问题：已知转移矩阵A，求某观测状态序列z的概率是多少

根据有限视野假设，

带入计算即可。

问题2）学习问题：已知观测状态序列z，求参数A最大化z出现的概率

使用最大似然估计，最大化log似然函数

即求解问题

转化为Lagrange multipliers：

分别对参数求偏导并令其为零：

代入得到状态转移矩阵A的估计：

隐马尔科夫模型（Hidden Markov Model）

状态序列z，观测序列x。状态转移矩阵A，发射（生成输出）矩阵B。

输出独立假设（output independence assumption）：

三个问题：1）概率问题，2）解码问题，3）学习问题

1）概率问题：已知转移矩阵A、发射矩阵B，求观测序列x的概率 - 前向算法

根据输出独立假设，

更快的做法是动态规划，即前向算法。

定义

重新推导概率：

类似地，对应有后向算法：

2）解码问题：已知转移矩阵A、发射矩阵B，观测序列x，求状态序列z的概率 - Viterbi算法

使用贝叶斯定理：

更快的做法同样是动态规划。和前向算法不同的地方在于，使用最大化操作代替求和操作，即Viterbi算法。也就是说，现在是跟踪最大化见过的观测子序列的概率，而不是前向算法是对见过的观测子序列的概率全部求和。

3）学习问题：已知观测序列x，求转移矩阵A、发射矩阵B - Baum-Welch算法（前向-后向算法）

可以理解x是一个很长的序列，和通常的监督学习问题不同在于并非是批量的label-feature样本。

状态序列是隐变量序列。根据EM算法，E步找一个下界逼近目标函数，M步调整参数最大化这个下界：

转化为Lagrange multipliers：

分别对参数求偏导并令其为零：

代入得到参数A，B的估计：

对A的分子部分使用bayes定理并用前向算法和后向算法转化：

A的分母部分类似：

综合得到A的估计：

同理得到B的估计：

实际计算中直接计算充分统计量

和通常的EM求解的问题类似，也是非凸问题，容易陷入局部极值。因此需要做不同的初始化运行多次算法。另外，对于没有样本覆盖到A、B的转移或发射概率的实际问题，需要做平滑操作。

Hidden Markov Models笔记的更多相关文章

隐马尔科夫模型(Hidden Markov Models)
链接汇总 http://www.csie.ntnu.edu.tw/~u91029/HiddenMarkovModel.html 演算法笔记 http://read.pudn.com/downloads ...
PRML读书会第十三章 Sequential Data（Hidden Markov Models，HMM）
主讲人张巍 (新浪微博: @张巍_ISCAS) 软件所-张巍<zh3f@qq.com> 19:01:27 我们开始吧,十三章是关于序列数据,现实中很多数据是有前后关系的,例如语音或者DN ...
机器学习 Hidden Markov Models 1
Introduction 通常,我们对发生在时间域上的事件希望可以找到合适的模式来描述.考虑下面一个简单的例子,比如有人利用海草来预测天气,民谣告诉我们说,湿漉漉的海草意味着会下雨,而干燥的海草意味着 ...
机器学习 Hidden Markov Models 2
Hidden Markov Models 下面我们给出Hidden Markov Models(HMM)的定义,一个HMM包含以下几个要素: ∏=(πi)表示初始状态的向量.A={aij}状态转换矩阵 ...
隐马尔科夫模型(Hidden Markov Models) 系列之三
转自:http://blog.csdn.net/eaglex/article/details/6418219 隐马尔科夫模型(Hidden Markov Models) 定义隐马尔科夫模型可以用一个 ...
[Bayesian] “我是bayesian我怕谁”系列 - Markov and Hidden Markov Models
循序渐进的学习步骤是: Markov Chain --> Hidden Markov Chain --> Kalman Filter --> Particle Filter Mark ...
机器学习 Hidden Markov Models 3
Viterbi Algorithm 前面我们提到过,HMM的第二类问题是利用HMM模型和可观察序列寻找最有可能生成该观察序列的隐藏变量的序列.简单来说,第一类问题是通过模型计算生成观察序列的概率,而第 ...
隐马尔科夫模型(Hidden Markov Models) 系列之五
转自:http://blog.csdn.net/eaglex/article/details/6458541 维特比算法(Viterbi Algorithm) 找到可能性最大的隐藏序列通常我们都有一 ...
隐马尔科夫模型(Hidden Markov Models) 系列之四
转自:http://blog.csdn.net/eaglex/article/details/6430389 前向算法(Forward Algorithm) 一.如果计算一个可观察序列的概率? 1 ...

随机推荐

Redis面试考点
什么是Redis? Redis 是一个基于内存的高性能key-value数据库. Redis的特点以及缺点? Redis本质上是一个Key-Value类型的内存数据库,很像memcached,整个数据 ...
[转]MySQL时间与字符串相互转换
转至:https://www.cnblogs.com/wangyongwen/p/6265126.html 时间.字符串.时间戳之间的互相转换很常用,但是几乎每次使用时候都喜欢去搜索一下用法:本文整理 ...
Arcgis android 10.2安装方法
请仔细对照博文做!!! 将arcgis android 10.2的压缩包解压 arcgis android 10.2下载地址http://pan.baidu.com/s/1sj2LKO9 Help-& ...
循环对XML文档添加Attribute以及移除Element
如下面的图片要求,需要把左边的xml文改为右边的文档. 需要添加Attribute,移除Element,但是所添加的Attribute值已经跟被移除的Element值不相同.实现方法可以参考<对 ...
动态绑数据(Repeater控件HeaderTemplate和ItemTemplate)
前几天,Insus.NET有写了<动态绑数据(GridView控件Header和ItemTemplate)>http://www.cnblogs.com/insus/p/3303192.h ...
访问其他电脑的c盘
访问其他电脑的c盘 \\192.168.0.1\C$
Sql Server中常用的6个自定义函数分享
转自:http://www.jb51.net/article/56691.htm IF OBJECT_ID('DBO.DISTINCT_STR') IS NOT NULL DROP FUNCTION ...
咕咕（数位dp+AC自动机）
咕咕(数位dp+AC自动机) 若一个字符串的字符集合是0~m-1,那么称它为m进制字符串.给出n个m进制字符串$s_i$,每个字符串的权值为$v_i$.对于另一个m进制字符串$S$,设\( ...
用 LVS 搭建一个负载均衡集群（转）
http://blog.jobbole.com/87503/ 第一篇:<如何生成每秒百万级别的 HTTP 请求?> 第二篇:<为最佳性能调优 Nginx> 第三篇:<用 ...
Java 大数相乘、大数相加、大数相减
思路来源:: https://blog.csdn.net/lichong_87/article/details/6860329 /** * @date 2018/6/22 * @description ...

Hidden Markov Models笔记

Hidden Markov Models笔记的更多相关文章

随机推荐

热门专题