前言

　　预备知识

　　一、估计问题

　　　　1、问题推导

2、前向算法/后向算法

　　二、序列问题

　　总结

前言

HMM隐马尔可夫模型，这个名字看起来熟悉，其实很是陌生。它给人一种很神秘高深的感觉，确实，很强大的一个模型，在概率论统计学应该是应用广泛而且很重要的；虽说很高深强大的一个模型，其原理确实我们最基础的理论知识不断推导计算来的。

上一篇《HMM隐马尔可夫模型来龙去脉（一）》，从HMM基础理论开始，我们可以学习得知，其原理来源于概率论基本重要知识，包括了条件概率、贝叶斯公式、概率分布函数...

而这一篇将继续探索隐马尔可夫模型，深入理解模型背后解决的各种问题，力求基本弄懂这个似乎熟悉而又陌生深奥的模型。接下来探索HMM三个经典的基本问题的解决方案，逐步通过问题推导，公式解析，算法实现，有章可循地真正来理解来龙去脉！

预备知识

建议先翻看前一篇《HMM隐马尔可夫模型来龙去脉（一）》逐步详细介绍的内容。

一般的，将HMM简单表示为一个三元组 $\mu=(A,B,\pi)$ , π是初始状态的概率分布，A是状态转移概率，B是符号发射概率。

由此观察序列 $O=O_1O_2...O_T$ 可以通过以下步骤产生：

根据初识状态的概率分布 $\pi_i$ 选择一个初识状态 $q_1=s_i$ .
设t=1.
根据状态 $s_i$ 的符号发射概率分布 $b_i(k)$ 输出 $O_t=v_k$ .
根据状态转移概率分布 $a_{ij}$ ，将此时 t 的状态转移到新的状态 $q_{t+1}=s_j$ .
t=t+1,如果 t<T ，重复执行步骤3和4，否则结束算法。

一、估计问题

1、问题推导

估计问题：给定一个观察序列 $O=O_1O_2...O_T$ 和模型 $\mu=(A,B,\pi)$ ，如何快速计算序列O的概率。即 $P(O|\mu)$ ?

我们很直观知道，这其实就是一个条件概率的计算问题。在给定的模型条件下，可以推导以下：

首先根据预备知识可以计算任意状态序列Q下，观察序列O的概率：

$P(O|Q)=\prod_{t=1}^{T}P(O_t|q_t)=b_{q_1}(O_1 )\times b_{q_2}(O_2)\times b_{q_T}(O_T)$

而且 $P(Q)=\pi_{q_1}a_{q_1q_2}...a_{q_{T-1}q_T}$ ,

另外根据条件概率 $P(O,Q)=P(O|Q)\times P(Q)$ .

综上公式，求得在模型 $\mu=(A,B,\pi)$ 下，

$P(O)=\sum_{Q}P(O,Q)=\sum_{Q}P(O|Q)P(Q)=\sum_{Q}\pi_{q_1}b_{q_1}(O_1)\prod_{t=1}^{T}a_{q_tq_{t+1}}b_{q_{t+1}}(O_{t+1})$ .

然而，这个直观简单的推导公式，计算时间复杂度达到指数级爆炸！ $N^{T}$ ! ! ! ,所以呢，需要寻找更高效的计算方法来解决指数级时间问题。

由此，引出HMM中的动态规划方法，一般用格架的组织形式描述。格架算法示意图如下：

思想是：对于一个个状态下的HMM，某一时刻结束时，每个格子能够记录HMM所有输出符号的概率，较长子路径概率可以由较短子路径概率计算出来。

2、前向算法/后向算法

第一步，定义一个前向变量 $\alpha_t(i)=P(O_1O_2O_3...O_t,q_t=s_i)$ ，表示在时间 t ，HMM在状态 $s_i$ 输出一个序列的概率。

第二步，根据动态规划思想，在时间 t+1 的概率计算为： $\alpha_{t+1}=(\sum_{i=1}^{N}\alpha_{t}a_{ij})b_j(O_{t+1})$ , 其中表示从状态 i 转移到状态 j 并输出观察符号O的概率。

第三步，根据前向变量，可以计算 $P(O|\mu)$ ，就是在所有状态下观察到序列O的概率：

$P(O|\mu)=\sum_{1=1}^{N}\alpha_T(i)$ .

前向变量归纳关系图：

前向算法总结：

1、初始化： $\alpha_t(i)=\pi_ib_i(O_1),1\leqslant i\leqslant N$

2、归纳计算： $\alpha_{t+1}=(\sum_{i=1}^{N}\alpha_{t}a_{ij})b_j(O_{t+1}),1\leqslant t \leqslant T-1$

3、求和： $P(O|\mu)=\sum_{1=1}^{N}\alpha_T(i)$

复杂度分析：步骤1计算每个前向变量需要考虑N个状态转移，步骤2计算N个前向变量，所以时间复杂度O(N*N)，步骤3在时间1~T过程中，计算量为O(T)，所以总时间复杂度为 $O(N^2T)$ . 因此，使用该算法解决在多项式时间内计算问题。

后向算法方法类似，使用动态规划方法计算，后向变量定义为 $\beta _t(i)=P(O_{t+1}...O_T|q_t=s_i,\mu)$ ，归纳关系图如下：

后向算法总结：

1、初始化： $\beta _T(i)=1,1\leqslant i\leqslant N$

2、归纳计算： $\beta_{t}=\sum_{j=1}^{N}a_{ij}b_j(O_{t+1})\beta_{t+1}(j),1\leqslant t \leqslant T-1;1\leqslant i\leqslant N$

3、求和： $P(O|\mu)=\sum_{1=1}^{N}\pi_ib_i(O_1)\beta_1(i)$ . 同理，时间复杂度也是 $O(N^2T)$ 。

二、序列问题

1、问题推导

序列问题：给定一个观察序列 $O=O_1O_2...O_T$ 和模型 $\mu=(A,B,\pi)$ ，如何快速选择最优状态序列Q，使之最好地解释观察序列O？

对该问题的正确理解就是，给定观察序列和模型后，使条件概率 $P(O|\mu)$ 最大的状态序列，即 $\hat{Q}=argmaxP(Q|O,\mu)$ .

因此，维比特算法定义了一个维比特变量 $\delta _t(i)$ . 在时间 t 时，HMM沿着某一路径到达状态 $s_i$ ,使观察序列O概率最大化。

$\delta _t(i)=maxP(q_1,q_2,...,q_t=s_i|O_1O_2...O_t|\mu)$ .

2、维特比算法

$\delta _t(i)$ 有如下递归关系， $\delta _t(i)=max[\delta_t(j)a_{ij}]b_i(O_{t+1})$ ,根据这个递归关系，所以可以运用动态规划搜索技术。

另外，为了记录时间 t 时，HMM通过的一条概率最大的路径达到状态 $s_i$ ，算法设置了另外一个变量 $\varphi _t(i)$ 来记录前一个时间的状态。

维比特算法如下:

三、参数估计问题

1、问题推导

参数估计问题：给定一个观察序列和模型，使得 $P(O|\mu)$ 最大化。

我们知道，HMM中的状态序列是不可见的，所以这里采用期望最大化法(EM)，它可以用于含有隐变量的统计模型的参数最大似然估计。

基本思想：从 $\mu_0$ 得到从某一个状态转移到另一个状态的期望次数，由此得到模型 $\mu_1$ ，然后，重新估计模型的参数，执行这个迭代过程，直到参数收敛于最大似然估计值。

2、期望最大化算法（前向后向算法）

这种EM方法的具体实现使用到了前向后向算法(forward-backward algorithm)。

这里需要用到几个变量表示概率：

公式(6-24)：在时间 t 位于状态 $s_i$ ，时间 t+1位于状态 $s_j$ 的概率 $\varepsilon _t(i,j)=P(q_t=s_i,q_{t+1}=s_j,O|\mu)$ .

公式(6-25)：另外，在时间 t 位于状态 $s_i$ 的概率 $\gamma _t(i)=\sum_{j=1}^{N}\varepsilon _t(i,j)$

$\mu$ 的参数估计公式：

公式(6-26)： $\bar{\pi_i}=P(q_1=s_i|O,\mu)=\gamma _1(i)$

公式(6-27)： $\bar{a_{ij}}=\frac{\sum_{t=1}^{T-1}\varepsilon_t(i,j) }{\sum_{t=1}^{T-1}\gamma_t(i)}$

公式(6-28.)： $\bar{b_j(k)}=\frac{\sum_{t=1}^{T}\gamma _t(j)\times \delta (O_t,v_k)}{\sum_{t=1}^{T}\gamma _t(j)}$

由上述公式，得出前向后向算法：

总结

至此，我们对隐马尔可夫模型(HMM)有了比较深入的理解，从原理上全面认识HMM实现思想，这一篇非常抽象的展示许多公式，虽然对这些公式不能够完全掌握，但是最重要的是，能够理解HMM三个基本问题解决方案的思想方法，这些经典奇妙的算法也是人们在不断探索中发现的并完善。所以，对于初学者来说，思想方法最重要，原理需要理明白，具体应用实现是利用已经封装好的工具。

这一篇将探索HMM三个经典的基本问题的解决方案，逐步通过问题推导，公式解析，算法实现，对于HMM理解不再天马行空般，来龙去脉基本理清！希望能帮助到像我一样初学者的伙伴，欢迎大佬交流指正！

两篇内容深入理解HMM：

我的CSDN博客：https://blog.csdn.net/Charzous/article/details/108311177

我的博客园：https://www.cnblogs.com/chenzhenhong/p/13592058.html

本文链接：https://blog.csdn.net/Charzous/article/details/108311177

HMM隐马尔可夫模型来龙去脉（二）的更多相关文章

HMM隐马尔可夫模型来龙去脉（一）
目录隐马尔可夫模型HMM学习导航一.认识贝叶斯网络 1.概念原理介绍 2.举例解析二.马尔可夫模型 1.概念原理介绍 2.举例解析三.隐马尔可夫模型 1.概念原理介绍 2.举例解析四.隐马尔 ...
HMM隐马尔可夫模型（词语粘合）
HMM用于自然语言处理(NLP)中文分词,是用来描述一个含有隐含未知参数的马尔可夫过程,其目的是希望通过求解这些隐含的参数来进行实体识别,说简单些也就是起到词语粘合的作用. HMM隐马尔可夫模型包括: ...
HMM隐马尔科夫模型
这是一个非常重要的模型,凡是学统计学.机器学习.数据挖掘的人都应该彻底搞懂. python包: hmmlearn 0.2.0 https://github.com/hmmlearn/hmmlearn ...
机器学习-HMM隐马尔可夫模型-笔记
HMM定义 1)隐马尔科夫模型 (HMM, Hidden Markov Model) 可用标注问题,在语音识别. NLP .生物信息.模式识别等领域被实践证明是有效的算法. 2)HMM 是关于时序的概 ...
自然语言处理(1)-HMM隐马尔科夫模型基础概念（一）
隐马尔科夫模型HMM 序言文本序列标注是自然语言处理中非常重要的一环,我先接触到的是CRF(条件随机场模型)用于解决相关问题,因此希望能够对CRF有一个全面的理解,但是由于在学习过程中发现一个算法像 ...
HMM 隐马尔科夫模型
参考如下博客: http://www.52nlp.cn/itenyh%E7%89%88-%E7%94%A8hmm%E5%81%9A%E4%B8%AD%E6%96%87%E5%88%86%E8%AF%8 ...
HMM：隐马尔可夫模型HMM
http://blog.csdn.net/pipisorry/article/details/50722178 隐马尔可夫模型隐马尔可夫模型(Hidden Markov Model,HMM)是统计模 ...
详解隐马尔可夫模型(HMM)中的维特比算法
笔记转载于GitHub项目:https://github.com/NLP-LOVE/Introduction-NLP 4. 隐马尔可夫模型与序列标注第3章的n元语法模型从词语接续的流畅度出发,为全切 ...
隐马尔可夫模型(Hidden Markov Model)
隐马尔可夫模型(Hidden Markov Model) 隐马尔可夫模型(Hidden Markov Model, HMM)是一个重要的机器学习模型.直观地说,它可以解决一类这样的问题:有某样事物存在 ...

随机推荐

Python基础教程（第2＋3 版）打包pdf|内附网盘链接提取码
<Python基础教程第3版>包括Python程序设计的方方面面:首先,从Python的安装开始,随后介绍了Python的基础知识和基本概念,包括列表.元组.字符 ...
sockaddr_in & sockaddr
#define __SOCKADDR_COMMON(sa_prefix) sa_family_t sa_prefix##family 这个宏用于为套接字地址(socket addresses),如“ ...
luogu P1712 [NOI2016]区间贪心尺取法线段树二分
LINK:区间没想到尺取法. 先说暴力可以发现答案一定可以转换到端点处所以在每个端点从小到大扫描线段就能得到答案复杂度$n\cdot m$ 再说我的做法想到了二分可以进行二分答案从左 ...
CF1037H Security 线段树合并 SAM
LINK:Security 求一个严格大于T的字符串是原字符串S[L,R]的子串. 容易想到尽可能和T相同然后再补一个尽可能小的字符即可. 出于这种思想可以在SAM上先跑匹配然后枚举加哪个字符 ...
连接云MariaDB实例
新建实例 MariaDB CVM 内网连接 CVM远程登录测试(同一个VPC下): CVM安装客户端: yum install mysql 连接: mysql -h MariaDB内网ip -u 数据 ...
Linux恢复删除后数据文件
简介在使用Linux系统时,有时候会不小心误删除数据,由于Linux系统也没有与Windows系统下回收站类似的功能,一般会认为该文件将无法找回. 本文主要以CentOS7操作系统为例,介绍如何使用 ...
“随手记”开发记录day08
今天完成了关于统计页面中的关于每月支出和每月收入的页面
15、Java中级进阶面向对象继承
1.何为面向对象其本质是以建立模型体现出来的抽象思维过程和面向对象的方法(百度百科)是一种编程思维,也是一种思考问题的方式如何建立面向对象的思维呢?1.先整体,再局部2.先抽象,再具体3.能做什么 ...
微信公众号添加zip
微信公众号添加zip的教程我们都知道创建一个微信公众号,在公众号中发布一些文章是非常简单的,但公众号添加附件下载的功能却被限制,如今可以使用小程序“微附件”进行在公众号中添加附件. 以下是公众号添加 ...
java_内部类、匿名内部类的使用
内部类将一个类A定义在另一个类B里面,里面的那个类A就称为内部类,B则称为外部类. 内部类的分类成员内部类,类定义在了成员位置 (类中方法外称为成员位置) 局部内部类,类定义在方法内成员内部类 ...

HMM隐马尔可夫模型来龙去脉（二）

前言

预备知识

一、估计问题

1、问题推导

2、前向算法/后向算法

二、序列问题

1、问题推导

2、维特比算法

三、参数估计问题

1、问题推导

2、期望最大化算法（前向后向算法）

总结

HMM隐马尔可夫模型来龙去脉（二）的更多相关文章

随机推荐

热门专题