先放一张找到的算法流程图:

上图解释

A:状态转移概率矩阵,Aij表示状态i到状态j转换的概率,即P(state=j | state=i)。下面代码中以P表示。

B:观测矩阵,Bij表示给定状态i,观测结果为j的概率。即P(observation=j | state=i)

π:初始时状态概率分布,表示各状态出现的概率。代码中以pi表示。

O:输入的观测序列。

:表示经过节点(时刻t,状态state=i)的局部最优路径到此节点时对应的概率,即给定X=(x1,...xt,...xn)子序列(x1,x2,...xt)时,对应的最佳状态序列(末状态state=i)的概率值。

下面代码中以delta表示

:跟上面相关。表示上面最优路径经过的节点的上一个状态id。下面代码中以w表示。

1式理解:右边为状态state=i出现的概率乘以(状态i下观测到O[t=1]的概率)

2式理解:当前节点概率值,为(上一时刻各节点概率值乘以状态转换概率)的最大值,再乘以状态state=i时观测到O[t]的概率。这就是动态规划的思想了。

以上,熟悉隐马尔可夫模型的话,理解应该没问题了。

-------------------------------------------------------------------------

下面进入代码部分:

import  numpy as np
def my_viterbi(O,P,B,pi):
'''
O:观测序列
P:状态转移矩阵,Pij表示状态i到j转换的条件概率
B:观测矩阵,Bij表示状态i下观测到Oj的条件概率
pi:初始的状态概率分布 return:各个时刻选择的状态id
''' set_O=list(set(O))
# 观测结果有多少种类
class_observe=len(set_O)
# 将观测序列one-hot化,不然会超过索引
for i in range(len(O)):
O[i]=set_O.index(O[i])
# 进行若干检查
assert class_observe==B.shape[1],'观测序列与观测矩阵的观测结果维度不一致!'
assert P.shape[0]==B.shape[0],'转移矩阵与观测矩阵的状态维度不一致!'
assert P.shape[0]==len(pi),'转移矩阵与状态分布的状态维度不一致!'
sequence_len=len(O)# 观测序列长度,即有多少个时刻t
states_per_time=P.shape[0]# 每个时刻有多少个状态,这里假设相同。实际可以不同,不同的话,应该要给出每个时刻对应的状态集合。这里默认所有状态
# 记录(局部)最优路径中节点(t时刻状态s)的概率值,当记录完毕后,逆序寻找最优节点即可
delta=np.zeros((sequence_len,states_per_time))
# 记录经过t时刻状态s的局部最优路径的前一个状态id
w=np.zeros((sequence_len,states_per_time))
# 初始化
for s in range(states_per_time):
delta[0,s]=pi[s]*B[s,O[0]]# 即状态概率分布乘以观测矩阵对应元素,得到0时刻各状态对应概率值
for t in range(1,sequence_len):
for s in range(states_per_time):
delta[t,s]=np.max([delta[t-1,s_]*P[s_,s] for s_ in range(states_per_time)])*B[s,O[t]]
w[t,s]=np.argmax([delta[t-1,s_]*P[s_,s] for s_ in range(states_per_time)])
max_sequence_prob=np.max(delta[-1,:])
res=np.zeros(sequence_len).astype(np.int32)
res[-1]=np.argmax(delta[-1,:])
for t in range(sequence_len-2,-1,-1):
res[t]=w[t+1,res[t+1]]
return res,max_sequence_prob # 状态转移矩阵
P=np.array([[0.5,0.2,0.3],[0.3,0.5,0.2],[0.2,0.3,0.5]])
# 状态生成观测矩阵
B=np.array([[0.5,0.5],[0.4,0.6],[0.7,0.3]])
# 观测序列,假设有2种观察结果,比如扔硬币,从0开始
O=np.array([2,3,3])
# 初始时各个状态出现的概率
pi=np.array([0.2,0.4,0.4])
res,prob=my_viterbi(O, P, B, pi)
print(res)

输出:

array([2,1,1])

总结

涉及到的知识点为隐马尔可夫模型和动态规划。比较简单。

维特比算法及python实现的更多相关文章

  1. 【机器学习】【条件随机场CRF-2】CRF的预测算法之维特比算法(viterbi alg) 详解 + 示例讲解 + Python实现

    1.CRF的预测算法条件随机场的预测算法是给定条件随机场P(Y|X)和输入序列(观测序列)x,求条件概率最大的输出序列(标记序列)y*,即对观测序列进行标注.条件随机场的预测算法是著名的维特比算法(V ...

  2. 维特比算法Python实现

    前言 维特比算法是隐马尔科夫问题的一个基本问题算法.维特比算法解决的问题是已知观察序列,求最可能的标注序列. 什么是维特比算法? 维特比算法尽管是基于严格的数学模型的算法,但是维特比算法毕竟是算法,因 ...

  3. 维特比算法(Viterbi)及python实现样例

    维特比算法(Viterbi) 维特比算法 维特比算法shiyizhong 动态规划算法用于最可能产生观测时间序列的-维特比路径-隐含状态序列,特别是在马尔可夫信息源上下文和隐马尔科夫模型中.术语“维特 ...

  4. 维特比算法(Viterbi)-实例讲解(暴力破解+代码实现)

    1.简介 维特比算法是一个通用的求序列最短路径的动态规划算法,也可以用于很多其他问题,比如:文本挖掘.分词原理.既然是动态规划算法,那么就需要找到合适的局部状态,以及局部状态的递推公式.在HMM中,维 ...

  5. Machine Learning系列--维特比算法

    维特比算法(Viterbi algorithm)是在一个用途非常广的算法,本科学通信的时候已经听过这个算法,最近在看 HMM(Hidden Markov model) 的时候也看到了这个算法.于是决定 ...

  6. Java实现:抛开jieba等工具,写HMM+维特比算法进行词性标注

    一.前言:词性标注 二.经典维特比算法(Viterbi) 三.算法实现 四.完整代码 五.效果演示: 六.总结 一.前言:词性标注 词性标注(Part-Of-Speech tagging, POS t ...

  7. 维特比算法(Viterbi Algorithm)

      寻找最可能的隐藏状态序列(Finding most probable sequence of hidden states) 对于一个特殊的隐马尔科夫模型(HMM)及一个相应的观察序列,我们常常希望 ...

  8. HMM 自学教程(六)维特比算法

    本系列文章摘自 52nlp(我爱自然语言处理: http://www.52nlp.cn/),原文链接在 HMM 学习最佳范例,这是针对 国外网站上一个 HMM 教程 的翻译,作者功底很深,翻译得很精彩 ...

  9. 八大排序算法的 Python 实现

    转载: 八大排序算法的 Python 实现 本文用Python实现了插入排序.希尔排序.冒泡排序.快速排序.直接选择排序.堆排序.归并排序.基数排序. 1.插入排序 描述 插入排序的基本操作就是将一个 ...

随机推荐

  1. 搭建zookeeper集群_其中一个报Mode: standalone,另外两个分别是leader和follower

    用3个zookeeper搭建一个zookeeper集群,首先配置好一个zookeeper1,其余两个都是按照zookeeper1复制过来,然后稍微修改 运行集群成功,查看zookeeper状态 可以看 ...

  2. 运行别人的Vue项目

    步骤一:先 安装 cnpm cmd命令下 输入  npm install -g cnpm --registry=http://registry.npm.taobao.org (由于npm有些资源被屏蔽 ...

  3. web 9个令人震惊的WebGL示例

    20个使用WebGL和Three.js实现的网页场景 https://www.open-open.com/news/view/9d8136 20个使用WebGL和Three.js实现的网页场景 htt ...

  4. 【Andriod-AlertDialog控件】 弹出对话框AlertDialog用法

    Result: Code: import android.app.Activity; import android.app.AlertDialog; import android.content.Di ...

  5. 【leetcode】1287. Element Appearing More Than 25% In Sorted Array

    题目如下: Given an integer array sorted in non-decreasing order, there is exactly one integer in the arr ...

  6. 错误/异常:org.hibernate.id.IdentifierGenerationException: ids for this class must be manually assigned before calling save() 的解决方法

    1.错误/异常视图 错误/异常描述:id的生成错误,在调用save()方法之前,必须先生成id. 2.解决方法     在对应的实体类的主键(id)的get方法上加上:@GeneratedValue( ...

  7. 最近公共祖先LCA(Tarjan算法)的思考和算法实现——转载自Vendetta Blogs

    LCA 最近公共祖先 Tarjan(离线)算法的基本思路及其算法实现 小广告:METO CODE 安溪一中信息学在线评测系统(OJ) //由于这是第一篇博客..有点瑕疵...比如我把false写成了f ...

  8. 用python进行服务器的监控

    用python进行服务器的监控 在linux服务器中,一切皆为文件,就是说,服务器运行的个中信息,其实是可以从某些文件中查询得到的:百度后,你会知道,在Linux系统中,有一个/proc的虚拟文件系统 ...

  9. AcWing:172. 立体推箱子(bfs)

    立体推箱子是一个风靡世界的小游戏. 游戏地图是一个N行M列的矩阵,每个位置可能是硬地(用”.”表示).易碎地面(用”E”表示).禁地(用”#”表示).起点(用”X”表示)或终点(用”O”表示). 你的 ...

  10. [CSP-S模拟测试]:Blue(贪心)

    题目描述 $Blue$是个动物学家,不仅喜欢研究猫和老鼠,还喜欢研究青蛙.他最近开始研究青蛙过河的问题,可以简化成:数轴上$0$为岸边,$L$为河对岸.$(0,L)$中间存在$n$个石子.已知青蛙一跳 ...