春节后到现在近两个月了,没有更新博客,主要是因为工作的关注点正从传统语音(语音通信)转向智能语音(语音识别).部门起了个新项目,要用到语音识别(准备基于Kaldi来做).我们之前做的传统音频已基本成熟,就开始关注在语音识别上了.对于我们来说,这是个全新的领域(虽然都是语音相关的,但是语音通信偏信号处理,传统语音识别方法偏概率统计),需要学习的知识很多,所以这段时间主要是在学习新知识了,主要学习了数学(高数/线性代数/概率统计,这应该算复习).机器学习基础知识.深度学习.语音识别传统方法等.由于刚…
一.五个基本元素 HMM是个五元组 λ =( S, O , π ,A,B) S:状态值集合,O:观察值集合,π:初始化概率,A:状态转移概率矩阵,B:给定状态下,观察值概率矩阵   二.两个假设 HMM 的定义建立在两个基本假设的前提上,这两个假设是 HMM 的重点,一定要了解模型的 2 个假设. 1)齐次马尔科夫假设 齐次马尔科夫假设,通俗地说就是 HMM 的任一时刻 t 的某一状态只依赖于其前一时刻的状态,与其它时刻的状态及观测无关,也与时刻 t 无关. 2)观测独立假设 观测独立性假设,是…
前面的博客里说过最近几个月我从传统语音(语音通信)切到了智能语音(语音识别).刚开始是学语音识别领域的基础知识,学了后把自己学到的写了PPT给组内同学做了presentation(语音识别传统方法(GMM+HMM+NGRAM)概述).一段时间后老板就布置了具体任务:在我们公司自己的ARM芯片上基于kaldi搭建一个在线语音识别系统,三个人花三个月左右的时间完成.由于我们都是语音识别领域的小白,要求可以低些,就用传统的GMM-HMM来实现.说实话接到这个任务我们心里是有点没底的,不知道能不能按时完…
Atitit 语音识别的技术原理 1.1. 语音识别技术,也被称为自动语音识别Automatic Speech Recognition,(ASR),2 1.2. 模型目前,主流的大词汇量语音识别系统多采用统计模式识别技术2 1.3. 基本方法般来说,语音识别的方法有三种:基于声道模型和语音知识的方法.模板匹配的方法以及利用人工神经网络的方法.2 1.3.1. 模板匹配的方法2 1.4. 一般来说,语音识别的方法有三种:基于声道模型和语音知识的方法.模板匹配的方法以及利用人工神经网络的方法.2 1…
本文简明讲述GMM-HMM在语音识别上的原理,建模和測试过程.这篇blog仅仅回答三个问题: 1. 什么是Hidden Markov Model? HMM要解决的三个问题: 1) Likelihood 2) Decoding 3) Training 2. GMM是神马?如何用GMM求某一音素(phoneme)的概率? 3. GMM+HMM大法解决语音识别 3.1 识别 3.2 训练 3.2.1 Training the params of GMM 3.2.2 Training the param…
文章目录 1. 1. 摘要 2. 2. Map-Matching(MM)问题 3. 3. 隐马尔科夫模型(HMM) 3.1. 3.1. HMM简述 3.2. 3.2. 基于HMM的Map-Matching 3.3. 3.3. Viterbi算法 4. 4. 相关部分论文工作 4.1. 4.1. A HMM based MM for wheelchair navigation 4.2. 4.2. MM for low-sampling-rate GPS trajectories 4.3. 4.3.…
TIMIT语音库是IT和MIT合作音素级别标注的语音库,用于自动语音识别系统的发展和评估,包括来自美式英语,8个地区方言,630个人. 每个人读10个句子,每个发音都是音素级别.词级别文本标注,16kHz,16bit. 注意:不用使用TIMIT配置作为运行Kaldi的一个通用型例子,因为它不是一个非常标准的结构. 其它的一些配置也是非常好用的. ----------------------------------------------------------------------------…
上一篇文章提到了数据挖掘.机器学习.深度学习的区别:http://www.cnblogs.com/charlesblc/p/6159355.html 深度学习具体的内容可以看这里: 参考了这篇文章:https://zhuanlan.zhihu.com/p/20582907?refer=wangchuan  <王川: 深度学习有多深, 学了究竟有几分? (一)> 笔记:神经网络的研究,因为人工智能的一位大牛Marvin Minsky的不看好,并且出书说明其局限性,而出现二十年的长期低潮.   在…
今天面试(一面)腾讯暑期实习 Web 后端开发,一言难尽. 第一部分,常规的自我介绍. 介绍完,面试官问我对人工智能有什么理解?深度学习和机器学习的区别?对调参有什么见解?语音识别中怎样运用了机器学习?这一部分直接让我懵掉了.可能是因为我在简历中有过一个语音识别的项目经验,但那只是大二的一个课程作业,我对其中的原理并不十分了解,只说了什么 Kaldi 的内部是 GMM+HMM 模型实现的,唉. 接下来是四道编程题,第一题写阶乘,我用递归和循环都写了一遍:第二题整数反转,不让用 Python 的…
转载声明:本文为转载文章 作者:ferb2015 原文地址:https://blog.csdn.net/eqiang8848/article/details/81543599 kaldi是一个开源的语音识别工具箱,是基于c++.perl.shell编写的,可以在windows和unix 平台上编译. 中文参考资料:<kaldi的全部资料_v0.7(未完成版本).pdf>.网盘链接 提取码:yuq0 教程网页:http://www.kaldi-asr.org/doc/ 里面可以查阅脚本的用途.使…