kaldi HMM-GMM全部训练脚本分解

train_mono.sh
train_deltas.sh
train_lda_mllt.sh
train_sat.sh

train_mono.sh

单音素训练脚本：

//初始化，[topo feats] -> [0.mdl tree]

gmm-init-mono

//生成训练图，[0.mdl text l.fst] -> [train.fst]

compile-train-graph

//对标签进行初始化对齐[train.fst feats 0.mdl tree] -> [1.ali]

align-equal-compiled

//统计估计模型所需统计量，[feats 1.ali] -> [1.acc]

gmm-acc-stats-ali

//参数重估，估计新的模型 [1.acc] -> [1.mdl]

gmm-est

//迭代训练

for i < iteration

	//重新统计所需统计量，[$i.ali] -> [$i.acc]

	gmm-acc-stats-ali

	//估计新的模型，[$i.acc] -> [$i.mdl]

	gmm-est

	//重新对齐，[train.fst $i.mdl] ->[$i+1.ali]

	gmm-align-compiled

//输出最后的模型

final.mdl = $i.mdl

train_deltas.sh

三音素训练脚本：

//特征处理 [feats] -> [feats]

apply-cmvn | add-deltas

//由生成的单音素模型的对齐结果对三音素参数统计，用于生成决策树[final.ali feats] -> [treeacc]

acc-tree-stats

//三音素绑定，[treeacc] -> [tree]

cluster-phone

compile-questions

build-tree //该步骤完成决策树三音素聚类

//三音素模型初始化，[treeacc tree topo] -> [1.occ 1.mdl] -> [1.mdl]

gmm-init-model | gmm-mixup

//将单音素对其文件中的元素替换为决策树的叶子，[final.mdl 1.mdl final.ali] -> [ali.new]

convert-ali

//生成训练图，[1.mdl text l.fst] -> [train.fst]

compile-train-graph

//迭代训练

for i < iteration

	//重新对齐，[train.fst $i.mdl] ->[$i+1.ali]

	gmm-align-compiled

	//重新统计所需统计量，[$i.ali] -> [$i.acc]

	gmm-acc-stats-ali

	//估计新的模型，[$i.acc] -> [$i.mdl]

	gmm-est //该步骤增加混合高斯分量的数目

//输出最后的模型

final.mdl = $i.mdl

train_lda_mllt.sh

lda-mllt训练脚本，非说话人自适应，mllt的作用是减少协方差矩阵对角化的损失：

//生成先验概率，统计计算lda所需统计量，[splice-feats final.ali] -> [lda.acc]

ali-to-post

weight-silence-post

acc-lda

//估计lda矩阵，[lda.acc] -> [lda.mat]

est-lda

//通过对转换后的特征重新统计，用于生成决策树[final.ali feats.*lda.mat] -> [treeacc]

acc-tree-stats

//三音素绑定，[treeacc] -> [tree]

cluster-phone

compile-questions

build-tree //该步骤完成决策树三音素聚类

//三音素模型初始化，[treeacc tree topo] -> [1.occ 1.mdl]

gmm-init-model

//将三音素决策树的叶子替换为转换后模型决策树的叶子，[final.mdl 1.mdl final.ali] -> [ali.new]

convert-ali

//生成训练图，[1.mdl text l.fst] -> [train.fst]

compile-train-graph

//迭代训练

for i < iteration

	//重新对齐，[train.fst $i.mdl] ->[$i+1.ali]

	gmm-align-compiled

		//同lda，估计mllt的矩阵

		ali-to-post | weight-silence-post | gmm-acc-mllt

		est-mllt

		//对gmm模型进行变换，[mllt.mat mdl] -> [new.mdl]

		gmm-transform-means

		//组合变换矩阵，[lda.mat mllt.mat] -> [lda.mat]

		compose-transforms

	//重新统计所需统计量，[$i.ali] -> [$i.acc]

	gmm-acc-stats-ali

	//估计新的模型，[$i.acc] -> [$i.mdl]

	gmm-est //该步骤增加混合高斯分量的数目

//输出最后的模型

final.mdl = $i.mdl

train_sat.sh

说话人自适应模型，fmllr训练脚本：

//生成先验概率，统计计算fmllr所需统计量，[splice-feats spk2utt] -> [trans]

ali-to-post

weight-silence-post

gmm-est-fmllr

//通过对转换后的特征重新统计，用于生成决策树[final.ali feats.*lda.mat] -> [treeacc]

acc-tree-stats

//三音素绑定，[treeacc] -> [tree]

cluster-phone

compile-questions

build-tree //该步骤完成决策树三音素聚类

//三音素模型初始化，[treeacc tree topo] -> [1.occ 1.mdl]

gmm-init-model

//将三音素决策树的叶子替换为转换后模型决策树的叶子，[final.mdl 1.mdl final.ali] -> [ali.new]

convert-ali

//生成训练图，[1.mdl text l.fst] -> [train.fst]

compile-train-graph

//迭代训练

for i < iteration

	//重新对齐，[train.fst $i.mdl] ->[$i+1.ali]

	gmm-align-compiled

		//同lda，估计fmllr的矩阵 -> [fmllr.trans]

		ali-to-post | weight-silence-post | gmm-est-fmllr

		//组合变换矩阵，[trans.mat fmllr.trans] -> [trans.mat]

		compose-transforms

	//重新统计所需统计量，[$i.ali] -> [$i.acc]

	gmm-acc-stats-ali

	//估计新的模型，[$i.acc] -> [$i.mdl]

	gmm-est //该步骤增加混合高斯分量的数目

//输出最后的模型

final.mdl = $i.mdl

kaldi HMM-GMM全部训练脚本分解的更多相关文章

kaldi基于GMM的单音素模型训练部分
目录 1. gmm-init-mono 模型初始化 2. compile-train-graghs 训练图初始化 3. align-equal-compiled 特征文件均匀分割 4. gmm-acc ...
Kaldi单音素模型训练部分
在Kaldi中,单音素GMM的训练用的是Viterbi training,而不是Baum-Welch training.因此就不是用HMM Baum-Welch那几个公式去更新参数,也就不用计算前向概 ...
[转]kaldi基于GMM做分类问题
转自:http://blog.csdn.net/zjm750617105/article/details/55211992 对于每个类别的GMM有几种思路: 第一是将所有训练数据按类别分开,每类的数据 ...
caffe训练脚本文件时遇到./build/tools/caffe: not found
原文转载:https://blog.csdn.net/zhongshaoyy/article/details/53502373 cifar10训练步骤如下: (1)打开终端,应用cd切换路径,如 cd ...
caffe运行训练脚本时报错：Unknown bottom blob 'data' (layer 'conv1',bottom index 0)
报错的两种报错原因: 1.输入数的路径错误,需要将路径进行修改排查目录是否出错 2.训练原数据格式不对 3.train.prototxt文件中并未设置test层,而在solver层则设置了test的迭 ...
Baum-Welch算法(EM算法)对HMM模型的训练
Baum-Welch算法就是EM算法,所以首先给出EM算法的Q函数 \[\sum_zP(Z|Y,\theta')\log P(Y,Z|\theta)\] 换成HMM里面的记号便于理解 \[Q(\lam ...
lua脚本分解字符串
--local str = "文字45 文字 789 文们adsd45 文字 wowo 文字文字 wowo我们 wowo456 wiwo 465我们 456sdf 45 45我们adsd4 ...
Kaldi的关键词搜索（Keyword Search，KWS）
本文简单地介绍了KWS的原理--为Lattice中每个词生成索引并进行搜索:介绍了如何处理OOV--替补(Proxy,词典内对OOV的替补)关键词技术:介绍了KWS的语料库格式:介绍了KWS在Kald ...
[转]异常声音检测之kaldi DNN 训练
转自:http://blog.csdn.net/huchad/article/details/52092796 使用kaldi的DNN做音频分类,异常声音检测. HMM/GMM -> HMM/D ...

随机推荐

轻量ORM-SqlRepoEx （十）SqlRepoEx Nuget包下载说明
ORM-SqlRepoEx 是 .Net平台下兼容.NET Standard 2.0,一个实现以Lambda表达式转转换标准SQL语句,使用强类型操作数据的轻量级ORM工具,在减少魔法字串同时,通过灵 ...
Memcache随笔
Tip01: Memcache 中记录的缓存如果你设置了失效时间,之后如果你在系统时间中将时间修改为超过失效时间,再次访问之前你设置的资源,Memcache 会认为你设置的缓存已失效: Tip02: ...
android软件开发之TextView控件常用属性
TextView控件 text属性,设置显示的文本 textColor:设置文本颜色 textSize:设置文本字体大小 autoLink:设置文本为电话,URL连接等的时候是否显示为可点击的链接 c ...
Ubuntu16 安装Anaconda3+tensorflow cpu版
打开火狐浏览器,下载anaconda安装包,网址:https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/?C=M&O=D 下载完成,到Do ...
springboot（2.0以上） --数据源切换时报错
在进行数据源切换时spring.datasource.type类型根据源码所给的默认值修改后依然报错先看源码:标色部分 , 就是springboot所给的数据源 , 正常来说只要在配置文件中修改 ...
Elasticsearch 5.x安装
node1 elasticsearch node2 elasticsearch node3 elasticsearch 前期准备 JDK1.8 修改/etc/security/limits.conf ...
Pycharm常用的快捷键
常用快捷键: Ctrl + D 复制选定的区域或行 Ctrl + Y 删除选定的行 Ctrl + Alt + L 代码格式化 Ct ...
小工具：生成半透明背景色的 CSS 代码,不影响子元素透明度
工具:http://leegorous.net/tools/bg-alpha.html 工具介绍:http://leegorous.net/blog/2010/07/29/generate-css-c ...
wso2 ei 6.4.0安装笔记
目的:将最新版(6.4.0)部署在linux服务器,与Api Manager部署在同一环境环境: Centos 7.3 Jdk 8 Mysql 5.7 问题一: 将H2替换为Mysql5.7数据库时 ...
vue调用豆瓣API加载图片403问题
"豆瓣API是有请求次数限制的”,这会引发图片在加载的时候出现403问题,视图表现为“图片加载不出来”,控制台表现为报错403. 其实是豆瓣限制了图片的加载,我自己用了一个办法把图片缓存下来 ...

kaldi HMM-GMM全部训练脚本分解

train_mono.sh

train_deltas.sh

train_lda_mllt.sh

train_sat.sh

kaldi HMM-GMM全部训练脚本分解的更多相关文章

随机推荐

热门专题