Factorized Hidden Variability Learning For Adaptation Of Short Duration Language Identification Models

基于因子分解的隐层变量学习，应用于短语句语种识别模型的自适应

LFVs（Language Feature Vectors，语种特征向量）[11]，与BSVs（Bottleneck Speaker Vectors）类似，即瓶颈特征

3.1. 神经元调制

由于说话人特性的变化反映在语音信号中，因此将表示说话人适应声学特性的特征拼接到特征中。如VTLN或fMLLR，是直接对声学特征进行操作的自适应方法。可以训练一个说话人自适应系统以基于说话人属性直接对输入特征进行转换，这样效果与基于i-Vector的自适应类似[8]。但是与说话人变化特性相比，语言特性是更高阶的概念。在某些方面基于声学。例如，具有相同音素的多种语言，可以在某种程度上可以观察到语言特定属性。但是，声学特征变换适应性方法无法考虑到音位配列学或者不同声学单元集的知识。在这里，在更深层次的DNN处添加特征可能会改善自适应性。[17]基于Meta-PI网络进行了尝试。关键点是使用Meta-PI连接，它允许通过将隐层单元乘以系数来调制神经元的输出。应用于语种自适应，我们用LFV来对隐藏层的输出进行调制。基于语种特征的调制，LSTM单元的输出被衰减或增强。这迫使隐藏层中的单元基于语种特征来学习或适应。调制可以被认为与Dropout有关[18]，其中网络连接以随机概率被丢弃。在结果部分中，我们将此方法称为"LFV调制"。

所示的网络配置。基本架构受百度Deepspeech 2的启发。它将两个TDNN/CNN层与4个双向LSTM层组合在一起。输出层是一个前馈层，它将最后一个LSTM层的输出映射到目标。将每层LSTM单元维数设定为LFV维数的数倍。这样就可以构建包含相同单位数量的LSTM单元的隐藏层组。然后用LFV的某一维对每组的输出进行调制。该图显示了两种配置，"LFV 拼接"和"LFV 调制"，但一次只应用一种方法。在初步实验中，我们得出在第二个LSTM层的输出处进行调制可以获得最佳性能。

Factorized Hidden Variability Learning For Adaptation Of Short Duration Language Identification Models的更多相关文章

Coursera Deep Learning笔记序列模型（三）Sequence models & Attention mechanism(序列模型和注意力机制)
参考 1. 基础模型(Basic Model) Sequence to sequence模型(Seq2Seq) 从机器翻译到语音识别方面都有着广泛的应用. 举例: 该机器翻译问题,可以使用" ...
ICLR 2013 International Conference on Learning Representations深度学习论文papers
ICLR 2013 International Conference on Learning Representations May 02 - 04, 2013, Scottsdale, Arizon ...
Machine and Deep Learning with Python
Machine and Deep Learning with Python Education Tutorials and courses Supervised learning superstiti ...
Deep Learning in a Nutshell: History and Training
Deep Learning in a Nutshell: History and Training This series of blog posts aims to provide an intui ...
Machine Learning for Developers
Machine Learning for Developers Most developers these days have heard of machine learning, but when ...
How do I learn machine learning?
https://www.quora.com/How-do-I-learn-machine-learning-1?redirected_qid=6578644 How Can I Learn X? ...
(转) Ensemble Methods for Deep Learning Neural Networks to Reduce Variance and Improve Performance
Ensemble Methods for Deep Learning Neural Networks to Reduce Variance and Improve Performance 2018-1 ...
（转）Understanding, generalisation, and transfer learning in deep neural networks
Understanding, generalisation, and transfer learning in deep neural networks FEBRUARY 27, 2017 Thi ...
Rolling in the Deep (Learning)
Rolling in the Deep (Learning) Deep Learning has been getting a lot of press lately, and is one of t ...

随机推荐

vue学习笔记（二）- 数据绑定、列表渲染、条件判断
vue的数据绑定和列表渲染的造轮子 GitHub:八至作者:狐狸家的鱼双向数据绑定 Vue中数据的双向绑定-v-model 数据->页面页面->数据适用:input.select. ...
【洛谷P1164 小A点菜】
题目背景 uim神犇拿到了uoi的ra(镭牌)后,立刻拉着基友小A到了一家……餐馆,很低端的那种. uim指着墙上的价目表(太低级了没有菜单),说:“随便点”. 题目描述不过uim由于买了一些辅(e ...
笔记：用标准c写 com dll
在 [XXX.idl] 中 1. 如果想在脚本语言中传递一个值,并且在dll(c代码)中修改这个值并返回的话, 这个参数必须写为:[in, out] VARIANT* 如果写成 [in, out] i ...
PKUWC2019滚粗记
真的不想说些什么了,还是自己太菜了,水平低啊.深深感受到NOIP2017以后的那种绝望,这最好的签约清北的机会,就这样白白错过了.本以为自己的应该有NOIAg的实力,运气好是前120吧,没想到自己还是 ...
iis8.0 https配置教程
打开iis>选择左侧根>点击右侧服务器证书打开界面后空白处点击右键选择导入成功导入证书选择需要绑定证书的网站点击选择>编辑绑定>ssl证书请选择您导入的证书点击SSL ...
新建体（3）：dbms_job下新建一个job定期自动执行存储过程
http://blog.csdn.net/thinkscape/article/details/7411012http://java-admin.iteye.com/blog/231159sql窗口执 ...
bzoj2957 奥妙重重的线段树
https://www.lydsy.com/JudgeOnline/problem.php?id=2957 线段树的query和update竟然还可以结合起来用! 题意:小A的楼房外有一大片施工工地, ...
maven直接饮用jar包的写法
<dependency> <groupId>sample</groupId> <artifactId>com.sample</artifactId ...
用go实现一个redis-cli
转载文章:https://my.oschina.net/liangwt/blog/2231557?origin= 代码样例:https://github.com/liangwt/redis-cli
2017-12-14python全栈9期第一天第四节之python分类
python的环境. 编译型:一次性将所有程序编译成二进制文件. 缺点:开发效率低,不能跨平台. 优点:运行速度快. :C,C++等等. 解释型:当程序执行时,一行一行的解释. 优点:开发效率高,可以 ...

Factorized Hidden Variability Learning For Adaptation Of Short Duration Language Identification Models

Factorized Hidden Variability Learning For Adaptation Of Short Duration Language Identification Models的更多相关文章

随机推荐

热门专题