ASLP Kaldi

【ASLP Kaldi】的更多相关文章

ASLP(Audio, Speech and Language Processing Group,音频.语音和语言处理组)位于西北工业大学,隶属于陕西省语音和图像信息处理重点实验室(SAIIP). ASLP小组成立于1995年.ASLP小组的使命是促进音频,语音和语言处理学科内的广泛学科的跨学科研究和教育.目前,ASLP集团的研究范围包括人机语音通信,语音和音频信号处理,视听处理,多媒体内容分析和检索. 在2011年,该组由三位正教授,一位副教授,四位兼职教授和三十多位博士和硕士生组成.....…

VMware Ubuntu Kaldi

1.VMware10.0 秘钥网上搜就好了 2.ubuntu12.04 (1)安了几次14.04,16.04,12.04,最后窗口和分辨率的bug 还是没有解决 (2)终端显示菱形乱码的解决:直接用英文安装 (3)安装过程:新建虚拟机>空磁盘,之后进行安装>选择linux,ubuntu(之前一直是ubuntu64,最后一次安装ubuntu),处理器一个八核,>将磁盘单个文件>最后设置里选择iso 以及iso文件位置开启虚拟机>默认进行,语言不改成中文 3.kaldi (1)…

如何用kaldi做孤立词识别-初版

------------------------------------------------------------------------------------------------------------------------------------------------------ 孤立词参考的例子就是yes/no脚本. -------------------------------------------------------------------------------…

kaldi chain模型的序列鉴别性训练代码分析

chainbin/nnet3-chain-train.cc int main(int argc, char *argv[]) { ... Nnet nnet; ReadKaldiObject(nnet_rxfilename, &nnet); bool ok; { fst::StdVectorFst den_fst; ReadFstKaldi(den_fst_rxfilename, &den_fst); //NnetChainTrainer读取训练参数opts.分母词图den_fst.神…

kaldi通用底层矩阵运算库——CUDA

cudamatrix/cublas-wrappers.h 该头文件对cuBLAS的接口进行了简单的封装(函数名的简化和部分kaldi函数的封装). 比如 cublasSgemm_v2封装为cublas_gemm cublas_copy_kaldi_fd和cublas_copy_kaldi_df封装为cublas_copy cudamatrix/cu-kernels.{h,cu} 以cuda_add_col_sum_mat函数为例对Kaldi cuda kernel或cublas…

kaldi通用底层矩阵运算库——CBLAS

matrix/cblas-wrappers.h 该头文件对CBLAS与CLAPACK的接口进行了简单的封装(将不同数据类型的多个接口封装为一个). 比如 cblas_scopy和cblas_dcopy封装为cblas_Xcopy clapack_sgetri和clapack_dgetri封装为clapack_Xgetri 上述接口的声明位于matrix/kaldi-blas.h中 tools/ATLAS_headers/include/clapack.h matrix/k…

Xvector in Kaldi nnet3

Xvector nnet Training of Xvector nnet Xvector nnet in Kaldi Statistics Extraction Layer in Kaldi Statistics Pooling Layer in Kaldi Implementation in Kaldi Construct specific ComputationRequest for Xvector kaldi::nnet3::RunNnetComputation at nnet3…

Kaldi nnet3的fastlstm与标准LSTM

标准LSTM: 与标准LSTM相比,Kaldi的fastlstm对相同或类似的矩阵运算进行了合并. # Component specific to 'projected' LSTM (LSTMP), contains both recurrent and non-recurrent projections fastlstm.W_rp, fast lstm Weight recurrent projected fastlstm.W_all, fast lst…

[转] kaldi中FST的可视化-以yesno为例

http://blog.csdn.net/u013677156/article/details/77893661 1.kaldi解码过程 kaldi识别解码一段语音的过程是:首先提取特征,然后过声学模型AM,然后过解码网络HCLG.fst,最后输出识别结果. HCLG是解码时的重要组成部分.HCLG.fst是由4个fst经过一系列算法(组合.确定化和最小化等)组合而成的.4个fst分别是H.fst.C.fst.L.fst和G.fst,分别是HMM模型.上下文环境.词典和语言模型对应的fst. …

[转]kaldi ASR: DNN训练

作者:zqh_zy链接:http://www.jianshu.com/p/c5fb943afaba來源:简书著作权归作者所有.商业转载请联系作者获得授权,非商业转载请注明出处. 本文通过简单kaldi源码,分析DNN训练声学模型时神经网络的输入与输出.在进行DNN训练之前需要用到之前GMM-HMM训练的模型,以训练好的mono模型为例,对模型进行维特比alignement(对齐),该部分主要完成了每个语音文件的帧到transition-id的映射. 不妨查看对齐后的结果: $ copy-int-…