• 根据任务,构建ComputationRequst
  • 编译ComputationRequst,获取NnetComputation

    std::shared_ptr<const NnetComputation> computation = compiler_.Compile(request);

    • 创建计算——CreateComputation

      compiler.CreateComputation(opts, computation);

      • 从输出节点开始逐步向前计算依赖关系

        ComputationGraphBuilder builder(nnet_, &graph_);

        builder.Compute(*(requests_[segment]));

        每次向前深入一层,并计算所有Cindexes的依赖关系

        BuildGraphOneIter();

        对其中的每个Cindex,若需要计算其依赖:

        AddDependencies(cindex_id);

        • 若为kDescriptor,desc.GetDependencies(index, &input_cindexes);
        • 若为kComponent,component->GetInputIndexes(request_->misc_info, index, &input_indexes);
        • 若为kDimRange,input_cindexes[0] = Cindex(node.u.node_index, index);
        • 若为kInput,不需要依赖
      • 检查是否所有的输出都是可计算的

        if (!builder.AllOutputsAreComputable())

      • 将数据与运算组织为计算步

        对每个chunk中Cindexes根据不同网络层切分为phases,并以chunk为单位进行处理

        steps_computer.ComputeForSegment(*(requests_[segment]),phases_per_segment[segment]);

        将phases以节点为单位切分为sub-phases,并以sub-phases为单位进行处理

        ProcessSubPhase(request, sub_phases[j]);

        若sub-phases对于节点类型为:

        component-node:ProcessComponentStep(sub_phase);

        kSimpleComponent:除索引数-1外,将step复制为input_step

        else:从graph_->dependencies[c]获取依赖并插入到input_step中

        input-node:ProcessInputOrOutputStep(request, false, sub_phase);

        output-node:ProcessInputOrOutputStep(request, true, sub_phase);

        dim-range-node:ProcessDimRangeSubPhase(sub_phase);

    • 优化计算——Optimize

      Optimize(opt_config_, nnet_,

      MaxOutputTimeInRequest(request),

      computation);

  • 根据NnetComputation构建NnetComputer

    NnetComputer computer(opts_.compute_config, *computation,

    nnet_, nnet_to_update);

  • 运行NnetComputer

    computer.Run();

    对NnetComputation中所有Command迭代地运行

    ExecuteCommand();

    kPropagate:void *memo = component->Propagate(indexes, input, &output);

    kBackprop:component->Backprop(debug_str.str(), indexes,

    in_value, out_value, out_deriv,

    memo, upd_component,

    c.arg6 == 0 ? NULL : &in_deriv);

    ...

  • 从NnetComputer获取输出

    computer.GetOutputDestructive("output", &cu_output);

Kaldi nnet3的前向计算的更多相关文章

  1. Faster-rnnlm代码分析3 - EvaluateLM(前向计算ForwardPropagate)

    先采用一个简单的输入文本做测试 [root@cq01-forum-rstree01.cq01.baidu.com rnnlm]# pwd /home/users/chenghuige/rsc/app/ ...

  2. Xvector in Kaldi nnet3

    Xvector nnet Training of Xvector nnet Xvector nnet in Kaldi     Statistics Extraction Layer in Kaldi ...

  3. BP原理 - 前向计算与反向传播实例

    Outline 前向计算 反向传播 很多事情不是需要聪明一点,而是需要耐心一点,踏下心来认真看真的很简单的. 假设有这样一个网络层: 第一层是输入层,包含两个神经元i1 i2和截距b1: 第二层是隐含 ...

  4. [源码解析] PyTorch 流水线并行实现 (4)--前向计算

    [源码解析] PyTorch 流水线并行实现 (4)--前向计算 目录 [源码解析] PyTorch 流水线并行实现 (4)--前向计算 0x00 摘要 0x01 论文 1.1 引论 1.1.1 数据 ...

  5. Kaldi nnet3的fastlstm与标准LSTM

    标准LSTM:             与标准LSTM相比,Kaldi的fastlstm对相同或类似的矩阵运算进行了合并.     # Component specific to 'projected ...

  6. 关于入门深度学习mnist数据集前向计算的记录

    import osimport lr as lrimport tensorflow as tffrom pyspark.sql.functions import stddevfrom tensorfl ...

  7. [图解tensorflow源码] MatMul 矩阵乘积运算 (前向计算,反向梯度计算)

  8. [tensorflow源码分析] Conv2d卷积运算 (前向计算,反向梯度计算)

  9. 对Kaldi nnet3进行奇异值分解(SVD)以减小模型大小

    用处 基于SVD实现模型压缩以适配低功耗平台     根据nnet3bin/nnet3-copy,nnet3-copy或nnet3-am-copy的"--edits-config" ...

随机推荐

  1. 轻量级卷积神经网络——MobileNet

    谷歌论文题目: MobileNets: Efficient Convolutional Neural Networks for Mobile Vision Applications 其他参考: CNN ...

  2. 小程序第三方框架对比 ( wepy / mpvue / taro )(转)

    文章转自  https://www.cnblogs.com/Smiled/p/9806781.html 众所周知如今市面上端的形态多种多样,手机Web.ReactNative.微信小程序, 支付宝小程 ...

  3. Linux 默认连接数

    Linux 默认连接数 - 国内版 Binghttps://cn.bing.com/search?FORM=U227DF&PC=U227&q=Linux+%E9%BB%98%E8%AE ...

  4. JAVA多线程-实现同步

    一.什么是线程安全问题 当多个线程同时共享,同一个全局变量或静态变量,做写的操作时,可能会发生数据冲突问题,也就是线程安全问题.但是做读操作是不会发生数据冲突问题. 二.如何解决线程安全问题 1)如何 ...

  5. 图像压缩编解码实验(DCT编码+量化+熵编码(哈夫曼编码))【MATLAB】

    课程要求 Assignment IV Transform + Quantization + Entropy Coding Input: an intra-frame or a residue pict ...

  6. params.success && params.success(res.data)

    params.success && params.success(res.data)   只有success 为真,才执行后边的代码

  7. 【C/C++】任意进制转换

    进制转换:R进制->10进制:10进制->R进制. #include<bits/stdc++.h> using namespace std; /*函数:r进制转换成10进制*/ ...

  8. [转载:Q1mi]Bootstrap和基于Bootstrap的登录验证示例

    转载自:Q1mi Bootstrap介绍 Bootstrap是Twitter开源的基于HTML.CSS.JavaScript的前端框架. 它是为实现快速开发Web应用程序而设计的一套前端工具包. 它支 ...

  9. BZOJ3498PA2009 Cakes——三元环

    题目描述 N个点m条边,每个点有一个点权a.对于任意一个三元环(j,j,k)(i<j<k),它的贡献为max(ai,aj,ak) 求所有三元环的贡献和.N<100000,,m< ...

  10. MT【322】绝对值不等式

    已知 $a,b,c\in\mathbb R$,求证:$|a|+|b|+|c|+|a+b+c|\geqslant |a+b|+|b+c|+|c+a|$ 分析:不妨设$c=\max\{a,b,c\},\d ...