• 根据任务,构建ComputationRequst
  • 编译ComputationRequst,获取NnetComputation

    std::shared_ptr<const NnetComputation> computation = compiler_.Compile(request);

    • 创建计算——CreateComputation

      compiler.CreateComputation(opts, computation);

      • 从输出节点开始逐步向前计算依赖关系

        ComputationGraphBuilder builder(nnet_, &graph_);

        builder.Compute(*(requests_[segment]));

        每次向前深入一层,并计算所有Cindexes的依赖关系

        BuildGraphOneIter();

        对其中的每个Cindex,若需要计算其依赖:

        AddDependencies(cindex_id);

        • 若为kDescriptor,desc.GetDependencies(index, &input_cindexes);
        • 若为kComponent,component->GetInputIndexes(request_->misc_info, index, &input_indexes);
        • 若为kDimRange,input_cindexes[0] = Cindex(node.u.node_index, index);
        • 若为kInput,不需要依赖
      • 检查是否所有的输出都是可计算的

        if (!builder.AllOutputsAreComputable())

      • 将数据与运算组织为计算步

        对每个chunk中Cindexes根据不同网络层切分为phases,并以chunk为单位进行处理

        steps_computer.ComputeForSegment(*(requests_[segment]),phases_per_segment[segment]);

        将phases以节点为单位切分为sub-phases,并以sub-phases为单位进行处理

        ProcessSubPhase(request, sub_phases[j]);

        若sub-phases对于节点类型为:

        component-node:ProcessComponentStep(sub_phase);

        kSimpleComponent:除索引数-1外,将step复制为input_step

        else:从graph_->dependencies[c]获取依赖并插入到input_step中

        input-node:ProcessInputOrOutputStep(request, false, sub_phase);

        output-node:ProcessInputOrOutputStep(request, true, sub_phase);

        dim-range-node:ProcessDimRangeSubPhase(sub_phase);

    • 优化计算——Optimize

      Optimize(opt_config_, nnet_,

      MaxOutputTimeInRequest(request),

      computation);

  • 根据NnetComputation构建NnetComputer

    NnetComputer computer(opts_.compute_config, *computation,

    nnet_, nnet_to_update);

  • 运行NnetComputer

    computer.Run();

    对NnetComputation中所有Command迭代地运行

    ExecuteCommand();

    kPropagate:void *memo = component->Propagate(indexes, input, &output);

    kBackprop:component->Backprop(debug_str.str(), indexes,

    in_value, out_value, out_deriv,

    memo, upd_component,

    c.arg6 == 0 ? NULL : &in_deriv);

    ...

  • 从NnetComputer获取输出

    computer.GetOutputDestructive("output", &cu_output);

Kaldi nnet3的前向计算的更多相关文章

  1. Faster-rnnlm代码分析3 - EvaluateLM(前向计算ForwardPropagate)

    先采用一个简单的输入文本做测试 [root@cq01-forum-rstree01.cq01.baidu.com rnnlm]# pwd /home/users/chenghuige/rsc/app/ ...

  2. Xvector in Kaldi nnet3

    Xvector nnet Training of Xvector nnet Xvector nnet in Kaldi     Statistics Extraction Layer in Kaldi ...

  3. BP原理 - 前向计算与反向传播实例

    Outline 前向计算 反向传播 很多事情不是需要聪明一点,而是需要耐心一点,踏下心来认真看真的很简单的. 假设有这样一个网络层: 第一层是输入层,包含两个神经元i1 i2和截距b1: 第二层是隐含 ...

  4. [源码解析] PyTorch 流水线并行实现 (4)--前向计算

    [源码解析] PyTorch 流水线并行实现 (4)--前向计算 目录 [源码解析] PyTorch 流水线并行实现 (4)--前向计算 0x00 摘要 0x01 论文 1.1 引论 1.1.1 数据 ...

  5. Kaldi nnet3的fastlstm与标准LSTM

    标准LSTM:             与标准LSTM相比,Kaldi的fastlstm对相同或类似的矩阵运算进行了合并.     # Component specific to 'projected ...

  6. 关于入门深度学习mnist数据集前向计算的记录

    import osimport lr as lrimport tensorflow as tffrom pyspark.sql.functions import stddevfrom tensorfl ...

  7. [图解tensorflow源码] MatMul 矩阵乘积运算 (前向计算,反向梯度计算)

  8. [tensorflow源码分析] Conv2d卷积运算 (前向计算,反向梯度计算)

  9. 对Kaldi nnet3进行奇异值分解(SVD)以减小模型大小

    用处 基于SVD实现模型压缩以适配低功耗平台     根据nnet3bin/nnet3-copy,nnet3-copy或nnet3-am-copy的"--edits-config" ...

随机推荐

  1. SQL Server百万级大数据量删除

    删除一个表中的部分数据,数据量百万级. 一般delete from 表 delete from 表名 where 条件: 此操作可能导致,删除操作执行的时间长:日志文件急速增长: 针对此情况处理 de ...

  2. 分享:大型Web网站架构演变之9大阶段

    前言 我们以Java Web为例,来搭建一个简单的电商系统,看看这个系统可以如何一步步演变. 该系统具备的功能: 用户模块:用户注册和管理 商品模块:商品展示和管理 交易模块:创建交易和管理 正文 阶 ...

  3. D. The Beatles

    链接 [https://codeforces.com/contest/1143/problem/D] 题意 就是有nkcity,n个面包店 第一个面包店在1city,第x个在(x-1)k+1city ...

  4. Day3 Numerical simulation of optical wave propagation之标量衍射理论基本原理(三)

    3.标量衍射理论 光源通常不是简单地平面.球面或高斯光束波.对于更一般的情况,必须使用更老练的方法来求解标量赫姆霍兹方程,需要利用格林定理并灵活使用边界条件. 基本问题:给定源平面光场U(x1,y1) ...

  5. 【学习总结】Git学习-参考廖雪峰老师教程-总

    公元2018-10-21 实验室台式机 win7 64位 参考教程: 廖雪峰Git教程 其他资料:Git-book 北大一只总结的笔记,最终整理的时候可以参考:Git笔记 评论区看到的另一个人,总结在 ...

  6. Basic GC Tuning

    Sizing the Heap -XmsN -XmxN Summary The JVM will attempt to find a reasonable minimum and maximum he ...

  7. 原生JS的Ajax技术

    1.同步和异步 同步现象:客户端发送请求到服务器端,当服务器返回响应之前,客户端都处于等待  卡死状态 异步现象:客户端发送请求到服务器端,无论服务器是否返回响应,客户端都可以随意做其他事情,不会被卡 ...

  8. [模板] 多项式: 乘法/求逆/分治fft/微积分/ln/exp/幂

    多项式 代码 const int nsz=(int)4e5+50; const ll nmod=998244353,g=3,ginv=332748118ll; //basic math ll qp(l ...

  9. [UOJ422][集训队作业2018]小Z的礼物——轮廓线DP+min-max容斥

    题目链接: [集训队作业2018]小Z的礼物 题目要求的就是最后一个喜欢的物品的期望得到时间. 根据$min-max$容斥可以知道$E(max(S))=\sum\limits_{T\subseteq ...

  10. mpvue——API请求封装(小程序原生)

    前言 能用,但不是最好的方法,最好的还是fly,因为为了以后多平台的考虑,最好使用fly.js,做之前先关闭校验合法域名,因为我没在后台进行配置 后台进行配置合法域名,按着官方给的配置就OK了,这里就 ...