• 根据任务,构建ComputationRequst
  • 编译ComputationRequst,获取NnetComputation

    std::shared_ptr<const NnetComputation> computation = compiler_.Compile(request);

    • 创建计算——CreateComputation

      compiler.CreateComputation(opts, computation);

      • 从输出节点开始逐步向前计算依赖关系

        ComputationGraphBuilder builder(nnet_, &graph_);

        builder.Compute(*(requests_[segment]));

        每次向前深入一层,并计算所有Cindexes的依赖关系

        BuildGraphOneIter();

        对其中的每个Cindex,若需要计算其依赖:

        AddDependencies(cindex_id);

        • 若为kDescriptor,desc.GetDependencies(index, &input_cindexes);
        • 若为kComponent,component->GetInputIndexes(request_->misc_info, index, &input_indexes);
        • 若为kDimRange,input_cindexes[0] = Cindex(node.u.node_index, index);
        • 若为kInput,不需要依赖
      • 检查是否所有的输出都是可计算的

        if (!builder.AllOutputsAreComputable())

      • 将数据与运算组织为计算步

        对每个chunk中Cindexes根据不同网络层切分为phases,并以chunk为单位进行处理

        steps_computer.ComputeForSegment(*(requests_[segment]),phases_per_segment[segment]);

        将phases以节点为单位切分为sub-phases,并以sub-phases为单位进行处理

        ProcessSubPhase(request, sub_phases[j]);

        若sub-phases对于节点类型为:

        component-node:ProcessComponentStep(sub_phase);

        kSimpleComponent:除索引数-1外,将step复制为input_step

        else:从graph_->dependencies[c]获取依赖并插入到input_step中

        input-node:ProcessInputOrOutputStep(request, false, sub_phase);

        output-node:ProcessInputOrOutputStep(request, true, sub_phase);

        dim-range-node:ProcessDimRangeSubPhase(sub_phase);

    • 优化计算——Optimize

      Optimize(opt_config_, nnet_,

      MaxOutputTimeInRequest(request),

      computation);

  • 根据NnetComputation构建NnetComputer

    NnetComputer computer(opts_.compute_config, *computation,

    nnet_, nnet_to_update);

  • 运行NnetComputer

    computer.Run();

    对NnetComputation中所有Command迭代地运行

    ExecuteCommand();

    kPropagate:void *memo = component->Propagate(indexes, input, &output);

    kBackprop:component->Backprop(debug_str.str(), indexes,

    in_value, out_value, out_deriv,

    memo, upd_component,

    c.arg6 == 0 ? NULL : &in_deriv);

    ...

  • 从NnetComputer获取输出

    computer.GetOutputDestructive("output", &cu_output);

Kaldi nnet3的前向计算的更多相关文章

  1. Faster-rnnlm代码分析3 - EvaluateLM(前向计算ForwardPropagate)

    先采用一个简单的输入文本做测试 [root@cq01-forum-rstree01.cq01.baidu.com rnnlm]# pwd /home/users/chenghuige/rsc/app/ ...

  2. Xvector in Kaldi nnet3

    Xvector nnet Training of Xvector nnet Xvector nnet in Kaldi     Statistics Extraction Layer in Kaldi ...

  3. BP原理 - 前向计算与反向传播实例

    Outline 前向计算 反向传播 很多事情不是需要聪明一点,而是需要耐心一点,踏下心来认真看真的很简单的. 假设有这样一个网络层: 第一层是输入层,包含两个神经元i1 i2和截距b1: 第二层是隐含 ...

  4. [源码解析] PyTorch 流水线并行实现 (4)--前向计算

    [源码解析] PyTorch 流水线并行实现 (4)--前向计算 目录 [源码解析] PyTorch 流水线并行实现 (4)--前向计算 0x00 摘要 0x01 论文 1.1 引论 1.1.1 数据 ...

  5. Kaldi nnet3的fastlstm与标准LSTM

    标准LSTM:             与标准LSTM相比,Kaldi的fastlstm对相同或类似的矩阵运算进行了合并.     # Component specific to 'projected ...

  6. 关于入门深度学习mnist数据集前向计算的记录

    import osimport lr as lrimport tensorflow as tffrom pyspark.sql.functions import stddevfrom tensorfl ...

  7. [图解tensorflow源码] MatMul 矩阵乘积运算 (前向计算,反向梯度计算)

  8. [tensorflow源码分析] Conv2d卷积运算 (前向计算,反向梯度计算)

  9. 对Kaldi nnet3进行奇异值分解(SVD)以减小模型大小

    用处 基于SVD实现模型压缩以适配低功耗平台     根据nnet3bin/nnet3-copy,nnet3-copy或nnet3-am-copy的"--edits-config" ...

随机推荐

  1. cpu iowait高排查的case

    在之前的常见的Java问题排查方法一文中,没有写cpu iowait时的排查方法,主要的原因是自己之前也没碰到过什么cpu iowait高的case,很不幸的是在最近一周连续碰到了两起cpu iowa ...

  2. springBoot中使用定时任务

    简单示例 导入依赖 springBoot已经默认集成了定时任务的依赖,只需要引入基本的依赖就可以使用定时任务. <parent> <groupId>org.springfram ...

  3. Linux内存管理 (10)缺页中断处理

    专题:Linux内存管理专题 关键词:数据异常.缺页中断.匿名页面.文件映射页面.写时复制页面.swap页面. malloc()和mmap()等内存分配函数,在分配时只是建立了进程虚拟地址空间,并没有 ...

  4. 【原创】架构师必备,带你弄清混乱的JAVA日志体系!

    引言 还在为弄不清commons-logging-xx.jar.log4j-xx.jar.sl4j-api-xx.jar等日志框架之间复杂的关系而感到烦恼吗? 还在为如何统一系统的日志输出而感到不知所 ...

  5. 基于 HTML5 的 WebGL 和 VR 技术的 3D 机房数据中心可视化

    前言 在 3D 机房数据中心可视化应用中,随着视频监控联网系统的不断普及和发展, 网络摄像机更多的应用于监控系统中,尤其是高清时代的来临,更加快了网络摄像机的发展和应用. 在监控摄像机数量的不断庞大的 ...

  6. pyspider爬虫框架webui简介-爬取阿里招聘信息

    命令行输入pyspider开启pyspider 浏览器打开http://localhost:5000/ group表示组名,几个项目可以同一个组名,方便管理,当组名修改为delete时,项目会在一天后 ...

  7. openstack搭建之-cinder配置(12)

    一. base节点配置 mysql -u root -proot CREATE DATABASE cinder; GRANT ALL PRIVILEGES ON cinder.* TO 'cinder ...

  8. react的jsx语法

    在webpack.config.js中配置解析的loader { test:/\.jsx?$/, use:{ loader:"babel-loader", options:{ pr ...

  9. vue-百度地图-maker文字标签显示隐藏

    html: <div id="allmap" class="map"></div>   script:   mounted() { th ...

  10. JQuery的Ajax技术

    jquery是一个优秀的js框架,自然对js原生的ajax进行了封装, 封装后的ajax的操作方法更简洁,功能更强大,与ajax操作 相关的jquery方法有如下几种: Ajax 请求 $.ajax( ...