nnet3配置中的“编译”

编译概述

编译流程将Nnet和ComputationRequest作为输入，输出NnetComputation。ComputationRequest包含可用的输入索引
以及
请求的输出索引。

不提供输出索引并让编译器找出需要的输入索引的原因是，某些网络，比如RNNs，为输出给定输出，可能会消耗任意数量的输入特征

struct ComputationRequest包含除Nnet之外计算所需的所有数据。该结构体用于创建Computation。

ComputationRequest中最重要的信息是：

各个输入结点处提供的可用索引；
各个输出节点处请求的索引；
是否要执行反向传播；

相同的输入结点不能在IoSpecification数组input中出现两次，输出结点亦然；

创建计算图

详述ComputationGraph

为了提高效率，ComputationGraph会将Cindex映射为cindex_id，反之亦然。

ComputationGraph类的定义如下：

struct ComputationGraph {

//cindex_id到Cindex的映射

std::vector<Cindex> cindexes;

//is_input[cindex_id]表示cindex_id对应的Cindex是否在输入中是可用的

std::vector<bool> is_input;

// dependencies[cindex_id]表示计算cindex_id所依赖的其他cindex_id列表

std::vector<std::vector<int32> > dependencies;

private:

//Cindex到cindex_id的映射

// 必须通过GetCindexId()函数来调用

unordered_map<Cindex, int32, CindexHasher> cindex_to_cindex_id_;

};

dependencies成员的确切意义依赖于编译阶段。

在编译的初始阶段，dependencies包含函数Descriptor::GetDependencies()返回的Cindexes对应的所有cindex_ids。

之后，对dependencies进行修剪，只保留在实际计算中使用到的cindex_ids。

注意，与Descriptor类似的，Component也有GetDependencies()以及IsComputable()函数。然而，当且仅当Component是GeneralComponent时才有用。

创建计算图——ComputationGraph

详述计算图

ComputationGraphBuilder用于构建ComputationGraph。对于一个最简单的例子，从网络请求的输出开始，并沿着网络向前计算其依赖，并添加到ComputationGraph中，直至计算到输入结点。

研究所实习时，为现有DNN添加一输出层后，脚本得出无法计算的结论，就是依赖于此）。

基础算法

本算法不实际使用。

构建计算图时，需要使用如下算法来确定每个Cindex是否可以从提供的输入计算得到：

调用Descriptor::GetDependencies()得到输出层处的所有依赖项；
调用IsComputable()确定输入中哪些Cindexes可以用于计算，对实际不参与计算的依赖关系进行修剪
检查所有请求的输出都是可计算的
修脚掉所有不需要参与计算的cindex_ids

将计算组织为多步

根据拓扑顺序对Cindex排序并分组，使同组Cindexes可同时计算。

使用该算法的动机

ComputationGraphBuilder接口

将网络计算组织为一系列的步骤

介绍计算步骤序列

一旦有了计算图，那么原则上就有足够的信息来执行计算了。可以对计算图中的Cindexes以拓扑顺序排序，可以依赖关系作为输入，以单独计算每个Cindex。不幸的是，这并不十分有效，因为进行的矩阵操作不能发挥全部效率，除非矩阵相当大；使用GPU时尤其如此。所以需要将多个Cindexes合为一个批次（batch），这样同一batch中的Cindex可以同时计算。该batch被称为一个步骤（step），大致对应于NnetComputation中的一个命令。

接下来将计算中所有的cindex_ids划分为一个step序列

step序列有以下属性：

给定step中所有cindex_ids对应于计算图中的一个节点（component-node）
给定step中所有cindex_ids的所有依赖以及在之前的step中计算完成了

step序列还需要满足一些额外的、模糊的属性：

ComputationRequest中的任何输入Cindex或输出Cindex必须在一个step中，step序列中索引的顺序与ComputationRequest中指定的顺序相同。（注意：输入可以是kComponent或kInput类型的节点）。
如果一个step对应于kComponent类型的节点（并且不对应于ComputationRequest中的输入），那么紧接着的下一个step必须对应于kDescriptor类型的节点，并且这两个step中的索引序列必须是相同的。
如果一个step对应于kDimRange类型的节点，则必须有另一个对应与源节点的step，这两个step中的索引和顺序完全相同。（这允许我们为kDimRange节点使用子矩阵）

规则b是确保Component可以直接以Descriptor的输出作为其输入，而无需任何额外的重排或重组（因为按照设计，这样的重排或重组需要Descriptor来完成）。由于这个规则，原则上，一个来自于kDescriptor节点的cindex_id可以出现在多个step中，尽管这只有在使用非简单组件时才会发生。此外，为了确保满足规则c，我们偶尔可能需要在计算图中添加新的cindex_ids。

创建计算步骤序列（基础算法）

这里，介绍一个用于创建step序列的基本算法（但不实际使用），只用于为稍后介绍的实际算法做铺垫。这个基本算法分为以下几步：

首先保留对应于输入和输出节点的Cindex；将它们按节点索引分开；将这些step按照ComputationRequests中相同顺序排序。
接下来处理非输入或输出的中间Cindex：
- 将中间Cindex按神经网络层的依赖关系划分为多个"阶段"（phase），其中第一个phase包含仅依赖于输入的所有Cindex；并且通常第n阶段包含仅依赖于小于第n个phase的Cindex
- 从每个phase移除所有不对应于kComponent节点的Cindexes（这些Cindexes将在稍后处理）。
- 使用struct Index的排序运算符对step进行排序。
- 按如下方式创建component-input（组件输入）节点的step：
  - 对于kComponent类型的每个step，使用ComputationGraph的dependencies成员计算其所依赖的Cindex的集合。
  - 使用struct Index的排序运算符对上述每个step的集合进行排序。（对于简单的组件，这确保它们与组件的输出的顺序相同）。
  - （模糊特征）：此时非简单组件的输入进行重排（如果需要）；具体请参阅Component::ReorderIndexes()。
  - 将该组件输入节点的step防止在Component的对应step之前。
- 按如下方式创建dim-range节点的step：
  - 从网络图中取对应于dim-range节点的所有Cindex，并得出其输入所属的step。
  - 注意，对于每个现有step，拥有Cindex的dim-range节点的集合从该step中获取输入。
  - 对于每个现有步骤s，对于拥有从该step获取输入的现有Cindex的每个dim-range节点，创建包含与step s相同的索引序列的step，并将新step放在step s之后。
对所有step排序：输入step、中间step、输出step。

上述算法最终将将它最终将Cindexes分成许多step。

例如，假设我们有一个RNN层，后接一个标准的前馈层。RNN层必须将Cindexs分成与时间索引一样多step，但是上述算法也会将完连接层的计算分成多个step，因为RNN输出Cindexes后，全连接层对应的Cindexes就立即可计算。我们希望能够先完成RNN层的所有计算，然后再完成全连接层的计算。

创建计算步骤序列（实际算法）

class Compiler

介绍class Compiler

创建网络计算

设定位置信息

检查是否需要梯度

计算StepInfo

计算input_output_info

分配矩阵空间

前向计算

反向计算

释放矩阵空间

添加调试信息

快捷编译

Kaldi版本5.1提供的功能，并默认启用。

条件是：

ComputationRequest中有两个以上不同的"n"索引；
对于每个索引，请求的"t"和"x"索引是相同且有序的

和1）；

编译mini_request，得到mini_computation

根据mini_computation，将所有原始计算请求的编译结果推导出来；

快捷方式编译能显着缩短编译时间。

nnet3配置中的“编译”的更多相关文章

nnet3配置中的上下文和chunk（块）大小
Nnet3配置中的上下文和块大小简介本页讨论了nnet3配置中关于解码和训练的块大小以及左右上下文的某些术语.这将有助于理解一些脚本.目前,从脚本角度来看,没有任何关于nnet3的"概述 ...
如何在MyEclipse中配置jre的编译运行环境
由于在MyEclipse中已经自带了jre编译环境,但由于版本太低,所以有时候需要将编译环境配置为系统的jre版本.在MyEclipse中配置jre的编译运行环境很简单,只需要全局配置一次,则所有项目 ...
Webpack 2 视频教程 019 - Webpack 2 中配置多页面编译
原文发表于我的技术博客这是我免费发布的高质量超清「Webpack 2 视频教程」. Webpack 作为目前前端开发必备的框架,Webpack 发布了 2.0 版本,此视频就是基于 2.0 的版本讲 ...
如若已在管理后台更新域名配置，请刷新项目配置后重新编译项目，操作路径：“项目-域名信息” http://www.mysite.com 不在以下 request 合法域名列表中
报错如图报错文字如下: 如若已在管理后台更新域名配置,请刷新项目配置后重新编译项目,操作路径:“项目-域名信息” http://www.mysite.net 不在以下 request 合法域名列表中 ...
GDAL1.9.1 IN VS2008 C#中的编译及使用
下载gdal1.9.1到官网:http://www.gdal.org/ GDAL库的简洁.高效深受开发人员的喜爱,很多开源的GIS软件甚至是商业GIS软件都使用了这个库.GDAL使用C++,在Visu ...
Ubuntu下安装并配置VS Code编译C++
作者:tongqingliu 转载请注明出处:http://www.cnblogs.com/liutongqing/p/7069091.html Ubuntu下安装并配置VS Code编译C++ 安装 ...
Openfire4源码部署到eclipse中并编译
Openfire4源码部署到eclipse中并编译概述 Openfire是众所周知的基于xmpp协议的IM开源服务,所有操作,配置,监控,调试等以B/S方式进行展示,非常的方便管理员进行管理.它的强 ...
jenkins自动部署应用到tomcat中，编译后shell脚本的简单示例
jenkins的安装这里就不做描述了,很简单的百度搜索一下即可这里安装的jenkins-2.39-1.1 wget http://pkg.jenkins-ci.org/redhat/jenkin ...
Windows下为 Eclipse 配置 C/C++ 编译环境（转）
1.Eclipse及CDT的安装 CDT的全称是C/C++ DevelopmentTools,CDT使得Eclipse能够支持C/C++的开发.直接下载 eclipse CDT 集成版下载地址:ht ...

随机推荐

audio元素和video元素在ios和andriod中无法自动播放
原因: 因为各大浏览器都为了节省流量,做出了优化,在用户没有行为动作时(交互)不予许自动播放: /音频,写法一 <audio src="music/bg.mp3" autop ...
MySQL之表相关操作
一存储引擎介绍存储引擎即表类型,mysql根据不同的表类型会有不同的处理机制详见:http://www.cnblogs.com/linhaifeng/articles/7213670.html ...
前端学习-基础部分-css（一）
开始今日份整理 1.CSS的导入方式 CSS的导入方式主要是有内联模式,行内模式,外部样式表 1.1 内联模式内联模式:直接在<head>中直接写css,例如 p{ color:rgb( ...
redis 基本原理及安装
一:什么是redis? Redis 是一个开源的,高性能的,基于键值对的缓存与存储系统.通过提供多种键值数据类型来适应不同场景下的缓存与存储需求. 二:redis数据库有什么优点? Redis数据库中 ...
CentOS7.4使用KVM
参考地址 [root@node1 ~]# cat /etc/centos-release CentOS Linux release 7.4.1708 (Core) [root@node1 ~]# un ...
Lightoj 1128 - Greatest Parent
Gate 倍增模板,在一个严格小根堆中,给定$x,y$,求$x$的祖先中$≥y$的最高点. 注意清零 #include<cstdio> #include<iostream> # ...
纯代码系列：Python实现验证码图片(PIL库经典用法用法，爬虫12306思路)
现在的网页中,为了防止机器人提交表单,图片验证码是很常见的应对手段之一.这里就不详细介绍了,相信大家都遇到过. 现在就给出用Python的PIL库实现验证码图片的代码.代码中有详细注释. #!/usr ...
在Bootstrap开发框架的前端视图中使用@RenderPage实现页面内容模块化的隔离，减少复杂度
在很多开发的场景中,很多情况下我们需要考虑抽象.以及模块化等方面的内容,其目的就是为了使得开发的时候关注的变化内容更加少一些,整体开发更加简单化,从而减少开发的复杂度,在Winform开发的时候,往往 ...
占位符的使用和PreparedStatement接口使用：
一.PreparedStatement 接口的使用首先占位符我们可以使用 Statement 接口来操作数据, 但是这个接口存在两个问题: 1.使用 Statement 接口对象发送的 sql ...
Windows 虚拟机忘记密码的处理
说明经过验证没法用这种方式处理之前的系统够可以 2016的方法稍后在写一个. 1. 修改虚拟机的配置界面: 2. 增加windows的安装盘作为启动盘 3 bios 里面设置CD启动比较简 ...

nnet3配置中的“编译”

nnet3配置中的“编译”的更多相关文章

随机推荐

热门专题