tensorflow源码解析之framework-graph
目录
- 什么是graph
- 图构建辅助函数
- graph_transfer_info
- 关系图
- 涉及的文件
- 迭代记录
1. 什么是graph
graph是TF计算设计的载体,如果拿TF代码的执行和Java代码执行相比,它相当于Java的字节码。关于graph的执行过程,我们在这里简单介绍一下。在graph构建完成,并进行了一些简单优化之后,会对图进行分割,实际上就是执行一个节点分配的过程,然后在各设备上分别对子图进行运行前的优化,最后调用各设备的执行器,调度运行运行子图。在node章节我们讲过,node本身是自带图结构的,一个node的集合就能复原一个完整的graph。所以,graph本身添加的数据内容并不多。下面我们看下GraphDef的定义:
message GraphDef {
repeated NodeDef node = 1;
VersionDef versions = 4;
int32 version = 3 [deprecated = true];
FunctionDefLibrary library = 2;
};
可以看到,这个结构里除了添加了一个函数定义库之外,没有其它数据了。
2. 图构建辅助函数
TF为了方便构建GraphDef,提供了很多辅助函数,下面我们来看下:
//生成一个可读性好的关于GraphDef的描述,而不是返回一个可读性差的proto文本
string SummarizeGraphDef(const GraphDef& graph_def);
//校验一个GraphDef
Status ValidateExternalGraphDefSyntax(const GraphDef& graph_def);
//从节点索引node_offset开始,为GraphDef中的节点加入默认参数值,节点对应的op的默认参数值在op_registry中
Status AddDefaultAttrsToGraphDef(GraphDef* graph_def, const OpRegistryInterface& op_registry, int node_offset);
//从GraphDef中除去那些,在producer_op_registry中出现过,但在consumer_op_registry中未出现过的默认参数值
Status RemoveNewDefaultAttrsFromGraphDef(GraphDef* graph_def, const OpRegistryInterface& consumer_op_registry, const OpRegistryInterface& producer_op_registry, std::set<std::pair<string,string>>* op_attr_removed);
//收集图使用的op,以字符串集合的形式返回
void OpsUsedByGraph(const GraphDef& graph_def, std::set<string>* ops_used_in_graph);
//将graph_def中出现过,同时也在op_registry中出现过的op放入stripped_op_list
Status StrippedOpListForGraph(const GraphDef& graph_def, const OpRegistryInterface& op_registry, OpList* stripped_op_list);
我们发现,其中有很多是跟图中op的默认参数值相关的函数。这些函数出现的背景是这样的,假设在一个分布式的环境下,master需要workder执行一个子图,但这个图是master产生的,图中操作的默认值使用的是master所在机器的运行时环境中,OpRegistry中注册的操作所包含的默认值,但关键是,workder所在机器使用的运行时环境,跟master可能不一样!比如,master机器及时对TF进行了升级,但workder却没有。而升级之后,master所在运行时的op参数,可能之前没有默认值,现在加上了默认值,或者之前的默认值改成了现在的默认值,这时候,为了让这张子图具有向前兼容特性,即为了让它能够在workder机器上运行,需要对这张子图进行处理,删除仅在master运行时的OpRegistry中出现的op参数默认值。于是就出现了最后的三个函数。
3. graph_transfer_info
为了让我们定义的计算图能够在其它设备(比如DSP)上运行,需要对图结构进行一些转换。目前TF仅支持转换到HEXAGON,详见HEXAGON的SDK。
message GraphTransferInfo {
enum Destination {
NOP = 0;
HEXAGON = 1;
}
message NodeInput {
int32 node_id = 1;
int32 output_port = 2;
}
message NodeInfo {
string name = 1;
int32 node_id = 2;
string type_name = 3;
int32 soc_op_id = 4;
int32 padding_id = 5;
int32 input_count = 6;
int32 output_count = 7;
};
message ConstNodeInfo {
string name = 1;
int32 node_id = 2;
repeated int64 shape = 3;
bytes data = 4;
DataType dtype = 5;
};
message NodeInputInfo {
int32 node_id = 1;
repeated NodeInput node_input = 2;
};
message NodeOutputInfo {
int32 node_id = 1;
repeated int32 max_byte_size = 2;
};
message GraphInputNodeInfo {
string name = 1;
repeated int64 shape = 2;
DataType dtype = 3;
};
message GraphOutputNodeInfo {
string name = 1;
repeated int64 shape = 2;
DataType dtype = 3;
};
repeated NodeInfo node_info = 1;
repeated ConstNodeInfo const_node_info = 2;
repeated NodeInputInfo node_input_info = 3;
repeated NodeOutputInfo node_output_info = 4;
repeated GraphInputNodeInfo graph_input_node_info = 5;
repeated GraphOutputNodeInfo graph_output_node_info = 6;
Destination destination = 7;
};
4. 关系图
5. 涉及的文件
- graph
- graph_def_util
- graph_transfer_info
6. 迭代记录
- v1.0 2018-08-28 文档创建
- v2.0 2018-09-09 文档重构
tensorflow源码解析之framework-graph的更多相关文章
- tensorflow源码解析之framework拾遗
把framework中剩余的内容,按照文件名进行了简单解析.时间原因写的很仓促,算是占个坑,后面有了新的理解再来补充. allocation_description.proto 一个对单次内存分配结果 ...
- tensorflow源码解析系列文章索引
文章索引 framework解析 resource allocator tensor op node kernel graph device function shape_inference 拾遗 c ...
- Tensorflow源码解析1 -- 内核架构和源码结构
1 主流深度学习框架对比 当今的软件开发基本都是分层化和模块化的,应用层开发会基于框架层.比如开发Linux Driver会基于Linux kernel,开发Android app会基于Android ...
- tensorflow源码解析之common_runtime-executor-上
目录 核心概念 executor.h Executor NewLocalExecutor ExecutorBarrier executor.cc structs GraphView ExecutorI ...
- tensorflow源码解析之framework-allocator
目录 什么是allocator 内存分配器的管理 内存分配追踪 其它结构 关系图 涉及的文件 迭代记录 1. 什么是allocator Allocator是所有内存分配器的基类,它定义了内存分配器需要 ...
- tensorflow源码解析之common_runtime-executor-下
目录 核心概念 executor.h Executor NewLocalExecutor ExecutorBarrier executor.cc structs GraphView ExecutorI ...
- tensorflow源码解析之distributed_runtime
本篇主要介绍TF的分布式运行时的基本概念.为了对TF的分布式运行机制有一个大致的了解,我们先结合/tensorflow/core/protobuf中的文件给出对TF分布式集群的初步理解,然后介绍/te ...
- tensorflow源码解析之common_runtime拾遗
把common_runtime中剩余的内容,按照文件名排序进行了简单的解析,时间原因写的很仓促,算是占个坑,后续有了新的理解再来补充. allocator_retry 有时候内存分配不可能一次完成,为 ...
- tensorflow源码解析之framework-op
目录 什么是op op_def定义 op注册 op构建与注册辅助结构 op重写 关系图 涉及的文件 迭代记录 1. 什么是op op和kernel是TF框架中最重要的两个概念,如果一定要做一个类比的话 ...
- Tensorflow源码解析2 -- 前后端连接的桥梁 - Session
Session概述 1. Session是TensorFlow前后端连接的桥梁.用户利用session使得client能够与master的执行引擎建立连接,并通过session.run()来触发一次计 ...
随机推荐
- js Array.prototype.slice.call(arguments,0) 理解
Array.prototype.slice.call(arguments,0) 经常会看到这段代码用来处理函数的参数 网上很多复制粘帖说:Array.prototype.slice.call(argu ...
- CSS快速入门(四)
目录 CSS快速入门(四) 浮动 float属性 clear属性 浮动解决的问题及其影响 解决父标签塌陷的方法 浮动案例 定位 什么是脱离文档流 定位的两种方法 position定位 static定位 ...
- Exception in thread "main" java.lang.UnsupportedClassVersionError: org/apache/zeppelin/server/ZeppelinServer : Unsupported major.minor version 52.0
在启动Zeppelin时遇到了该问题: [root@quickstart bin]# ./zeppelin-daemon.sh restart Please specify HADOOP_CONF_D ...
- 理解ASP.NET Core - 基于JwtBearer的身份认证(Authentication)
注:本文隶属于<理解ASP.NET Core>系列文章,请查看置顶博客或点击此处查看全文目录 在开始之前,如果你还不了解基于Cookie的身份认证,那么建议你先阅读<基于Cookie ...
- 1python基础语法_11模块
http://www.runoob.com/python3/python3-module.html 模块是一个包含所有你定义的函数和变量的文件,其后缀名是.py.模块可以被别的程序引入,以使用该模块中 ...
- Linux系统安装(CentOS-7)详细操作步骤
Linux系统安装(CentOS-7)详细操作步骤 一.创建虚拟机 首先创建一个虚拟机,然后才能在虚拟机里面安装系统. 第一步,创建虚拟机的向导 第二步,兼容性默认即可. 第三步,我们等创建完虚拟机后 ...
- Solution -「Gym 102759F」Interval Graph
\(\mathcal{Description}\) Link. 给定 \(n\) 个区间,第 \(i\) 个为 \([l_i,r_i]\),有权值 \(w_i\).设一无向图 \(G=(V=\ ...
- Java 位运算总结
一.Java中支持的位运算 位与(&):二元运算符,两个为1时结果为1,否则为0 位或(|):二元运算符,两个其中有一个为1时结果就为1,否则为0 位异或(^):二元运算符,两个数同时为1或0 ...
- Zookeeper 提供的API
上篇介绍了Zookeeper命令行相关的知识,本小作文介绍从另一个维度操作Node相关的内容:Zookeer的API.同样借用Zookeeper应用之一的数据注册与订阅中的案例类比命令行操作,重点介绍 ...
- 面试突击24:为什么wait和notify必须放在synchronized中?
在多线程编程中,wait 方法是让当前线程进入休眠状态,直到另一个线程调用了 notify 或 notifyAll 方法之后,才能继续恢复执行.而在 Java 中,wait 和 notify/noti ...