Effective TensorFlow 2.0

为使TensorFLow用户更高效，TensorFlow 2.0中进行了多出更改。TensorFlow 2.0删除了篇冗余API，使API更加一致（统一RNNs, 统一优化器），并通过Eager execution更好地与Python集成。

许多RFCs已经解释了TensorFlow 2.0带来的变化。本指南介绍了TensorFlow 2.0应该怎么进行开发。这假设您已对TensorFlow 1.x有一定了解。

A brief summary of major changes

API Cleanup

许多API在TF 2.0中进行了移动或删除。一些主要的变化包括删除tf.app，tf.flags，使tf.logging支持现在开源的absl-py，重新生成项目的tf.contribe，通过清理tf.*中那些较少使用的命名空间，例如tf.math。一些API已替换为自己的2.0版本-tf.summary,tf.keras.metrics, 和tf.keras.optimizers。最快升级应用这些重命名带来的变化可使用v2升级脚本。

Eager execution

TensorFlow 1.x要求用户通过tf.*API手动的将抽象语法树（图）拼接在一起。然后它要求用户通过一组输入、输出张量传递给session.run()从而手动编译调用这个图。TensorFlow 2.0 Eager execution可以像Python那样执行，在2.0中，graph 和 session会像实现细节一样。

值得注意的是tf.control_dependencies()不再需要了，因为所有代码都是行顺序执行的（用tf.function声明）。

No more globals

TensorFlow 1.x严重依赖隐式全局命名空间。当你调用tf.Variable()，它会被放入默认图中，即使你忘了指向它的Python变量，它也会被保留在那里。然后你可以恢复它，但前提是你得知道它创建时的名称。如果你无法控制变量的创建，这很难做到。其结果是，各种各样的机制，试图帮助用户再次找到他们的变量，以及为框架找到用户创建的变量：Variable scopes, global collections。例如tf.get_global_step()，tf.global_variables_initializer()，还有优化器隐式计算所有可训练变量的梯度等等。

TensorFlow 2.0消除了这些机制（Variable 2.0 RFC）默认支持的机制：跟踪你的变量！如果你忘记了一个tf.Variable，它就会当作垃圾被回收。

Functions, not sessions

session.run()几乎可以像函数一样调用：指定输入和被调用的函数，你可以得到一组输出。在TensorFlow 2.0中，您可以使用Python函数tf.function()来标记它以进行JIT编译，以便TensorFlow将其作为单个图运行(Function 2.0 RFC)。这种机制允许TensorFlow 2.0获得图模型所有的好处：

性能：函数可以被优化（node pruning, kernel fusion, etc.）
可移植性：该功能可以被导出/重新导入（SavedModel 2.0 RFC），允许用户重用和共享模块化TensorFlow功能。

# TensorFlow 1.X

outputs = session.run(f(placeholder), feed_dict={placeholder: input})

# TensorFlow 2.0

outputs = f(input)

凭借穿插Python 和TensorFlow代码的能力，我们希望用户能够充分利用Python的表现力。除了在没有Python解释器的情况下执行TensorFlow，如mobile, C++, 和 JS。为了帮助用户避免在添加时重写代码@tf.function， AutoGraph会将Python构造的一个子集转换为他们的TensorFlow等价物：

for/while -> tf.while_loop (支持break 和 continue)
if->tf.cond
for _ in dataset -> dataset.reduce

AutoGraph支持控制流的任意嵌套，这使得可以有较好性能并且简洁地实现许多复杂的ML程序，如序列模型，强化学习，自定义训练循环等。

Recommendations for idiomatic TensorFlow 2.0

Refactor your code into smaller functions

TensorFlow 1.x中常见使用模式是“kitchen sink”策略，其中所有可能的计算的联合被预先布置，然后选择被评估的张量，通过session.run()运行。在TensorFlow 2.0中，用户应该将代码重构为较小的函数，这些函数根据需要被调用。通常，没有必要用tf.function去装饰那些比较小的函数；仅用tf.function去装饰高等级的计算，例如，训练的一个步骤，或模型的前向传递。

Use Keras layers and models to manage variables

Keras模型和图层提供了方便variables和 trainable_variables属性，它以递归方式收集所有因变量。这使得在本地管理变量非常容易。

对比：

def dense(x, W, b):

  return tf.nn.sigmoid(tf.matmul(x, W) + b)

@tf.function

def multilayer_perceptron(x, w0, b0, w1, b1, w2, b2 ...):

  x = dense(x, w0, b0)

  x = dense(x, w1, b1)

  x = dense(x, w2, b2)

  ...

# 你仍然需要管理w_i和b_i，它们的形状远离代码定义。

Keras版本：

# 可以调用每个图层，其签名等效于 linear(x)

layers = [tf.keras.layers.Dense(hidden_size, activation=tf.nn.sigmoid) for _ in range(n)]

perceptron = tf.keras.Sequential(layers)

# layers[3].trainable_variables => returns [w3, b3]

# perceptron.trainable_variables => returns [w0, b0, ...]

Keras layers/models继承自tf.train.Checkpointable并集成了@tf.function，这使得直接从Keras对象导出SavedModels或checkpoint成为可能。您不一定要使用Keras的.fitAPI来利用这些集成。

这是一个迁移学习的例子，演示了Keras如何轻松收集相关变量的子集。假设你正在训练一个带有共享主干的多头模型：

trunk = tf.keras.Sequential([...])

head1 = tf.keras.Sequential([...])

head2 = tf.keras.Sequential([...])

path1 = tf.keras.Sequential([trunk, head1])

path2 = tf.keras.Sequential([trunk, head2])

# Train on primary dataset

for x, y in main_dataset:

  with tf.GradientTape() as tape:

    prediction = path1(x)

    loss = loss_fn_head1(prediction, y)

  # Simultaneously optimize trunk and head1 weights.

  gradients = tape.gradients(loss, path1.trainable_variables)

  optimizer.apply_gradients(gradients, path1.trainable_variables)

# Fine-tune second head, reusing the trunk

for x, y in small_dataset:

  with tf.GradientTape() as tape:

    prediction = path2(x)

    loss = loss_fn_head2(prediction, y)

  # Only optimize head2 weights, not trunk weights

  gradients = tape.gradients(loss, head2.trainable_variables)

  optimizer.apply_gradients(gradients, head2.trainable_variables)

# You can publish just the trunk computation for other people to reuse.

tf.saved_model.save(trunk, output_path)

Combine tf.data.Datasets and @tf.function

在内存中迭代拟合训练数据时，可以随意使用常规的Python迭代。或者，tf.data.Dataset是从硬盘读取训练数据流的最好方法。Datasets是可迭代的（不是迭代器），它可以像在Eager模式下的其他Python迭代一样工作。您可以通过用tf.function()包装代码来充分利用数据集异步预取/流功能，这将使用AutoGraph等效的图操作替换Python的迭代。

@tf.function

def train(model, dataset, optimizer):

  for x, y in dataset:

    with tf.GradientTape() as tape:

      prediction = model(x)

      loss = loss_fn(prediction, y)

    gradients = tape.gradients(loss, model.trainable_variables)

    optimizer.apply_gradients(gradients, model.trainable_variables)

如果您使用Keras.fit()API，则无需担心数据集迭代。

model.compile(optimizer=optimizer, loss=loss_fn)

model.fit(dataset)

Take advantage of AutoGraph with Python control flow

AutoGraph提供了一种将依赖于数据的控制流转换为等效图形模式的方法，如tf.cond和tf.while_loop。

数据相关控制流出现的一个常见位置是序列模型。tf.keras.layers.RNN包装了一个RNN cell，允许您既可以静态也可以动态的循环展开。为了演示，您可以重新实现动态展开，如下所示：

class DynamicRNN(tf.keras.Model):

  def __init__(self, rnn_cell):

    super(DynamicRNN, self).__init__(self)

    self.cell = rnn_cell

  def call(self, input_data):

    # [batch, time, features] -> [time, batch, features]

    input_data = tf.transpose(input_data, [1, 0, 2])

    outputs = tf.TensorArray(tf.float32, input_data.shape[0])

    state = self.cell.zero_state(input_data.shape[1], dtype=tf.float32)

    for i in tf.range(input_data.shape[0]):

      output, state = self.cell(input_data[i], state)

      outputs = outputs.write(i, output)

    return tf.transpose(outputs.stack(), [1, 0, 2]), state

有关AutoGraph功能的更详细概述，请参阅指南

Use tf.metrics to aggregate data and tf.summary to log it

要记录摘要，请使用tf.summary.(scalar|histogram|...)上下文管理器将其重定向到编写器。（如果省略上下文管理器，则不会发生任何事情。）与TF 1.x不同，摘要直接发送给编写器; 没有单独的“合并”操作，也没有单独的add_summary()调用，这意味着step必须在调用点提供该值。

summary_writer = tf.summary.create_file_writer('/tmp/summaries')

with summary_writer.as_default():

  tf.summary.scalar('loss', 0.1, step=42)

要在将数据记录为摘要之前聚合数据，请使用tf.metrics。Metrics是有状态的；它们积累值并在您调用.result()时返回结果。清除积累值，请使用.reset_states()。

def train(model, optimizer, dataset, log_freq=10):

  avg_loss = tf.keras.metrics.Mean(name='loss', dtype=tf.float32)

  for images, labels in dataset:

    loss = train_step(model, optimizer, images, labels)

    avg_loss.update_state(loss)

    if tf.equal(optimizer.iterations % log_freq, 0):

      tf.summary.scalar('loss', avg_loss.result(), step=optimizer.iterations)

      avg_loss.reset_states()

def test(model, test_x, test_y, step_num):

  loss = loss_fn(model(test_x), test_y)

  tf.summary.scalar('loss', loss, step=step_num)

train_summary_writer = tf.summary.create_file_writer('/tmp/summaries/train')

test_summary_writer = tf.summary.create_file_writer('/tmp/summaries/test')

with train_summary_writer.as_default():

  train(model, optimizer, dataset)

with test_summary_writer.as_default():

  test(model, test_x, test_y, optimizer.iterations)

通过将TensorBoard指向摘要日志目录来可视化生成的摘要：tensorboard --logdir /tmp/summaries。

阅读原文

欢迎关注我的公众号，一起学习！

TensorFlow 2.0高效开发指南的更多相关文章

TensorFlow 2.0 快速入门指南 | iBooker·ApacheCN
原文:TensorFlow 2.0 Quick Start Guide 协议:CC BY-NC-SA 4.0 自豪地采用谷歌翻译不要担心自己的形象,只关心如何实现目标.--<原则>,生活 ...
Cognos 11.0快速开发指南 Ⅰ
1. 概述 Cognos Analysics 11,是IBM在Cognos BI 10的版本基础上,吸取业界流行的敏捷BI理念,强化了自助式分析的一款强大BI开发平台工具.其官方文档内容丰富,但是较为 ...
Cognos 11.0快速开发指南 Ⅱ
1. 创建报表在创建好数据源之后,我们就可以创建报表了,报表的开发是浏览器中完成的,这里我选用了chrome浏览器,在地址栏输入:http://localhost:80/ibmcognos ( ...
Odoo 8.0 实施开发指南第一版试读
试读地址: http://share.weiyun.com/4f83964db87e022c7c210abe6b5e782f 如有错误,欢迎指正.
OAuth2.0开发指南
OAuth2.0开发指南 1.认证与登录来往开放平台支持3种不同的OAuth 2.0验证与授权流程: 服务端流程(协议中Authorization Code Flow): 此流程适用于在Web服务端 ...
腾讯云安全：开发者必看｜Android 8.0 新特性及开发指南
欢迎大家关注腾讯云技术社区-博客园官方主页,我们将持续在博客园为大家推荐技术精品文章哦~ 背景介绍谷歌2017 I/O开发者大会今年将于5月17-19日在美国加州举办.大会将跟往年一样发布最新的 A ...
OAuth2.0学习（2-1）Spring Security OAuth2.0 开发指南
开发指南:http://www.cnblogs.com/xingxueliao/p/5911292.html Spring OAuth2.0 提供者实现原理: Spring OAuth2.0提供者实际 ...
Android开发指南--0 总览
无意间发现一个网站,主打IOS方面的教程,然而作为一个Android开发者,我就找了下网站里有没有Android的教程,还真有,这里就翻译一下. 翻译目标教程:https://www.raywende ...
开发者必看｜Android 8.0 新特性及开发指南
背景介绍谷歌2017 I/O开发者大会今年将于5月17-19日在美国加州举办.大会将跟往年一样发布最新的 Android 系统,今年为 Android 8.0.谷歌在今年3 月21日发布 Andro ...

随机推荐

css选择器四大类：基本、组合、属性、伪类
什么是选择器?选择器的作用是通过它可以找到元素,把css样式传递给元素!css选择器主要分为:基本选择器.属性选择器.组合选择器与伪类选择器四个大类! css基本选择器基本选择器又分为:*通配符.标 ...
WebStorm 2019.3.1 永久破解
PS:动手能力强的来,手残的去淘宝买吧,大概15块钱1年.建议看完后在动手,有一个全局观,浪费不了多少时间一. 下载破解补丁文件链接:https://pan.baidu.com/s/16-rPPH ...
OSI七层协议大白话解读
参考链接:https://www.cnblogs.com/zx125/p/11295985.html 国际标准化组织(ISO)制定了osi七层模型,iso规定了各种各样的协议,并且分了7层应用层应 ...
GCD相关
板子: ? gcd(b, a % b) : a; } POJ1930 题意:给你一个无限循环小数,给到小数点后 9 位,要求这个数的分数形式. 解法: 要想解决这道题,首先应该了解如何将循环小数化为分 ...
linux--工具参考篇
linux下的好用工具工具好多!!! gdb调试利器 ldd查看程序依赖库 lsof一切皆文件 ps进程查看器 pstack 跟踪进程栈 strace 跟踪进程中的系统调用 ipcs 查询进程间通信 ...
洛谷P1880 [NOI1995]石子合并纪中21日c组T4 2119. 【2016-12-30普及组模拟】环状石子归并
洛谷P1880 石子合并纪中2119. 环状石子归并洛谷传送门题目描述1 在一个圆形操场的四周摆放N堆石子,现要将石子有次序地合并成一堆.规定每次只能选相邻的2堆合并成新的一堆,并将新的一堆的石 ...
maven的核心概念——继承
15.1 为什么需要继承机制由于非compile范围的依赖信息是不能在“依赖链”中传递的,所以有需要的工程只能单独配置.例如: Hello <dependency> <groupI ...
Linux中为什么执行自己的程序要在前面加./
前言在Linux中,我们执行内置命令时,直接输入命令名称即可,如: $ mv a b #将a重命名为b 而在执行自己写好的程序时,却要带上./,例如: $ hello hello: comm ...
APFS 宗卷 • APFS(加密)磁盘格式怎么去掉？Mac磁盘加密怎么解除？
相信很多朋友都因为APFS 宗卷 • APFS(加密)磁盘格式而困扰,这种磁盘加密,导致很多破解版软件都不能安装.那么磁盘加密怎么解除?小编翻阅了一些教程,为您带来APFS 宗卷 • APFS(加密) ...
docker 安装 jenkins touch: cannot touch ‘/var/jenkins_home/copy_reference_file.log’: Permission denied Can not write to /var/jenkins_home/copy_reference_file.log. Wrong volume permissions?
拉取镜像 docker pull jenkins/jenkins:lts 官方下载运行容器 docker run -it -v /home/jenkins:/var/jenkins_home -p ...

TensorFlow 2.0高效开发指南

Effective TensorFlow 2.0

欢迎关注我的公众号，一起学习！

随机推荐

热门专题