因为最近在研究生成对抗网络GAN，在读别人的代码时发现了 with tf.variable_scope(self.name_scope_conv, reuse = reuse): 这样一条语句，查阅官方文档时明白了这是TensorFlow的变量共享机制。

举个例子：当我们研究生成对抗网络GAN的时候，判别器的任务是，如果接收到的是生成器生成的图像，判别器就尝试优化自己的网络结构来使自己输出0，如果接收到的是来自真实数据的图像，那么就尝试优化自己的网络结构来使自己输出1。也就是说，生成图像和真实图像经过判别器的时候，要共享同一套变量，所以TensorFlow引入了变量共享机制。

变量共享主要涉及到两个函数： tf.get_variable(<name>, <shape>, <initializer>) 和 tf.variable_scope(<scope_name>) 。

1. tf.get_variable(<name>, <shape>, <initializer>)

例如，我们搭建一个卷积层：

def conv_relu(input, kernel_shape, bias_shape):

    # Create variable named "weights".

    weights = tf.get_variable("weights", kernel_shape,

        initializer=tf.random_normal_initializer())

    # Create variable named "biases".

    biases = tf.get_variable("biases", bias_shape,

        initializer=tf.constant_initializer(0.0))

    conv = tf.nn.conv2d(input, weights,

        strides=[1, 1, 1, 1], padding='SAME')

    return tf.nn.relu(conv + biases)

然后，我们调用两次：

input1 = tf.random_normal([1,10,10,32])

input2 = tf.random_normal([1,20,20,32])

x = conv_relu(input1, kernel_shape=[5, 5, 1, 32], bias_shape=[32])

x = conv_relu(x, kernel_shape=[5, 5, 32, 32], bias_shape = [32])  # This fails.

会发现报错信息。因为执行的命令不明确：第二次调用时是创建一套新的变量（weights，biases）还是再次使用已存在的那一套变量（第一次调用时生成的weights和biases）呢？

这时就需要用到第二个函数： tf.variable_scope(<scope_name>)

2. tf.variable_scope(<scope_name>)

请看例子：

def my_image_filter(input_images):

    with tf.variable_scope("conv1"):

        # Variables created here will be named "conv1/weights", "conv1/biases".

        relu1 = conv_relu(input_images, [5, 5, 1, 32], [32])

    with tf.variable_scope("conv2"):

        # Variables created here will be named "conv2/weights", "conv2/biases".

        return conv_relu(relu1, [5, 5, 32, 32], [32])

在不同的域内会生成不同的变量。

如果想要变量共享，TensorFlow提供了两种方法：

1. 设置 reuse=True

with tf.variable_scope("model"):

  output1 = my_image_filter(input1)

with tf.variable_scope("model", reuse=True):

  output2 = my_image_filter(input2)

2. 调用 scope.reuse_variables()

with tf.variable_scope("model") as scope:

  output1 = my_image_filter(input1)

  scope.reuse_variables()

  output2 = my_image_filter(input2)

注：在官方文档的最后有这样一段话：Since depending on exact string names of scopes can feel dangerous, it's also possible to initialize a variable scope based on another one:

with tf.variable_scope("model") as scope:

  output1 = my_image_filter(input1)

with tf.variable_scope(scope, reuse=True):

  output2 = my_image_filter(input2)

TensorFlow学习笔记4——变量共享的更多相关文章

TensorFlow学习笔记3——变量共享
因为最近在研究生成对抗网络GAN,在读别人的代码时发现了 with tf.variable_scope(self.name_scope_conv, reuse = reuse): 这样一条语句,查阅官 ...
tensorflow学习笔记二----------变量
tensorflow里面的变量表示,需要使用特定的语法进行.如果想构造一个行(列)向量,需要调用Variable函数进行.对两个变量进行操作,也要调用相应的函数. import tensorflow ...
tensorflow学习笔记——使用TensorFlow操作MNIST数据（2）
tensorflow学习笔记——使用TensorFlow操作MNIST数据(1) 一:神经网络知识点整理 1.1,多层:使用多层权重,例如多层全连接方式以下定义了三个隐藏层的全连接方式的神经网络样例 ...
tensorflow学习笔记——自编码器及多层感知器
1,自编码器简介传统机器学习任务很大程度上依赖于好的特征工程,比如对数值型,日期时间型,种类型等特征的提取.特征工程往往是非常耗时耗力的,在图像,语音和视频中提取到有效的特征就更难了,工程师必须在这 ...
TensorFlow学习笔记(一)
[TensorFlow API](https://www.tensorflow.org/versions/r0.12/how_tos/variable_scope/index.html) Tensor ...
Tensorflow学习笔记2019.01.22
tensorflow学习笔记2 edit by Strangewx 2019.01.04 4.1 机器学习基础 4.1.1 一般结构: 初始化模型参数:通常随机赋值,简单模型赋值0 训练数据:一般打乱 ...
深度学习-tensorflow学习笔记(2)-MNIST手写字体识别
深度学习-tensorflow学习笔记(2)-MNIST手写字体识别超级详细版这是tf入门的第一个例子.minst应该是内置的数据集. 前置知识在学习笔记(1)里面讲过了这里直接上代码 # -*- ...
tensorflow学习笔记(1)-基本语法和前向传播
tensorflow学习笔记(1) (1)tf中的图图中就是一个计算图,一个计算过程. 图中的constant是个常量计 ...
TensorFlow学习笔记——LeNet-5（训练自己的数据集）
在之前的TensorFlow学习笔记——图像识别与卷积神经网络(链接:请点击我)中了解了一下经典的卷积神经网络模型LeNet模型.那其实之前学习了别人的代码实现了LeNet网络对MNIST数据集的训练 ...

随机推荐

福州三中集训day4
第6天写第4天的博客….可以说是很弱了…… 讲了一天的高级数据结构,可以说很迷,先是并查集,然后是树状数组,线段树,MAP函数,KMP算法. 很难……确实不是很清楚…但是很重要,回去以后这应该说是优先 ...
CentOS5.5下直接安装MySQL5.6
1.安装平台:CentOS5.5 2.由于从MySQL5.0升到MySQL5.6出现重大问题,为了不影响进度,暂时先直接安装MySQL5.6 2.1首先确认yum源,这里使用http://repo.m ...
Web应用渗透测试框架Arachni
Web应用渗透测试框架Arachni Arachni是一款Ruby语言编写的Web应用渗透测试框架.当用户指定目标后,该框架可以自动扫描网站页面,对页面中的链接.表单.Cookie.HTTP He ...
HDOJ 2582 f(n)
Discription This time I need you to calculate the f(n) . (3<=n<=1000000) f(n)= Gcd(3)+Gcd(4)+… ...
自定义数据类型写入SequenceFile并读出
开头对这边博客的内容做个概述,首先是定义了一个DoubleArrayWritable的类,用于存放矩阵的列向量,然后将其作为value写入SequenceFile中,key就是对应的矩阵的列号,最后( ...
Atom | 报错 Cannot load the system dictionary for zh-CN的解决办法
文章目录问题描述推荐阅读查找问题所在解决方案 (二选一) 问题描述最近这款优秀的编辑器 atom,报错 Cannot load the system dictionary for zh-CN ...
dwz中弹出的窗口页面如何获取前页面(点击按钮的页面)的元素？？？
在页面A.jsp中点击一个按钮,使用$.pdialog.open()方法弹出b.jsp页面(对话框窗口),我要在b.jsp中选中值然后关闭窗口(b.jsp)返回值给A.jsp~ =========== ...
推荐一些不错的开源免费易上手的web前端框架
1. bui 2.Semantic UI 3.oniui
[Bug]转：使用jquery的 uploadify，在谷歌浏览器上总会崩溃的解决方法
最近做的项目使用了jquery的uploadify,但是在谷歌浏览器测试总是会出现崩溃.如: 因为是java项目. 解决的办法是: 给引入的js加上一个参数,时间戳就可以,防止缓存,使每一次都请求.( ...
【mybatis】idea中 mybatis的mapper类去找对应的mapper.xml中的方法，使用插件mybatis-plugin
idea中 mybatis的mapper类去找对应的mapper.xml中的方法,使用插件mybatis-plugin,名字可能叫Free mybatis-plugin 安装上之后,可能需要重启ide ...

TensorFlow学习笔记4——变量共享

1. tf.get_variable(<name>, <shape>, <initializer>)

2. tf.variable_scope(<scope_name>)

TensorFlow学习笔记4——变量共享的更多相关文章

随机推荐

热门专题