Tensorflow选择性初始化图中的变量

import tensorflow as tf

def initialize_uninitialized(sess):

    global_vars = tf.global_variables()

    is_not_initialized = sess.run([tf.is_variable_initialized(var) for var in global_vars])

    not_initialized_vars = [v for (v, f) in zip(global_vars, is_not_initialized) if not f]

    print [str(i.name) for i in not_initialized_vars] # only for testing

    if len(not_initialized_vars):

        sess.run(tf.variables_initializer(not_initialized_vars))

上述代码是用于初始化剩余未被初始化的变量的函数

需要注意的是，我们一般采用tf.global_variables_initializer()作为初始化op会覆盖原来通过saver.restore()方式加载的变量状态，因此，不可采用此方法。

另外，如果采用sess.run(tf.global_variables_initializer())在 saver.restore()之前，是不起作用的，原因未知，restore函数似乎能屏蔽掉global_variables_initializer()

的初始化效果。

选择性加载变量时可以采用scope进行隔离，提取出name:var这样的键值对的字典作为saver的加载根据。如下代码：

# stage_merged.py

# transform from single frame into multi-frame enhanced single raw

from __future__ import division

import os, time, scipy.io

import tensorflow as tf

import numpy as np

import rawpy

import glob

from model_sid_latest import network_stages_merged, network_my_unet, network_enhance_raw

import platform

from PIL import Image

if platform.system() == 'Windows':

    data_dir = 'D:/data/Sony/dataset/bbf-raw-selected/'

elif platform.system() == 'Linux':

    data_dir = './dataset/bbf-raw-selected/'

else:

    print('platform not supported!')

    assert False

os.environ["CUDA_VISIBLE_DEVICES"] = ""

checkpoint_dir = './model_stage_merged/'

result_dir = './out_stage_merged/'

log_dir = './log_stage_merged/'

learning_rate = 1e-4

epoch_bound = 20000

save_model_every_n_epoch = 10

if platform.system() == 'Windows':

    output_every_n_steps = 1

else:

    output_every_n_steps = 100

if platform.system() == 'Windows':

    ckpt_enhance_raw = 'D:/model/enhance_raw/'

    ckpt_raw2rgb = 'D:/model/raw2rgb-c1/'

else:

    ckpt_enhance_raw = './model/enhance_raw/'

    ckpt_raw2rgb = './model/raw2rgb-c1/'

# BBF100-2

bbf_w = 4032

bbf_h = 3024

patch_w = 512

patch_h = 512

max_level = 1023

black_level = 64

patch_w = 512

patch_h = 512

# set up dataset

input_files = glob.glob(data_dir + '/*.dng')

input_files.sort()

def preprocess(raw, bl, wl):

    im = raw.raw_image_visible.astype(np.float32)

    im = np.maximum(im - bl, 0)

    return im / (wl - bl)

def pack_raw_bbf(path):

    raw = rawpy.imread(path)

    bl = 64

    wl = 1023

    im = preprocess(raw, bl, wl)

    im = np.expand_dims(im, axis=2)

    H = im.shape[0]

    W = im.shape[1]

    if raw.raw_pattern[0, 0] == 0: # CFA=RGGB

        out = np.concatenate((im[0:H:2, 0:W:2, :],

                              im[0:H:2, 1:W:2, :],

                              im[1:H:2, 1:W:2, :],

                              im[1:H:2, 0:W:2, :]), axis=2)

    elif raw.raw_pattern[0,0] == 2: # BGGR

        out = np.concatenate((im[1:H:2, 1:W:2, :],

                              im[0:H:2, 1:W:2, :],

                              im[0:H:2, 0:W:2, :],

                              im[1:H:2, 0:W:2, :]), axis=2)

    elif raw.raw_pattern[0,0] == 1 and raw.raw_pattern[0,1] == 0: # GRBG

        out = np.concatenate((im[0:H:2, 1:W:2, :],

                              im[0:H:2, 0:W:2, :],

                              im[1:H:2, 0:W:2, :],

                              im[1:H:2, 1:W:2, :]), axis=2)

    elif raw.raw_pattern[0,0] == 1 and raw.raw_pattern[0,1] == 2: # GBRG

        out = np.concatenate((im[1:H:2, 0:W:2, :],

                              im[0:H:2, 0:W:2, :],

                              im[0:H:2, 1:W:2, :],

                              im[1:H:2, 1:W:2, :]), axis=2)

    else:

        assert False

    wb = np.array(raw.camera_whitebalance)

    wb[3] = wb[1]

    wb = wb / wb[1]

    out = np.minimum(out * wb, 1.0)

    h_, w_ = im.shape[0]//2, im.shape[1]//2

    out_16bit_ = np.zeros([h_, w_, 4], dtype=np.uint16)

    out_16bit_[:, :, :] = np.uint16(out[:, :, :] * (wl - bl))

    del out

    return out_16bit_

tf.reset_default_graph()

gpu_options = tf.GPUOptions(allow_growth=True)

sess = tf.Session(config=tf.ConfigProto(gpu_options=gpu_options))

in_im = tf.placeholder(tf.float32, [1, patch_h, patch_w, 4], name='input')

with tf.variable_scope('enhance_raw', reuse=tf.AUTO_REUSE):

    enhanced_raw = network_enhance_raw(in_im, patch_h, patch_w)

with tf.variable_scope('raw2rgb', reuse=tf.AUTO_REUSE):

    gt_im = network_my_unet(enhanced_raw, patch_h, patch_w)

with tf.variable_scope('stage_merged', reuse=tf.AUTO_REUSE):

    out_im = network_stages_merged(in_im, patch_h, patch_w)

gt_im_cut = tf.minimum(tf.maximum(gt_im, 0.0), 1.0)

out_im_cut = tf.minimum(tf.maximum(out_im, 0.0), 1.0)

ssim_loss = 1 - tf.image.ssim_multiscale(gt_im_cut[0], out_im_cut[0], 1.0)

l1_loss = tf.reduce_mean(tf.reduce_sum(tf.abs(gt_im_cut - out_im_cut), axis=-1))

l2_loss = tf.reduce_mean(tf.reduce_sum(tf.square(gt_im_cut - out_im_cut), axis=-1))

G_loss = ssim_loss

# G_loss = l1_loss + l2_loss

tf.summary.scalar('G_loss', G_loss)

tf.summary.scalar('L1 Loss', l1_loss)

tf.summary.scalar('L2 Loss', l2_loss)

########## LOADING MODELS #############

scope_ = 'enhance_raw'

enhance_raw_var_list = tf.global_variables(scope_)

enhance_raw_var_names = [v.name.replace(scope_+'/', '').replace(':0', '') for v in enhance_raw_var_list]

enhance_raw_map = dict()

for i in range(len(enhance_raw_var_names)):

    enhance_raw_map[enhance_raw_var_names[i]] = enhance_raw_var_list[i]

saver_enhance_raw = tf.train.Saver(var_list=enhance_raw_map)

ckpt = tf.train.get_checkpoint_state(ckpt_enhance_raw)

if ckpt:

    saver_enhance_raw.restore(sess, ckpt.model_checkpoint_path)

    print('loaded enhance_raw model: ' + ckpt.model_checkpoint_path)

else:

    print('Error: failed to load enhance_raw model!')

#----------------------------------------

scope_ = 'raw2rgb'

raw2rgb_var_list = tf.global_variables(scope_)

raw2rgb_var_names = [v.name.replace(scope_+'/', '').replace(':0', '') for v in raw2rgb_var_list]

raw2rgb_map = dict()

for i in range(len(raw2rgb_var_names)):

    raw2rgb_map[raw2rgb_var_names[i]] = raw2rgb_var_list[i]

saver_raw2rgb = tf.train.Saver(var_list=raw2rgb_map)

ckpt = tf.train.get_checkpoint_state(ckpt_raw2rgb)

if ckpt:

    saver_raw2rgb.restore(sess, ckpt.model_checkpoint_path)

    print('loaded raw2rgb model: ' + ckpt.model_checkpoint_path)

else:

    print('Error: failed to load raw2rgb model!')

    assert False

#----------------------------------------

def initialize_uninitialized(sess):

    global_vars = tf.global_variables()

    bool_inits = sess.run([tf.is_variable_initialized(var) for var in global_vars])

    uninit_vars = [v for (v, b) in zip(global_vars, bool_inits) if not b]

    for v in uninit_vars:

        print(str(v.name))

    if len(uninit_vars):

        sess.run(tf.variables_initializer(uninit_vars))

t_vars = tf.trainable_variables(scope='stage_merged')

lr = tf.placeholder(tf.float32)

G_opt = tf.train.AdamOptimizer(learning_rate=lr).minimize(G_loss, var_list=t_vars)

saver = tf.train.Saver(var_list=t_vars)

ckpt = tf.train.get_checkpoint_state(checkpoint_dir)

if ckpt:

    saver.restore(sess, ckpt.model_checkpoint_path)

    print('loaded ' + ckpt.model_checkpoint_path)

else:

    sess.run(tf.variables_initializer(var_list=t_vars))

    initialize_uninitialized(sess)

#######################################

if not os.path.isdir(result_dir):

    os.mkdir(result_dir)

input_images = [None] * len(input_files)

g_loss = np.zeros([500, 1])

merged = tf.summary.merge_all()

writer = tf.summary.FileWriter(log_dir, sess.graph)

steps = 0

st = time.time()

for epoch in range(0, epoch_bound):

    for ind in np.random.permutation(len(input_images)):

        steps += 1

        if input_images[ind] is None:

            input_images[ind] = np.expand_dims(pack_raw_bbf(input_files[ind]), axis=0)

        # random cropping

        xx = np.random.randint(0, bbf_w // 2 - patch_w)

        yy = np.random.randint(0, bbf_h // 2 - patch_h)

        input_patch = np.float32(input_images[ind][:, yy:yy + patch_h, xx:xx + patch_w, :]) / (

                    max_level - black_level)

        # random flipping

        if np.random.randint(2, size=1)[0] == 1:  # random flip

            input_patch = np.flip(input_patch, axis=1)

        if np.random.randint(2, size=1)[0] == 1:

            input_patch = np.flip(input_patch, axis=0)

        if np.random.randint(2, size=1)[0] == 1:  # random transpose

            input_patch = np.transpose(input_patch, (0, 2, 1, 3))

        summary, _, G_current, output, gt_im_ = sess.run(

            [merged, G_opt, G_loss, out_im_cut, gt_im_cut],

            feed_dict={

                in_im: input_patch,

                lr: learning_rate})

        g_loss[steps % len(g_loss)] = G_current

        if steps % output_every_n_steps == 0:

            loss_ = np.mean(g_loss[np.where(g_loss)])

            cost_ = (time.time() - st) / output_every_n_steps

            st = time.time()

            print("%d %d Loss=%.6f Speed=%.6f" % (epoch, steps, loss_, cost_))

            writer.add_summary(summary, global_step=steps)

            temp = np.concatenate(

                (input_patch[0, :, :, :3],

                 gt_im_[0, 0:patch_h*2:2, 0:patch_w*2:2, :3],

                 output[0, 0:patch_h*2:2, 0:patch_w*2:2, :3]), axis=1)

            scipy.misc.toimage(temp * 255, high=255, low=0, cmin=0, cmax=255) \

                .save(result_dir + '/%d_%d.jpg' % (epoch, steps))

        # clean up the memory if necessary

        if platform.system() == 'Windows':

            input_images[ind] = None

    if epoch % save_model_every_n_epoch == 0:

        saver.save(sess, checkpoint_dir + '%d.ckpt' % epoch)

        print('model saved.')

Tensorflow选择性初始化图中的变量的更多相关文章

AI学习---TensorFlow框架介绍[图+会话+张量+变量OP+API]
TensorFlow的数据流图 TensorFlow的结构分析: 图 + 会话 TensorFlow = 构图阶段(数据与操作的执行步骤被描绘出一个图) + 执行图阶段(使用回话执行构建好的图中操作) ...
Tensorflow替换静态图中的OP
import tensorflow as tf import collections from tensorflow.core.framework import tensor_shape_pb2 # ...
java初始化过程中成员变量
package day01; class Base{ int j; //1.j=0 Base(){ add(1); //2.调用子类add()方法 System.out.println(j); //4 ...
2、Tensorflow中的变量
2.Tensorflow中的变量注意:tf中使用变量必须先初始化下面是一个使用变量的TF代码(含注释): # __author__ = "WSX" import tensorfl ...
Tensorflow中的变量
从初识tf开始,变量这个名词就一直都很重要,因为深度模型往往所要获得的就是通过参数和函数对某一或某些具体事物的抽象表达.而那些未知的数据需要通过学习而获得,在学习的过程中它们不断变化着,最终收敛达到较 ...
TensorFlow中的变量和常量
1.TensorFlow中的变量和常量介绍 TensorFlow中的变量: import tensorflow as tf state = tf.Variable(0,name='counter') ...
深度学习原理与框架-Tensorflow基本操作-Tensorflow中的变量
1.tf.Variable([[1, 2]]) # 创建一个变量参数说明:[[1, 2]] 表示输入的数据,为一行二列的数据 2.tf.global_variables_initializer() ...
tensorflow 保存训练模型ckpt 查看ckpt文件中的变量名和对应值
TensorFlow 模型保存与恢复一个快速完整的教程,以保存和恢复Tensorflow模型. 在本教程中,我将会解释: TensorFlow模型是什么样的? 如何保存TensorFlow模型? 如 ...
c++ 类与函数中static变量初始化问题（转）
首先static变量只有一次初始化,不管在类中还是在函数中..有这样一个函数: void Foo() { ; // initialize std::cout << a; a++; } 里的 ...

随机推荐

calss 类
class Role(object): n = 123 # 类变量,像__init__中life_value,money默认参数用类变量,如果多个类的实例那就节省了内存,类变量只在类中存一份,实例中不 ...
postman+newman+jenkins 接口自动化问题
声明:个人原创,转载请注明 1.安装postman工具下载地址:https://www.getpostman.com/点击下载,选择自己的系统,我的是windows系统,64位 2.postman ...
【winform】splitContainer拆分器控件
一. 1.panel的显示和隐藏设置SplitterDistance的数值大小即可改变panel的左右大小.这里设置的数值是指分割线距离左边框的像素,设置成0的话,左半部分就完全看不到了,可以实现一 ...
Oarcle之序列
序列:是一种数据库对象,用来自动产生一组唯一的序号: 序列:是一种共享式的对象,多个用户可以共同使用序列中的序号. 创建序列 create sequence seq_emp_temp incremen ...
SpringBoot Controller接收参数的几种常用方式
第一类:请求路径参数1.@PathVariable获取路径参数.即url/{id}这种形式. 2.@RequestParam获取查询参数.即url?name=这种形式例子GET http://loc ...
第一章 Python程序语言简介
第一节 Python概述 1. 什么是Python Python是一种解释型.面向对象.动态数据类型的高级程序设计语言.由Guido van Rossum与1989年发明,第一个公开发行版本发行于 ...
在linux和windows用c++编写c接口的动态库
linux 动态的头文件api.h #ifndef _API_H #define _API_H #ifdef DLL_IMPLEMENT #define DLL_EXPORT extern " ...
XUnit测试框架-Python unittest
选择语言选择本次个人作业我选择的语言是Python,了解学习Python有一段时间了但是一直没有练习,所以这次玩蛇,使用的版本是Python3.6. 开发工具选择我选择的IDE是Pycharm, ...
CSS3之calc()和box-sizing属性
box-sizing 属性规定两个并排的带边框的框: 例子: box-sizing 属性允许您以特定的方式定义匹配某个区域的特定元素. 例如,假如您需要并排放置两个带边框的框,可通过将 box-si ...
ECS之Git服务器搭建
最简教程 ### . 安装Git 安装Git服务,命令如下: ```Shell $ yum install curl-devel expat-devel gettext-devel openssl-d ...

Tensorflow选择性初始化图中的变量

Tensorflow选择性初始化图中的变量的更多相关文章

随机推荐

热门专题