tensorflow中一种融合多个模型的方法

1.使用场景

假设我们有训练好的模型A,B,C，我们希望使用A,B,C中的部分或者全部变量，合成为一个模型D，用于初始化或其他目的，就需要融合多个模型的方法

2.如何实现

我们可以先声明模型D，再创建多个Saver实例，分别从模型A,B,C的保存文件（checkpoint文件）中读取所需的变量值，来达成这一目的，下面是示例代码：

首先创建一个只包含w1,w2两个变量的模型，初始化后保存：

 def train_model1():

     w1 = tf.get_variable("w1", shape=[3, 1], initializer=tf.truncated_normal_initializer(),trainable=True)

     w2 = tf.get_variable("w2", shape=[3, 1], initializer=tf.truncated_normal_initializer(), trainable=True)

     x = tf.placeholder(tf.float32, shape=[None, 3], name="x")

     a1 = tf.matmul(x, w1)

     input = np.random.rand(3200, 3)

     sess = tf.InteractiveSession()

     sess.run(tf.global_variables_initializer())

     saver1 = tf.train.Saver([w1,w2])

     for i in range(0, 1):

         w1_var,w2_var = sess.run([w1,w2], feed_dict={x: input[i * 32:(i + 1) * 32]})

         print w1_var

         print w2_var

         print '=' * 30

     saver1.save(sess, 'save1-exp')

然后再创建一个只包含w2,w3两个变量的模型，也是初始化后保存：

 def train_model2():

     w2 = tf.get_variable("w2", shape=[3, 1], initializer=tf.truncated_normal_initializer(),trainable=True)

     w3 = tf.get_variable("w3", shape=[3, 1], initializer=tf.truncated_normal_initializer(),trainable=True)

     x = tf.placeholder(tf.float32, shape=[None, 3], name="x")

     a2 = tf.matmul(x, w2 * w3)

     input = np.random.rand(3200, 3)

     sess = tf.InteractiveSession()

     sess.run(tf.global_variables_initializer())

     saver2 = tf.train.Saver([w2,w3])

     for i in range(0, 1):

         w2_var, w3_var = sess.run([w2, w3], feed_dict={x: input[i * 32:(i + 1) * 32]})

         print w2_var

         print w3_var

         print '=' * 30

     saver2.save(sess, 'save2-exp')

最后我们创建一个包含w1，w2，w3变量的模型，从上面两个保存的ckp文件中恢复：

 def restore_model():

     w1 = tf.get_variable("w1", shape=[3, 1], initializer=tf.truncated_normal_initializer(),trainable=True)

     w2 = tf.get_variable("w2", shape=[3, 1], initializer=tf.truncated_normal_initializer(),trainable=True)

     w3 = tf.get_variable("w3", shape=[3, 1], initializer=tf.truncated_normal_initializer(),trainable=True)

     x = tf.placeholder(tf.float32, shape=[None, 3], name="x")

     a1 = tf.matmul(x, w1)

     a2 = tf.matmul(x, w2 * w3)

     loss = tf.reduce_mean(tf.square(a1 - a2))

     sess = tf.InteractiveSession()

     sess.run(tf.global_variables_initializer())

     saver1 = tf.train.Saver([w1,w2])

     saver1.restore(sess, 'save1-exp')

     saver2 = tf.train.Saver([w2, w3])

     saver2.restore(sess, 'save2-exp')

     saver3 = tf.train.Saver(tf.trainable_variables())

     input = np.random.rand(3200, 3)

     w1_var, w2_var, w3_var = sess.run([w1, w2, w3], feed_dict={x: input[0:32]})

     print w1_var

     print w2_var

     print w3_var

     print '=' * 30

     saver3.save(sess, 'save3-exp')

然后保存，即完成了我们的目标

3.注意事项

3.1 取的模型中有同名变量

假设同名变量为a，这种情况下，从不同模型中恢复的a是按照读取顺序覆盖到a中的，如果希望只读取特定ckpt保存的变量值，在创建读取其他ckpt的saver时，不要把a加入到var_list中

3.2 模型D中有部分变量不在A,B,C中

这种情况，恢复时会报错，需要指定var_list，只恢复当前cpkt中保存的变量

tensorflow中一种融合多个模型的方法的更多相关文章

Java中几种常用数据类型之间转换的方法
Java中几种常用的数据类型之间转换方法: 1. short-->int 转换 exp: short shortvar=0; int intvar=0; shortvar= (short) in ...
[转]分享php中四种webservice实现的简单架构方法及实例
FROM : http://www.itokit.com/2012/0417/73615_2.html 本人所了解的webservice有以下几种:PHP本身的SOAP,开源的NUSOAP,商业版的P ...
分享php中四种webservice实现的简单架构方法及实例
一:PHP本身的SOAP所有的webservice都包括服务端(server)和客户端(client).要使用php本身的soap首先要把该拓展安装好并且启用.下面看具体的code首先这是服务端实现: ...
在Linux中三种让crontab每秒执行任务的方法
第一种方法: 1.创建脚本文件 cat phplog.sh 2.编辑脚本内容 #!/bin/bash while : ;do /home/scripts.sh 2>/dev/null & ...
分享php中四种webservice实现的简单架构方法及实例(转)
本人所了解的webservice有以下几种:PHP本身的SOAP,开源的NUSOAP,商业版的PHPRPC,以及使用二进制传输数据流的 HessianPHP,那么一下就简单的介绍下这几种webserv ...
分享php中四种webservice实现的简单架构方法及实例[转载]
[转载]http://www.itokit.com/2012/0417/73615.html 本人所了解的webservice有以下几种:PHP本身的SOAP,开源的NUSOAP,商业版的PHPRPC ...
比较C#中几种常见的复制字节数组方法的效率
在日常编程过程中,我们可能经常需要Copy各种数组,一般来说有以下几种常见的方法:Array.Copy,IList<T>.Copy,BinaryReader.ReadBytes,Buffe ...
JAVA中3种将byte转换为String的方法
HttpClient 类库中GetMethod类的getResponseBody方法返回的是byte[]类型,要操作起来不方便,我想把它转化成String类型. 查了网上的资料,有说法认为用这种方法比 ...
比较C#中几种常见的复制字节数组方法的效率[转]
[原文链接] 在日常编程过程中,我们可能经常需要Copy各种数组,一般来说有以下几种常见的方法:Array.Copy,IList<T>.Copy,BinaryReader.ReadByte ...

随机推荐

git常用命令2--- git rebase
git rebase:简单而言就是把某个分支上的提交commit嫁接到另一个commit的后面,在这个过程中这些commit的base相对就改变了,也就叫变基. git rebase <upst ...
Mssql数据库与Excel导数据
*.xls 2003的excel有行数限制,65535行好像,所以数据库行数多的时候,选择导出为*.xlsx文件要装一下Microsoft.ACE.OLEDB.12.0(以下简称 ACE 引擎) ...
this-11.1-笔记
1. 基本数据类型:string undefined null boolean number 引用数据类型 Object array function 1.2 二者的区别基本数据 ...
poj2456 Aggressive cows（二分查找）
https://vjudge.net/problem/POJ-2456 二分,从最大长度开始,不断折半试,如果牛全放下了,就是可行,修改下界,否则改上届. #include<iostream&g ...
J - 青蛙的约会（扩展欧几里得）
https://vjudge.net/contest/218366#problem/J 第一步追及公式要写对:y+nk-(x+mk)=pL => (n-m)k+lp=x-y 可以看出扩展欧几里得 ...
springboot + websocket + spring-messaging实现服务器向浏览器广播式
目录结构 pom.xml <project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http:// ...
Centos yum国内源及配置含义
Centos yum源的位置: /etc/yum.repos.d,可以通过配置文件/etc/yum.conf指定其他位置主要的yum源种类:前两个是必须的,不然yum安装很多软件时会失败.yum本来 ...
Gitbook 简介使用总结 MD
Markdown版本笔记我的GitHub首页我的博客我的微信我的邮箱 MyAndroidBlogs baiqiantao baiqiantao bqt20094 baiqiantao@sina ...
Gradle sync failed: /Applications/Android Studio.app/Contents/gradle/gradle-2.14.1/lib/plugins/gradle-diagnostics-2.14.1.jar (No such file or directory) Consult IDE log for more details (Help | Sh
上面出现的错误是,我从Android Studio 2.2 升级到2.3后,出现的问题, 找到方法: http://stackoverflow.com/questions/30526613/andro ...
Js实现Table动态添加一行的小例子
<form id="form1" runat="server"> <div> <table id=" style=&qu ...