tensorflow 2.0 技巧 | 自定义tf.keras.Model的坑
自定义tf.keras.Model需要注意的点
model.save()
- subclass Model 是不能直接save的,save成.h5,但是能够save_weights,或者save_format="tf"
NotImplementedError: Saving the model to HDF5 format requires the model to be a Functional model or a Sequential model. It does not work for subclassed models, because such models are defined via the body of a Python method, which isn't safely serializable. Consider saving to the Tensorflow SavedModel format (by setting save_format="tf") or using `save_weights`.
model.trainable_variables
- __init__若没有注册该layers,那么在后面应用梯度时会找不到model.trainable_variables。
像下面这样是不行的:
class Map_model(tf.keras.Model):
def __init__(self, is_train=False):
super(Map_model, self).__init__()
def call(self, x):
x = tf.keras.layers.Dense(10, activation='relu')
return x
model.summary()
- 需要先指定input_shape,或者你直接fit一遍它也能自动确定
model.build(input_shape=(None, 448, 448, 3))
print(model.summary())
class Map_model(tf.keras.Model):
def __init__(self, is_train=False):
super(Map_model, self).__init__()
self.map_f1 = tf.keras.layers.Dense(10, activation='relu', trainable=is_train)
# self.map_f2 = tf.keras.layers.Dense(6, activation='relu')
self.map_f3 = tf.keras.layers.Dense(3, activation='softmax', trainable=is_train)
def call(self, x):
x = self.map_f1(x)
# x = self.map_f2(x)
return self.map_f3(x)
@tf.function
def train_step(mmodel, label, L_label, loss_object, train_loss, train_accuracy, optimizer):
with tf.GradientTape() as tape:
L_label_pred = mmodel(label)
loss = loss_object(L_label, L_label_pred)
gradient_l = tape.gradient(loss, mmodel.trainable_variables)
train_loss(loss)
train_accuracy(L_label, L_label_pred)
optimizer.apply_gradients(zip(gradient_l, mmodel.trainable_variables))
def train():
mmodel = Map_model(is_train=True)
optimizer = tf.keras.optimizers.Adam(0.01)
loss_object = tf.keras.losses.CategoricalCrossentropy()
train_loss = tf.keras.metrics.Mean(name='train_loss')
train_accuracy = tf.keras.metrics.CategoricalAccuracy(name='train_accuracy')
EPOCHS = 0
labels = range(1, 30) # labels = truth_label -1
L_labels = [int(prpcs.map2Lclass(l)) for l in labels]
labels = [l - 1 for l in labels]
labels_onehot = tf.one_hot(labels, depth=29)
L_labels_onehot = tf.one_hot(L_labels, depth=3)
EPS = 1e-6
loss_e = 0x7f7f7f
while loss_e > EPS:
EPOCHS += 1
train_loss.reset_states()
train_accuracy.reset_states()
train_step(mmodel, labels_onehot, L_labels_onehot, loss_object, train_loss, train_accuracy, optimizer)
template = 'Epoch {}, Loss: {}, Accuracy: {}'
print(template.format(EPOCHS,
train_loss.result(),
train_accuracy.result() * 100))
loss_e = train_loss.result()
print("labels_onehot shape:", labels_onehot.shape)
model_path = r'./models/'
if not os.path.exists(model_path):
os.makedirs(model_path)
mmodel.save(os.path.join(model_path, 'map_model_{}'.format(EPS)))
mmodel.save_weights(os.path.join(model_path, 'map_model_weights_{}'.format(EPS)))
print("Save model!")
tensorflow 2.0 技巧 | 自定义tf.keras.Model的坑的更多相关文章
- tf.keras遇见的坑:Output tensors to a Model must be the output of a TensorFlow `Layer`
经过网上查找,找到了问题所在:在使用keras编程模式是,中间插入了tf.reshape()方法便遇到此问题. 解决办法:对于遇到相同问题的任何人,可以使用keras的Lambda层来包装张量流操作, ...
- [TensorFlow 2.0] Keras 简介
Keras 是一个用于构建和训练深度学习模型的高阶 API.它可用于快速设计原型.高级研究和生产. keras的3个优点: 方便用户使用.模块化和可组合.易于扩展 简单点说就是,简单.好用.快(构建) ...
- 三分钟快速上手TensorFlow 2.0 (上)——前置基础、模型建立与可视化
本文学习笔记参照来源:https://tf.wiki/zh/basic/basic.html 学习笔记类似提纲,具体细节参照上文链接 一些前置的基础 随机数 tf.random uniform(sha ...
- python 3.7 安装 sklearn keras(tf.keras)
# 1 sklearn 一般方法 网上有很多教程,不再赘述. 注意顺序是 numpy+mkl ,然后 scipy的环境,scipy,然后 sklearn # 2 anoconda ana ...
- 【tf.keras】TensorFlow 1.x 到 2.0 的 API 变化
TensorFlow 2.0 版本将 keras 作为高级 API,对于 keras boy/girl 来说,这就很友好了.tf.keras 从 1.x 版本迁移到 2.0 版本,需要修改几个地方. ...
- 一文上手Tensorflow2.0之tf.keras(三)
系列文章目录: Tensorflow2.0 介绍 Tensorflow 常见基本概念 从1.x 到2.0 的变化 Tensorflow2.0 的架构 Tensorflow2.0 的安装(CPU和GPU ...
- TensorFlow2.0(11):tf.keras建模三部曲
.caret, .dropup > .btn > .caret { border-top-color: #000 !important; } .label { border: 1px so ...
- 【tf.keras】tf.keras使用tensorflow中定义的optimizer
Update:2019/09/21 使用 tf.keras 时,请使用 tf.keras.optimizers 里面的优化器,不要使用 tf.train 里面的优化器,不然学习率衰减会出现问题. 使用 ...
- 【tf.keras】Resource exhausted: OOM when allocating tensor with shape [9216,4096] and type float on /job:localhost/replica:0/task:0/device:GPU:0 by allocator GPU_0_bfc
运行以下类似代码: while True: inputs, outputs = get_AlexNet() model = tf.keras.Model(inputs=inputs, outputs= ...
随机推荐
- 提取包含QQ的文本为QQ邮箱
# -*- coding: utf-8 -*- """ Created on Sun Dec 15 14:08:03 2019 @author: Dell 提取包含QQ号 ...
- ssky-keygen + ssh-copy-id 无密码登陆远程LINUX主机【OK】
ssky-keygen + ssh-copy-id 无密码登陆远程LINUX主机[OK] 使用下例中ssky-keygen和ssh-copy-id,仅需通过3个步骤的简单设置而无需输入密码就能 ...
- MongoDB学习笔记之文档
#向集合中插入文档有两种方式(insert.save) db.col.insert({title: 'MongoDB 教程', description: 'MongoDB 是一个 Nosql 数据库' ...
- TextEdit不能空验证设置
在工具箱中找到dxValidationProvider控件拖拉到界面上,添加代码 ConditionValidationRule notEmptyValidationRule = new Condit ...
- 如何理解Hibernate的延迟加载机制?
延迟加载就是并不是在读取的时候就把数据加载进来,而是等到使用时再加载.Hibernate使用了虚拟代理机制实现延迟加载.返回给用户的并不是实体本身,而是实体对象的代理.代理对象在用户调用getter方 ...
- 吴恩达+neural-networks-deep-learning+第二周作业
Logistic Regression with a Neural Network mindset v4 简单用logistic实现了猫的识别,logistic可以被看做一个简单的神经网络结构,下面是 ...
- 【C#-读取XML文件】XMLReader读取XML文档
使用 XmlReader.Create("文件路径") 加载xml文件 XmlReader使用流的方式来读取. //使用XMLReader读取XML数据 XmlReader ...
- html5 和h5的区别
html5 是公认的web开发的html规范,是一系列关于html的标准,它就好比是国家的法律,比如未成年不准进网吧,网吧要是允许未成年人进入,国家就要对网吧和未成年人进行处罚和教育.同样的,你写的h ...
- UVA 10900 So do you want to be a 2^n-aire?
#include<bits/stdc++.h> #include<stdio.h> #include<iostream> #include<cmath> ...
- BZOJ 1488 Luogu P4727 [HNOI2009]图的同构 (Burnside引理、组合计数)
题目链接 (Luogu) https://www.luogu.org/problem/P4727 (BZOJ) https://www.lydsy.com/JudgeOnline/problem.ph ...