构建一个简单的模型

序贯（Sequential）模型

网络层的构造

模型训练和参数评价

模型训练

配置参数保存Configuration only

完整模型保存

目前keras API 已经整合到 tensorflow最新版本1.9.0 中，在tensorflow中通过tf.keras就可以调用keras。

import tensorflow as tf

from tensorflow import keras

官方教程为：https://tensorflow.google.cn/guide/keras

tf.keras可以调用所有的keras编译代码，但是有两个限制：

版本问题，需要通过tf.keras.version确认版本。
模型保存问题，tf.keras默认使用 checkpoint format格式，而keras模型的保存格式HDF5需要借用函数save_format='h5'

构建一个简单的模型

序贯（Sequential）模型

序贯模型就是是多个网络层的线性堆叠，比如多层感知机，BP神经网络。

tf.keras构建一个简单的全连通网络(即多层感知器)代码如下:

#建立序贯模型

model = keras.Sequential()

#添加全连接层，节点数为64，激活函数为relu函数，dense表示标准的一维全连接层

model.add(keras.layers.Dense(64, activation='relu'))

#添加全连接层，节点数为64，激活函数为relu函数

model.add(keras.layers.Dense(64, activation='relu'))

#添加输出层，输出节点数为10

model.add(keras.layers.Dense(10, activation='softmax'))

其中激活函数详细信息见keras官方文档http://keras-cn.readthedocs.io/en/latest/other/activations/

网络层的构造

通常在tf.keras中，网络层的构造参数主要有以下几个：

激活函数activation function，默认是没有激活函数的。
参数初始化，默认通过正态分布初始化（Glorot uniform）
参数正则化，包括权值初始化和偏置的初始化。

#参数调整

#建立一个sigmoid层

layers.Dense(64, activation='sigmoid')

#或者

layers.Dense(64, activation=tf.sigmoid)

#权重L1正则化

layers.Dense(64, kernel_regularizer=keras.regularizers.l1(0.01))

#偏置L2正则化

layers.Dense(64, bias_regularizer=keras.regularizers.l2(0.01))

#权重正交矩阵的随机数初始化

layers.Dense(64, kernel_initializer='orthogonal')

#偏置常数初始化

layers.Dense(64, bias_initializer=keras.initializers.constant(2.0))

模型训练和参数评价

模型训练

模型建立后，通过compile模块确定模型的训练参数（tf.keras.Model.compile）

tf.keras.Model.compile有三个主要参数：

优化器optimizer：通过tf.train模块调用优化器，可用的优化器类型见：http://keras-cn.readthedocs.io/en/latest/other/optimizers/
损失函数loss：通过tf.keras.losses模块调用损失函数，可用的损失函数类型见：http://keras-cn.readthedocs.io/en/latest/other/objectives/
模型评估方法metrics：通过tf.keras.metrics调用评估参数，可用的模型评估方法见：http://keras-cn.readthedocs.io/en/latest/other/metrics/

具体例子如下：

# 配置均方误差回归模型

model.compile(optimizer=tf.train.AdamOptimizer(0.01),

              loss='mse',       # 均方差

              metrics=['mae'])  # 平均绝对误差

# 配置分类模型

model.compile(optimizer=tf.train.RMSPropOptimizer(0.01),

              loss=keras.losses.categorical_crossentropy, #多类的对数损失

              metrics=[keras.metrics.categorical_accuracy]) #多分类问题，所有预测值上的平均正确率

模型的训练

对于小数据集,使用numpy数组，通过tf.keras.Model.fit模块来训练和评估模型。

import numpy as np

#输入数据（1000，32）

data = np.random.random((1000, 32))

#输入标签（1000，10）

labels = np.random.random((1000, 10))

#模型训练

model.fit(data, labels, epochs=10, batch_size=32)

tf.keras.Model.fit模块有三个重要的参数：

训练轮数epochs：epochs指的就是训练过程中数据将被训练多少轮，一个epoch指的是当一个完整的数据集通过了神经网络一次并且返回了一次。
批训练大小batch_size：基本上现在的梯度下降都是基于mini-batch的，即将一个完整数据分为batch_size个批次进行训练。详见http://keras-cn.readthedocs.io/en/latest/for_beginners/concepts/#epochs。
验证集validation_data：通常一个模型训练，评估要有训练集，验证集和测试集。验证集就是模型调参时用来评估模型的数据集。

tf.data的数据集

对于大型数据集，常常通过tf.data模块来调用数据,详见https://tensorflow.google.cn/guide/datasets

# 数据实例化

dataset = tf.data.Dataset.from_tensor_slices((data, labels))

dataset = dataset.batch(32)

dataset = dataset.repeat()

#模型训练，steps_per_epoch表示每次训练的数据大小类似与batch_size

model.fit(dataset, epochs=10, steps_per_epoch=30)

模型评估和预测

通过 tf.keras.Model.evaluate 和tf.keras.Model.predict可以实现模型的评估和预测。

model.evaluate(x, y, batch_size=32)

model.evaluate(dataset, steps=30)

model.predict(x, batch_size=32)

model.predict(dataset, steps=30)

基本模型的建立

网络层模型

通过f.keras.Sequential 可以实现各种的复杂模型，如：

多输入模型；
多输出模型；
参数共享层模型；
残差网络模型。

具体例子如下：

#输入参数

inputs = keras.Input(shape=(32,))

#网络层的构建

x = keras.layers.Dense(64, activation='relu')(inputs)

x = keras.layers.Dense(64, activation='relu')(x)

#预测

predictions = keras.layers.Dense(10, activation='softmax')(x)

#模型实例化

model = keras.Model(inputs=inputs, outputs=predictions)

#模型构建

model.compile(optimizer=tf.train.RMSPropOptimizer(0.001),

              loss='categorical_crossentropy',

              metrics=['accuracy'])

#模型训练

model.fit(data, labels, batch_size=32, epochs=5)

模型子类函数构建

通常通过tf.keras.Model构建模型结构， __init__方法初始化模型，call方法进行参数传递。如下所示：

class MyModel(keras.Model):

  #模型结构确定

  def __init__(self, num_classes=10):

    super(MyModel, self).__init__(name='my_model')

    self.num_classes = num_classes

    #网络层的定义

    self.dense_1 = keras.layers.Dense(32, activation='relu')

    self.dense_2 = keras.layers.Dense(num_classes, activation='sigmoid')

  #参数调用

  def call(self, inputs):

    #前向传播过程确定

    x = self.dense_1(inputs)

    return self.dense_2(x)

  def compute_output_shape(self, input_shape):

    #输出参数确定

    shape = tf.TensorShape(input_shape).as_list()

    shape[-1] = self.num_classes

    return tf.TensorShape(shape)

#模型初始化

model = MyModel(num_classes=10)

#模型构建

model.compile(optimizer=tf.train.RMSPropOptimizer(0.001),

              loss='categorical_crossentropy',

              metrics=['accuracy'])

#模型训练

model.fit(data, labels, batch_size=32, epochs=5)

回调函数Callbacks

回调函数是一组在训练的特定阶段被调用的函数集，你可以使用回调函数来观察训练过程中网络内部的状态和统计信息。通过传递回调函数列表到模型fit()中，即可在给定的训练阶段调用该函数集中的函数。详见：http://keras-cn.readthedocs.io/en/latest/other/callbacks/。主要回调函数有：

tf.keras.callbacks.ModelCheckpoint：模型保存
tf.keras.callbacks.LearningRateScheduler：学习率调整
tf.keras.callbacks.EarlyStopping：中断训练
tf.keras.callbacks.TensorBoard：tensorboard的使用

模型保存和载入

tf.keras有两种模型保存方式

网络参数保存Weights only

#模型保存为tensorflow默认格式

model.save_weights('./my_model')

#载入模型

model.load_weights('my_model')

#模型保存为keras默认格式,包含其他优化参数

model.save_weights('my_model.h5', save_format='h5')

#载入模型

model.load_weights('my_model.h5')

配置参数保存Configuration only

保存一个没有模型参数只有配置参数的模型， Keras支持 JSON和YAML序列化格式:

# 模型保存

json_string = model.to_json()

yaml_string = model.to_yaml()

#模型载入

fresh_model = keras.models.from_json(json_string)

fresh_model = keras.models.from_yaml(yaml_string)

完整模型保存

将原来模型所用信息进行保存：

#模型建立

model = keras.Sequential([

  keras.layers.Dense(10, activation='softmax', input_shape=(32,)),

  keras.layers.Dense(10, activation='softmax')

])

model.compile(optimizer='rmsprop',

              loss='categorical_crossentropy',

              metrics=['accuracy'])

model.fit(data, targets, batch_size=32, epochs=5)

#保存为keras格式文件

model.save('my_model.h5')

# 模型载入

model = keras.models.load_model('my_model.h5')

[深度学习] tf.keras入门1-基本函数介绍的更多相关文章

[深度学习] tf.keras入门2-分类
目录 Fashion MNIST数据库分类模型的建立模型预测总体代码主要介绍基于tf.keras的Fashion MNIST数据库分类, 官方文档地址为:https://tensorflow. ...
[深度学习] tf.keras入门4-过拟合和欠拟合
过拟合和欠拟合简单来说过拟合就是模型训练集精度高,测试集训练精度低:欠拟合则是模型训练集和测试集训练精度都低. 官方文档地址为 https://tensorflow.google.cn/tutori ...
[深度学习] tf.keras入门5-模型保存和载入
目录设置基于checkpoints的模型保存通过ModelCheckpoint模块来自动保存数据手动保存权重整个模型保存总体代码模型可以在训练中或者训练完成后保存.具体文档参考:http ...
[深度学习] tf.keras入门3-回归
目录波士顿房价数据集数据集数据归一化模型训练和预测模型建立和训练模型预测总结回归主要基于波士顿房价数据库进行建模,官方文档地址为:https://tensorflow.google.c ...
深度学习：Keras入门(一)之基础篇
1.关于Keras 1)简介 Keras是由纯python编写的基于theano/tensorflow的深度学习框架. Keras是一个高层神经网络API,支持快速实验,能够把你的idea迅速转换为结 ...
深度学习：Keras入门(一)之基础篇【转】
本文转载自:http://www.cnblogs.com/lc1217/p/7132364.html 1.关于Keras 1)简介 Keras是由纯python编写的基于theano/tensorfl ...
深度学习：Keras入门(一)之基础篇（转）
转自http://www.cnblogs.com/lc1217/p/7132364.html 1.关于Keras 1)简介 Keras是由纯python编写的基于theano/tensorflow的深 ...
深度学习：Keras入门(二)之卷积神经网络(CNN)
说明:这篇文章需要有一些相关的基础知识,否则看起来可能比较吃力. 1.卷积与神经元 1.1 什么是卷积? 简单来说,卷积(或内积)就是一种先把对应位置相乘然后再把结果相加的运算.(具体含义或者数学公式 ...
深度学习：Keras入门(二)之卷积神经网络(CNN)【转】
本文转载自:https://www.cnblogs.com/lc1217/p/7324935.html 说明:这篇文章需要有一些相关的基础知识,否则看起来可能比较吃力. 1.卷积与神经元 1.1 什么 ...

随机推荐

驱动开发：内核枚举IoTimer定时器
今天继续分享内核枚举系列知识,这次我们来学习如何通过代码的方式枚举内核IoTimer定时器,内核定时器其实就是在内核中实现的时钟,该定时器的枚举非常简单,因为在IoInitializeTimer初始化 ...
非swoole的方式实现简单的异步(nginx模式下)
set_time_limit(0);echo '任务开始'.time();/*即时打印*/register_shutdown_function([$this, "test"]);/ ...
JUC（5）BlockingQueue四组API
1.读写锁ReadWriteLock package com.readlock; import java.util.HashMap; import java.util.Map; /** * ReadW ...
如何实现一个SQL解析器
作者:vivo 互联网搜索团队- Deng Jie 一.背景随着技术的不断的发展,在大数据领域出现了越来越多的技术框架.而为了降低大数据的学习成本和难度,越来越多的大数据技术和应用开始支持SQL进 ...
探究Presto SQL引擎(4)-统计计数
作者:vivo互联网用户运营开发团队 - Shuai Guangying 本篇文章介绍了统计计数的基本原理以及Presto的实现思路,精确统计和近似统计的细节及各种优缺点,并给出了统计计数在具体业务 ...
vulnhub靶场之NOOB: 1
准备: 攻击机:虚拟机kali.本机win10. 靶机:NOOB: 1,网段地址我这里设置的桥接,所以与本机电脑在同一网段,下载地址:https://download.vulnhub.com/noob ...
KMP算法，匹配字符串模板（返回下标）
//KMP算法,匹配字符串模板 void getNext(int[] next, String t) { int n = next.length; for (int i = 1, j = 0; i & ...
数组还是HashSet？
我记得大约在半年前,有个朋友问我一个问题,现在有一个选型: 一个性能敏感场景,有一个集合,需要确定某一个元素在不在这个集合中,我是用数组直接Contains还是使用HashSet<T>.C ...
Complementary XOR
题目链接题目大意: 给你两个字符串只有01组成,你可以选取区间[l, r],对字符串a在区间里面进行异或操作,对字符串b非区间值进行异或操作,问能否将两个字符串变为全0串.如果可以输出YES, 操作 ...
【iOS逆向】某营业厅算法分析
阅读此文档的过程中遇到任何问题,请关注公众号[移动端Android和iOS开发技术分享]或加QQ群[812546729] 1.目标使用frida stalker分析某营业厅的签名算法. 2.操作环境 ...

[深度学习] tf.keras入门1-基本函数介绍

构建一个简单的模型

序贯（Sequential）模型

网络层的构造

模型训练和参数评价

模型训练

模型的训练

tf.data的数据集

模型评估和预测

基本模型的建立

网络层模型

模型子类函数构建

回调函数Callbacks

模型保存和载入

网络参数保存Weights only

配置参数保存Configuration only

完整模型保存

[深度学习] tf.keras入门1-基本函数介绍的更多相关文章

随机推荐

热门专题