keras是基于tensorflow封装的的高级API，Keras的优点是可以快速的开发实验，它能够以TensorFlow, CNTK, 或者 Theano 作为后端运行。

模型构建

最简单的模型是 Sequential 顺序模型，它由多个网络层线性堆叠。对于更复杂的结构，你应该使用 Keras 函数式 API，它允许构建任意的神经网络图。

用Keras定义网络模型有两种方式，

1、Sequential 顺序模型

from keras.models import Sequential

model = Sequential()

我们可以通过将网络层实例的列表传递给 Sequential 的构造器，来创建一个 Sequential模型，：

from keras.models import Sequential

from keras.layers import Dense, Activation

model = Sequential([

    Dense(32, input_shape=(784,)),

    Activation('relu'),

    Dense(10),

    Activation('softmax'),

])

也可以通过 .add()的方法将各层添加到网络中

from keras.layers import Dense

from keras.model import Sequential

model = Sequential()

model.add(Dense(units=64, activation='relu', input_dim=100))

model.add(Dense(units=10, activation='softmax'))

模型需要知道它所期望的出入尺寸，所以模型中的第一层需要接收关于出入尺寸的信息

传递一个 input_shape 参数给第一层。它是一个表示尺寸的元组 (一个整数或 None 的元组，其中 None 表示可能为任何正整数)。在 input_shape 中不包含数据的 batch 大小。
某些 2D 层，例如 Dense，支持通过参数 input_dim 指定输入尺寸，某些 3D 时序层支持 input_dim 和 input_length 参数。
如果你需要为你的输入指定一个固定的 batch 大小（这对 stateful RNNs 很有用），你可以传递一个 batch_size 参数给一个层。如果你同时将 batch_size=32 和 input_shape=(6, 8) 传递给一个层，那么每一批输入的尺寸就为 (32，6，8)。

model.add(Dense(32, input_shape=(784,)))

# 这两段代码是等价的

model.add(Dense(32, input_dim=784))

Dense的参数

activation: 激活函数

kernel_initializer和bias_initializer: 权重和偏置项的初始化方案

kernel_regularizer和bias_regularizer: 权重和偏置项的正则方案，L1或L2

layers.Dense(64, activation='sigmoid')

# 或者

layers.Dense(64, activation=tf.sigmoid)

# 一个线性层，系数0.01的l1正则化权重

layers.Dense(64, kernel_regularizer=tf.keras.regularizers.l1(0.01))

# 将因子0.01的L2正则化的线性层应用于偏置项

layers.Dense(64, bias_regularizer=tf.keras.regularizers.l2(0.01))

# 初始化为随机正交矩阵的线性层

layers.Dense(64, kernel_initializer='orthogonal')

# 一个线性层，偏置项初始化为2.0s

layers.Dense(64, bias_initializer=tf.keras.initializers.constant(2.0))

Model类模型的方法

Model主要有以下方法 compile、fit、evaluate、predict...

在函数式API中，给定一些输入张量和输出张量，可以实例化一个Model:

from keras.models import Model

from keras.layers import Input, Dense

a = Input(shape=(32,))

b = Dense(32)(a)

model = Model(inputs=a, outputs=b)

这个model模型包含从a到b计算的所有网络层

在多输入或多输出模型的情况下，我们可以使用以下列表

model = Model(inputs=[a1, a2], outputs=[b1, b3, b3])

model.summary() 　　　　# 在模型编译之后，打印网络结构

print(model.output_shape)　　 # 打印模型输出

模型编译

我们需要配置模型的学习过程，这是通过 compile() 方法

参数

优化器 optimizer。它可以是现有优化器的字符串标识符。详见：optimizers。
损失函数 loss，模型试图最小化的目标函数。它可以是现有损失函数的字符串标识符，也可以是一个目标函数。常见的选择包括均方误差(mse)、categorical_crossentropy 和 binary_crossentropy，详见：losses。
评估标准 metrics。对于任何分类问题，你都希望将其设置为 metrics = ['accuracy']。评估标准可以是现有的标准的字符串标识符，也可以是自定义的评估标准函数。

# 多分类问题

model.compile(optimizer='rmsprop',

              loss='categorical_crossentropy',

              metrics=['accuracy'])

# 二分类问题

model.compile(optimizer='rmsprop',

              loss='binary_crossentropy',

              metrics=['accuracy'])

# 均方误差回归问题

model.compile(optimizer='rmsprop',

              loss='mse')

# 自定义评估标准函数

import keras.backend as K

def mean_pred(y_true, y_pred):

    return K.mean(y_pred)

model.compile(optimizer='rmsprop',

              loss='binary_crossentropy',

              metrics=['accuracy', mean_pred])

自定义评估标准方法，传了两个方法进去，那到底该用哪个呢？

模型训练

训练网络模型时，我们通常会使用 fit() 函数，keras.Model.fit()包含三个重要的参数，文档详见此处。

epochs：训练的轮次，每一轮对整个输入数据进行一次迭代
batch_size：将模型数据分成n个较小的批次，注意：如果样本总数不能被批次大小整除，则最后一个批次可能更小
validation_data：验证数据的准确率输入和标签的元组

训练模型：现在我们可以批量地在训练数据上迭代了：

model.fit(x_train, y_train, epochs=5, batch_size=32)

或者我们可以手动的将批次的数据提供给模型：

model.train_on_batch(x_batch, y_batch)

对于具有 2 个类的单输入模型（二进制分类）：

model = Sequential()

model.add(Dense(32, activation='relu', input_dim=100))

model.add(Dense(1, activation='sigmoid'))

model.compile(optimizer='rmsprop',

              loss='binary_crossentropy',

              metrics=['accuracy'])

# 生成虚拟数据

import numpy as np

data = np.random.random((1000, 100))    # 0~1之间的随机数

# 生成2个类别的（1000，1）的数组

labels = np.random.randint(2, size=(1000, 1))

# 训练模型，以 32 个样本为一个 batch 进行迭代

model.fit(data, labels, epochs=10, batch_size=32)

对于具有 10 个类的单输入模型（多分类分类）：

model = Sequential()

model.add(Dense(32, activation='relu', input_dim=100))

model.add(Dense(10, activation='softmax'))

model.compile(optimizer='rmsprop',

              loss='categorical_crossentropy',

              metrics=['accuracy'])

# 生成虚拟数据

import numpy as np

data = np.random.random((1000, 100))

labels = np.random.randint(10, size=(1000, 1))

# 将标签转换为分类的 one-hot 编码

one_hot_labels = keras.utils.to_categorical(labels, num_classes=10)

# 训练模型，以 32 个样本为一个 batch 进行迭代

model.fit(data, one_hot_labels, epochs=10, batch_size=32)

模型评估

evaluate

model.evaluate(x=None, y=None, batch_size=None, verbose=1, sample_weight=None, steps=None)

loss_and_metrics = model.evaluate(x_test, y_test, batch_size=128)

在测试模式下返回模型的误差值和评估标准值，计算是分批次进行的

参数：

X：测试数据的Numpy数组

y: 目标（标签）数据的Numpy数组或列表

batch_size: 整数或None，每次评估的样本数，如果未指定，默认为32

vebose: 0或1，日志显示模型，0=安静模型，1=进度条

steps: 声明评估结束之前的总步数（批次样本）。默认值 None

测试数据的误差值

predict

predict(x, batch_size=None, verbose=0, steps=None)

classes = model.predict(x_test, batch_size=128)

# [11.43181880315145, 0.18333333333333332]

为输入样本生成输出预测，计算是分批进行的

参数：

X: 输入数据的Numpy数组

batch_size: 整数，如果未指定，默认为32

verbose: 日志显示模式，0或1

steps: 声明预测结束之前的总步数，默认为 None

预测的Numpy数组

train_on_batch

train_on_batch(x, y, sample_weight=None, class_weight=None)

train_on_batch(x_train, y_train)

进行一批样本的单次梯度更新，在一批样本上训练数据

参数：

X: 训练数据的Numpy数组

Y: 目标（标签）的Numpy数组

sample_weight: 可选数组，与x长度相同，包含应用到模型损失函数的每个样本的权重

chass_weight: 可选字典，以在训练时对模型的损失函数加权

训练数据的误差值

test_on_batch

test_on_batch(x_test, y_teat, sample_weight=None)

在一批样本上测试模型

参数：

X: 测试数据的Numpy数组

y: 目标（标签）数据的numpy数组

测试数据的误差值

predict_on_batch

predict_on_batch(x)

返回一批样本的模型预测值

参数：

X: 输入数据的Numpy

预测值的Numpy数组

样例

在 examples 目录中，你可以找到真实数据集的示例模型：

CIFAR10 小图片分类：具有实时数据增强的卷积神经网络 (CNN)
IMDB 电影评论情感分类：基于词序列的 LSTM
Reuters 新闻主题分类：多层感知器 (MLP)
MNIST 手写数字分类：MLP & CNN
基于 LSTM 的字符级文本生成

...以及更多。

基于多层感知器 (MLP) 的 softmax 多分类：

import keras

from keras.models import Sequential

from keras.layers import Dense, Dropout, Activation

from keras.optimizers import SGD

# 生成虚拟数据

import numpy as np

x_train = np.random.random((1000, 20))

y_train = keras.utils.to_categorical(np.random.randint(10, size=(1000, 1)), num_classes=10)

x_test = np.random.random((100, 20))

y_test = keras.utils.to_categorical(np.random.randint(10, size=(100, 1)), num_classes=10)

model = Sequential()

# Dense(64) 是一个具有 64 个隐藏神经元的全连接层。

# 在第一层必须指定所期望的输入数据尺寸：

# 在这里，是一个 20 维的向量。

model.add(Dense(64, activation='relu', input_dim=20))

model.add(Dropout(0.5))

model.add(Dense(64, activation='relu'))

model.add(Dropout(0.5))

model.add(Dense(10, activation='softmax'))

sgd = SGD(lr=0.01, decay=1e-6, momentum=0.9, nesterov=True)

model.compile(loss='categorical_crossentropy',

              optimizer=sgd,

              metrics=['accuracy'])

model.fit(x_train, y_train,

          epochs=20,

          batch_size=128)

score = model.evaluate(x_test, y_test, batch_size=128)

基于多层感知机的二分类：

import numpy as np

from keras.models import Sequential

from keras.layers import Dense, Dropout

# 生成虚拟数据

x_train = np.random.random((1000, 20))

y_train = np.random.randint(2, size=(1000, 1))

x_test = np.random.random((100, 20))

y_test = np.random.randint(2, size=(100, 1))

model = Sequential()

model.add(Dense(64, input_dim=20, activation='relu'))

model.add(Dropout(0.5))

model.add(Dense(64, activation='relu'))

model.add(Dropout(0.5))

model.add(Dense(1, activation='sigmoid'))

model.compile(loss='binary_crossentropy',

              optimizer='rmsprop',

              metrics=['accuracy'])

model.fit(x_train, y_train,

          epochs=20,

          batch_size=128)

score = model.evaluate(x_test, y_test, batch_size=128)

类似VGG的卷积神经网络：

import numpy as np

import keras

from keras.models import Sequential

from keras.layers import Dense, Dropout, Flatten

from keras.layers import Conv2D, MaxPooling2D

from keras.optimizers import SGD

# 生成虚拟数据

x_train = np.random.random((100, 100, 100, 3))

y_train = keras.utils.to_categorical(np.random.randint(10, size=(100, 1)), num_classes=10)

x_test = np.random.random((20, 100, 100, 3))

y_test = keras.utils.to_categorical(np.random.randint(10, size=(20, 1)), num_classes=10)

model = Sequential()

# 输入: 3 通道 100x100 像素图像 -> (100, 100, 3) 张量。

# 使用 32 个大小为 3x3 的卷积滤波器。

model.add(Conv2D(32, (3, 3), activation='relu', input_shape=(100, 100, 3)))

model.add(Conv2D(32, (3, 3), activation='relu'))

model.add(MaxPooling2D(pool_size=(2, 2)))

model.add(Dropout(0.25))

model.add(Conv2D(64, (3, 3), activation='relu'))

model.add(Conv2D(64, (3, 3), activation='relu'))

model.add(MaxPooling2D(pool_size=(2, 2)))

model.add(Dropout(0.25))

model.add(Flatten())

model.add(Dense(256, activation='relu'))

model.add(Dropout(0.5))

model.add(Dense(10, activation='softmax'))

sgd = SGD(lr=0.01, decay=1e-6, momentum=0.9, nesterov=True)

model.compile(loss='categorical_crossentropy', optimizer=sgd)

model.fit(x_train, y_train, batch_size=32, epochs=10)

score = model.evaluate(x_test, y_test, batch_size=32)

基于 1D 卷积的序列分类：

from keras.models import Sequential

from keras.layers import Dense, Dropout

from keras.layers import Embedding

from keras.layers import Conv1D, GlobalAveragePooling1D, MaxPooling1D

seq_length = 64

model = Sequential()

model.add(Conv1D(64, 3, activation='relu', input_shape=(seq_length, 100)))

model.add(Conv1D(64, 3, activation='relu'))

model.add(MaxPooling1D(3))

model.add(Conv1D(128, 3, activation='relu'))

model.add(Conv1D(128, 3, activation='relu'))

model.add(GlobalAveragePooling1D())

model.add(Dropout(0.5))

model.add(Dense(1, activation='sigmoid'))

model.compile(loss='binary_crossentropy',

              optimizer='rmsprop',

              metrics=['accuracy'])

model.fit(x_train, y_train, batch_size=16, epochs=10)

score = model.evaluate(x_test, y_test, batch_size=16)

Keras Sequential顺序模型的更多相关文章

mnist手写数字识别——深度学习入门项目（tensorflow+keras+Sequential模型）
前言今天记录一下深度学习的另外一个入门项目——<mnist数据集手写数字识别>,这是一个入门必备的学习案例,主要使用了tensorflow下的keras网络结构的Sequential模型 ...
Keras实现RNN模型
博客作者:凌逆战博客地址:https://www.cnblogs.com/LXP-Never/p/10940123.html 这篇文章主要介绍使用Keras框架来实现RNN家族模型,TensorFl ...
keras训练cnn模型时loss为nan
keras训练cnn模型时loss为nan 1.首先记下来如何解决这个问题的:由于我代码中 model.compile(loss='categorical_crossentropy', optimiz ...
keras中的模型保存和加载
tensorflow中的模型常常是protobuf格式,这种格式既可以是二进制也可以是文本.keras模型保存和加载与tensorflow不同,keras中的模型保存和加载往往是保存成hdf5格式. ...
使用keras导入densenet模型
从keras的keras_applications的文件夹内可以找到内置模型的源代码 Kera的应用模块Application提供了带有预训练权重的Keras模型,这些模型可以用来进行预测.特征提取和 ...
Keras实践：模型可视化
Keras实践:模型可视化安装Graphviz 官方网址为:http://www.graphviz.org/.我使用的是mac系统,所以我分享一下我使用时遇到的坑. Mac安装时在终端中执行: br ...
使用C++部署Keras或TensorFlow模型
本文介绍如何在C++环境中部署Keras或TensorFlow模型. 一.对于Keras, 第一步,使用Keras搭建.训练.保存模型. model.save('./your_keras_model. ...
顺序模型api
Compile:配置模型,然后进行训练 compile(optimizer, loss=None, metrics=None, loss_weights=None, sample_weight_mod ...
入门项目数字手写体识别：使用Keras完成CNN模型搭建（重要）
摘要: 本文是通过Keras实现深度学习入门项目——数字手写体识别,整个流程介绍比较详细,适合初学者上手实践. 对于图像分类任务而言,卷积神经网络(CNN)是目前最优的网络结构,没有之一.在面部识别. ...

随机推荐

python 简单的猜数字游戏
!/usr/bin/env python --encoding:utf-8-- import random think=random.randint(1,10) print ("...... ...
使用javascript模拟常见数据结构(四)
七.树树是一种非线性的分层的数据结构,在现实生活中比较常见的例子比如家谱和公司的组织架构图,如下所示: 一个树结构存在着一系列的父子结构,并且有着一个根节点,这种结构本质上表明了一对多的关系. 那, ...
Docker常用命令汇总，和常用操作举例
Docker命令 docker 常用命令如下管理命令: container 管理容器 image 管理镜像 network 管理网络 node 管理Swarm节点 plugin 管理插件 secre ...
python 哈希查找
import random INDEXBOX= #哈希表元素个数 MAXNUM= #数据个数 class Node: #声明链表结构 def __init__(self,val): self.val= ...
Mac for MySQL 5.7 安装教程
一.环境 MAC OS X 10.10 二.下载MySQL 地址:http://dev.mysql.com/get/Downloads/MySQL-5.7/mysql-5.7.10-osx10.10- ...
vijos 1082
描述东非大裂谷中有一片神秘的丛林,是全世界探险家的乐园,著名黄皮肤探险家BB一直想去试试.正好我国科学家2005年4月将首次对东非大裂谷进行科考,BB决定随科考队去神秘丛林探险.在出发之前,他搜集了 ...
Leetcode 34
//二分查找后,向两边扩展,二分错了两次,现在是对的.//还有就是vector可以用{}直接赋值很棒 class Solution { public: vector<int> search ...
Leetcode 16
//一次AC 有点爽的class Solution { public: int threeSumClosest(vector<int>& nums, int target) { ; ...
12.2 Web窗体--代码片段详解
第12章使用Web窗体 ※ 除常规HTML元素之外,Web窗体文件还包含另外3种内容:代码片段.可编程HTML元素和控件 ※ 代码隐藏类只应包含特定于单个Web窗体的代码.如果存在多个Web窗体 ...
MarkdownPad2 下一些设置
MarkdownPad2注册码: 邮箱: Soar360@live.com 授权秘钥: GBPduHjWfJU1mZqcPM3BikjYKF6xKhlKIys3i1MU2eJHqWGImDHzWdD6 ...

Keras Sequential顺序模型