tensorFlow（五）深层神经网络

TensorFlow基础见前博客

上实例：

MNIST 数据集介绍

MNIST 是一个手写阿拉伯数字的数据集。

其中包含有 60000 个已经标注了的训练集，还有 10000 个用于测试的测试集。

本次实验的任务就是通过手写数字的图片，识别出具体写的是 0-9 之中的哪个数字。

理论知识回顾

一个两层的深层神经网络结构如下：

上图所示的是一个具有两层隐藏层的深层神经网络
第一个隐藏层有 4 个节点，对应的激活函数为 ReLu 函数
第一个隐藏层有 2 个节点，对应的激活函数也是 Relu 函数
最后，输出层使用 softmax 函数作为激活函数

激活函数定义（activation function）：

模型设计

与上一个教程类似:

MNIST 数据一共有 784 个输入，所以我们需要一个有 784 个节点的输入层。
MNIST 数据使用 One-Hot 格式输出，有 0-9 10 个 label，分别对应是否为数字 0-9，所以我们在输出层有 10 个节点，由于 0-9 的概率是互斥的，我们使用 Softmax 函数作为该层的激活函数。

不一样的是我们可以通过调整深度神经网络的层次来看看能不能达到不一样的效果。

训练模型

数据准备

首先我们需要先下载 MNIST 的数据集。使用以下的命令进行下载：

wget https://devlab-1251520893.cos.ap-guangzhou.myqcloud.com/t10k-images-idx3-ubyte.gz
wget https://devlab-1251520893.cos.ap-guangzhou.myqcloud.com/t10k-labels-idx1-ubyte.gz
wget https://devlab-1251520893.cos.ap-guangzhou.myqcloud.com/train-images-idx3-ubyte.gz
wget https://devlab-1251520893.cos.ap-guangzhou.myqcloud.com/train-labels-idx1-ubyte.gz

实例代码：

#-*- encoding:utf-8 -*-

#!/usr/local/env python

import numpy as np

import tensorflow as tf

from tensorflow.examples.tutorials.mnist import input_data

def add_layer(inputs, in_size, out_size, activation_function=None):

    W = tf.Variable(tf.random_normal([in_size, out_size]))

    b = tf.Variable(tf.zeros([1, out_size]) + 0.01)

    Z = tf.matmul(inputs, W) + b

    if activation_function is None:

        outputs = Z

    else:

        outputs = activation_function(Z)

    return outputs

if __name__ == "__main__":

    MNIST = input_data.read_data_sets("mnist", one_hot=True)

    learning_rate = 0.01

    batch_size = 128

    n_epochs = 70

    X = tf.placeholder(tf.float32, [batch_size, 784])

    Y = tf.placeholder(tf.float32, [batch_size, 10])

    layer_dims = [784, 500, 500, 10]

    layer_count = len(layer_dims)-1 # 不算输入层

    layer_iter = X

    for l in range(1, layer_count): # layer [1,layer_count-1] is hidden layer

        layer_iter = add_layer(layer_iter, layer_dims[l-1], layer_dims[l], activation_function=tf.nn.relu)

    prediction = add_layer(layer_iter, layer_dims[layer_count-1], layer_dims[layer_count], activation_function=None)

    entropy = tf.nn.softmax_cross_entropy_with_logits(labels=Y, logits=prediction)

    loss = tf.reduce_mean(entropy)

    optimizer = tf.train.GradientDescentOptimizer(learning_rate).minimize(loss)

    init = tf.initialize_all_variables()

    with tf.Session() as sess:

        sess.run(init)

        n_batches = int(MNIST.test.num_examples/batch_size)

        for i in range(n_epochs):

            for j in range(n_batches):

                X_batch, Y_batch = MNIST.train.next_batch(batch_size)

                _, loss_ = sess.run([optimizer, loss], feed_dict={X: X_batch, Y: Y_batch})

                if i % 10 == 5 and j == 0:

                    print "Loss of epochs[{0}]: {1}".format(i, loss_)

        # test the model

        n_batches = int(MNIST.test.num_examples/batch_size)

        total_correct_preds = 0

        for i in range(n_batches):

            X_batch, Y_batch = MNIST.test.next_batch(batch_size)

            preds = sess.run(prediction, feed_dict={X: X_batch, Y: Y_batch})

            correct_preds = tf.equal(tf.argmax(preds, 1), tf.argmax(Y_batch, 1))

            accuracy = tf.reduce_sum(tf.cast(correct_preds, tf.float32)) 

            total_correct_preds += sess.run(accuracy)

        print "Accuracy {0}".format(total_correct_preds/MNIST.test.num_examples)

代码讲解

add_layer 函数

允许用户指定上一层的输出节点的个数作为 input_size，本层的节点个数作为 output_size，并指定激活函数 activation_function可以看到我们调用的时候位神经网络添加了两个隐藏层和输出层

for l in range(1, layer_count): # layer [1,layer_count-1] is hidden layer

    layer_iter = add_layer(layer_iter, layer_dims[l-1], layer_dims[l], activation_function=tf.nn.relu)

prediction = add_layer(layer_iter, layer_dims[layer_count-1], layer_dims[layer_count], activation_function=None)

entropy = tf.nn.softmax_cross_entropy_with_logits(labels=Y, logits=prediction)

loss = tf.reduce_mean(entropy)

神经网络配置

注意这一行，我们配置了一个深度的神经网络，它包含两个隐藏层，一个输入层和一个输出层隐藏层的节点数为 500

layer_dims = [784, 500, 500, 10]

执行结果：

Loss of epochs[5]: 19.5915279388

Loss of epochs[15]: 7.20698690414

...

Loss of epochs[65]: 0.24952724576

Accuracy 0.939

可以看到经过 70 轮的训练，准确度大约在 94% 左右

探索（play around）

你可以通过修改下面的这个代码片段来修改整个神经网络。

    layer_dims = [784, 500, 500, 10]

比如你可以去掉一层隐藏层，并将隐藏层的节点数改为 600

    layer_dims = [784, 600, 10]

训练完的结果大概是这样：

Loss of epochs[5]: 13.1280488968

Loss of epochs[15]: 9.14239501953

Loss of epochs[25]: 3.60039186478

...

Loss of epochs[65]: 3.32054066658

Accuracy 0.9161

准确度大概 92% 的样子。have fun!