吴裕雄 python 神经网络——TensorFlow训练神经网络：不使用指数衰减的学习率

import tensorflow as tf

from tensorflow.examples.tutorials.mnist import input_data

INPUT_NODE = 784     # 输入节点

OUTPUT_NODE = 10     # 输出节点

LAYER1_NODE = 500    # 隐藏层数       

BATCH_SIZE = 100     # 每次batch打包的样本个数        

# 模型相关的参数

LEARNING_RATE = 0.1

REGULARAZTION_RATE = 0.0001

TRAINING_STEPS = 5000

MOVING_AVERAGE_DECAY = 0.99  

def inference(input_tensor, avg_class, weights1, biases1, weights2, biases2):

    # 不使用滑动平均类

    if avg_class == None:

        layer1 = tf.nn.relu(tf.matmul(input_tensor, weights1) + biases1)

        return tf.matmul(layer1, weights2) + biases2

    else:

        # 使用滑动平均类

        layer1 = tf.nn.relu(tf.matmul(input_tensor, avg_class.average(weights1)) + avg_class.average(biases1))

        return tf.matmul(layer1, avg_class.average(weights2)) + avg_class.average(biases2)  

def train(mnist):

    x = tf.placeholder(tf.float32, [None, INPUT_NODE], name='x-input')

    y_ = tf.placeholder(tf.float32, [None, OUTPUT_NODE], name='y-input')

    # 生成隐藏层的参数。

    weights1 = tf.Variable(tf.truncated_normal([INPUT_NODE, LAYER1_NODE], stddev=0.1))

    biases1 = tf.Variable(tf.constant(0.1, shape=[LAYER1_NODE]))

    # 生成输出层的参数。

    weights2 = tf.Variable(tf.truncated_normal([LAYER1_NODE, OUTPUT_NODE], stddev=0.1))

    biases2 = tf.Variable(tf.constant(0.1, shape=[OUTPUT_NODE]))

    # 计算不含滑动平均类的前向传播结果

    y = inference(x, None, weights1, biases1, weights2, biases2)

    # 定义训练轮数及相关的滑动平均类

    global_step = tf.Variable(0, trainable=False)

    variable_averages = tf.train.ExponentialMovingAverage(MOVING_AVERAGE_DECAY, global_step)

    variables_averages_op = variable_averages.apply(tf.trainable_variables())

    average_y = inference(x, variable_averages, weights1, biases1, weights2, biases2)

    # 计算交叉熵及其平均值

    cross_entropy = tf.nn.sparse_softmax_cross_entropy_with_logits(logits=y, labels=tf.argmax(y_, 1))

    cross_entropy_mean = tf.reduce_mean(cross_entropy)

    # 损失函数的计算

    regularizer = tf.contrib.layers.l2_regularizer(REGULARAZTION_RATE)

    regularaztion = regularizer(weights1) + regularizer(weights2)

    loss = cross_entropy_mean + regularaztion

    # 优化损失函数

    train_step = tf.train.GradientDescentOptimizer(LEARNING_RATE).minimize(loss, global_step=global_step)

    # 反向传播更新参数和更新每一个参数的滑动平均值

    with tf.control_dependencies([train_step, variables_averages_op]):

        train_op = tf.no_op(name='train')

    # 计算正确率

    correct_prediction = tf.equal(tf.argmax(average_y, 1), tf.argmax(y_, 1))

    accuracy = tf.reduce_mean(tf.cast(correct_prediction, tf.float32))

    # 初始化会话，并开始训练过程。

    with tf.Session() as sess:

        tf.global_variables_initializer().run()

        validate_feed = {x: mnist.validation.images, y_: mnist.validation.labels}

        test_feed = {x: mnist.test.images, y_: mnist.test.labels} 

        # 循环的训练神经网络。

        for i in range(TRAINING_STEPS):

            if i % 1000 == 0:

                validate_acc = sess.run(accuracy, feed_dict=validate_feed)

                print("After %d training step(s), validation accuracy using average model is %g " % (i, validate_acc))

            xs,ys=mnist.train.next_batch(BATCH_SIZE)

            sess.run(train_op,feed_dict={x:xs,y_:ys})

        test_acc=sess.run(accuracy,feed_dict=test_feed)

        print(("After %d training step(s), test accuracy using average model is %g" %(TRAINING_STEPS, test_acc)))

def main(argv=None):

    mnist = input_data.read_data_sets("E:\\MNIST_data\\", one_hot=True)

    train(mnist)

if __name__=='__main__':

    main()

吴裕雄 python 神经网络——TensorFlow训练神经网络：不使用指数衰减的学习率的更多相关文章

吴裕雄 python 神经网络——TensorFlow训练神经网络：不使用滑动平均
import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data INPUT_NODE = 784 ...
吴裕雄 python 神经网络——TensorFlow训练神经网络：不使用隐藏层
import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data INPUT_NODE = 784 ...
吴裕雄 python 神经网络——TensorFlow训练神经网络：不使用激活函数
import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data INPUT_NODE = 784 ...
吴裕雄 python 神经网络——TensorFlow训练神经网络：不使用正则化
import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data INPUT_NODE = 784 ...
吴裕雄 python 神经网络——TensorFlow训练神经网络：全模型
import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data INPUT_NODE = 784 ...
吴裕雄 python 神经网络——TensorFlow训练神经网络：花瓣识别
import os import glob import os.path import numpy as np import tensorflow as tf from tensorflow.pyth ...
吴裕雄 python 神经网络——TensorFlow训练神经网络：MNIST最佳实践
import os import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data INPUT_N ...
吴裕雄 python 神经网络——TensorFlow训练神经网络：卷积层、池化层样例
import numpy as np import tensorflow as tf M = np.array([ [[1],[-1],[0]], [[-1],[2],[1]], [[0],[2],[ ...
吴裕雄--天生自然 Tensorflow卷积神经网络：花朵图片识别
import os import numpy as np import matplotlib.pyplot as plt from PIL import Image, ImageChops from ...

随机推荐

 «»<>
空格 «双小于 »双大于 <小于 >大于
题解【POJ3252】Round Numbers
Description The cows, as you know, have no fingers or thumbs and thus are unable to play Scissors, P ...
Coloring Colorfully
问题 C: Coloring Colorfully 时间限制: 1 Sec 内存限制: 128 MB[提交] [状态] 题目描述 N块瓦片从左到右排成一行.每个块的初始颜色由长度为N的字符串S表示. ...
Js选择器总结
一.原生JS选择器 JS选择器常用的有getElementById().getElementsByName().getElementsByTagName().getElementsByClassNam ...
HTML学习（11）表格
HTML表格由<table>标签定义,下面是一个2行3列的表格: <table> <tr> <td>11</td> <td>12 ...
Java数组转集合之Arrays.asList()用法
Arrays.asList()用法使用Arrays.asList()的原因无非是想将数组或一些元素转为集合,而你得到的集合并不一定是你想要的那个集合. 而一开始asList的设计时用于打印数组而设计 ...
SDP协议介绍
一.SDP协议介绍 SDP 完全是一种会话描述格式 ― 它不属于传输协议 ― 它只使用不同的适当的传输协议,包括会话通知协议(SAP).会话初始协议(SIP).实时流协议(RTSP).MIME 扩展协 ...
Bugku-CTF之sql注入2 （全都tm过滤了绝望吗？）
Day 38 sql注入2 200 http://123.206.87.240:8007/web2/ 全都tm过滤了绝望吗? 提示 !,!=,=,+,-,^,%
React 实现input输入框的防抖和节流
1.为什么使用防抖和节流对于频繁触发的事件比如keydown keyup事件当频繁点击时候会多次触发事件页面出现卡顿影响性能 2.函数防抖(debounce):间隔时间内只执行一次函数 ...
寒假安卓app开发学习记录（5）
第一个项目运行成功! 今天主要是看视频 ,学习Android项目的目录结构.大概学习了一个小时左右.然后在网上学习和对比eclipse上的目录,了解每个目录的功能是什么. 了解了Android项目的目 ...

吴裕雄 python 神经网络——TensorFlow训练神经网络：不使用指数衰减的学习率

吴裕雄 python 神经网络——TensorFlow训练神经网络：不使用指数衰减的学习率的更多相关文章

随机推荐

热门专题