【TensorFlow篇】--DNN初始和应用

一、前述

ANN人工神经网络有两个或两个以上隐藏层，称为DNN

只有一个隐藏层是多层感知机

没有隐藏层是感知机

二、反向传播应用举例

举例：

正向传播，反向传播是一次迭代，

正向传播：在开始的每一层上都有一个参数值w，初始的时候是随机的,前向带入的是每一个样本值。

反向传播：然后反过来求所有的梯度值。如果是BGD则再根据公式wt=wt-1-ag进行调整所有w值。

然后再正向传播，迭代，以此类推。

softmax通常用于最后一层的激活函数

前面层用relu函数

三、激活函数之Relu

公式：

解释：

Rectified Linear Units
ReLU计算线性函数为非线性，如果大于0就是结果，否则就是0
生物神经元的反应看起来其实很像Sigmoid激活函数，所有专家在Sigmoid上卡了很长时间，但是后
来发现ReLU才更适合人工神经网络，这是一个模拟生物的误解

如果w为0，反过来梯度下降求导的时候每根线上的梯度都一样。

代码：

import tensorflow as tf

def relu(X):

    w_shape = (int(X.get_shape()[1]), 1)

    w = tf.Variable(tf.random_uniform(w_shape), name='weights')

    b = tf.Variable(0.0, name='bias')

    z = tf.add(tf.matmul(X, w), b, name='z')

    return tf.maximum(z, 0., name='relu')

n_features = 3

X = tf.placeholder(tf.float32, shape=(None, n_features), name='X')

relus = [relu(X) for i in range(5)]#list生成器

output = tf.add_n(relus, name='output')#将集合中的元素加和在一起

init = tf.global_variables_initializer()

with tf.Session() as sess:

    sess.run(init)

    result = output.eval(feed_dict={X: [[1, 2, 3], [4, 5, 6], [7, 8, 9]]})#把里面placehoder的值传进来

    print(result)

四、激活函数和导数

五、DNN代码

import tensorflow as tf

from tensorflow.examples.tutorials.mnist import input_data

import numpy as np

from tensorflow.contrib.layers import fully_connected

# 构建图阶段

n_inputs = 28*28#输入节点

n_hidden1 = 300#第一个隐藏层300个节点 对第一个隐藏层前面有784*300跟线去算

n_hidden2 = 100#第二个隐藏层100个节点 对第二个隐藏层300*300根线

n_outputs = 10#输出节点

X = tf.placeholder(tf.float32, shape=(None, n_inputs), name='X')

y = tf.placeholder(tf.int64, shape=(None), name='y')

#自己手写的实现逻辑

# 构建神经网络层，我们这里两个隐藏层，基本一样，除了输入inputs到每个神经元的连接不同

# 和神经元个数不同

# 输出层也非常相似，只是激活函数从ReLU变成了Softmax而已

# def neuron_layer(X, n_neurons, name, activation=None):# X是输入，n_neurons是这一层神经元个数，当前隐藏层名称，最后一个参数是加不加激活函数

#     # 包含所有计算节点对于这一层，name_scope可写可不写

#     with tf.name_scope(name):#with让代码看起来更加优雅一些

#         # 取输入矩阵的维度作为层的输入连接个数

#         n_inputs = int(X.get_shape()[1])

#         stddev = 2 / np.sqrt(n_inputs)#求标准方差

#         # 这层里面的w可以看成是二维数组，每个神经元对于一组w参数

#         # truncated normal distribution（调整后的正态分布） 比 regular normal distribution（正态分布）的值小

#         # 不会出现任何大的权重值，确保慢慢的稳健的训练

#         # 使用这种标准方差会让收敛快

#         # w参数需要随机，不能为0，否则输出为0，最后调整都是一个幅度没意义

#         init = tf.truncated_normal((n_inputs, n_neurons), stddev=stddev)#把初始参数随机出来，比较小，不会出现大的权重值

#         w = tf.Variable(init, name='weights')

#         b = tf.Variable(tf.zeros([n_neurons]), name='biases')#b可以全为0

#         # 向量表达的使用比一条一条加和要高效

#         z = tf.matmul(X, w) + b

#         if activation == "relu":

#             return tf.nn.relu(z)

#         else:

#             return z

#自己手写的实现逻辑

'''

with tf.name_scope("dnn"):

    hidden1 = neuron_layer(X, n_hidden1, "hidden1", activation="relu")

    hidden2 = neuron_layer(hidden1, n_hidden2, "hidden2", activation="relu")

    # 进入到softmax之前的结果

    logits = neuron_layer(hidden2, n_outputs, "outputs")

'''

#用Tensorflow封装的函数

with tf.name_scope("dnn"):

    # tensorflow使用这个函数帮助我们使用合适的初始化w和b的策略，默认使用ReLU激活函数

    hidden1 = fully_connected(X, n_hidden1, scope="hidden1")#构建第一层隐藏层 全连接

    hidden2 = fully_connected(hidden1, n_hidden2, scope="hidden2")#构建第二层隐藏层 全连接

    logits = fully_connected(hidden2, n_outputs, scope="outputs", activation_fn=None)#构建输出层 #注意输出层激活函数不需要

with tf.name_scope("loss"):

    # 定义交叉熵损失函数，并且求个样本平均

    # 函数等价于先使用softmax损失函数，再接着计算交叉熵，并且更有效率

    # 类似的softmax_cross_entropy_with_logits只会给one-hot编码，我们使用的会给0-9分类号

    xentropy = tf.nn.sparse_softmax_cross_entropy_with_logits(labels=y, logits=logits)#封装好了损失函数

    #把真实的Y值做onehot编码

    loss = tf.reduce_mean(xentropy, name="loss")#求平均

learning_rate = 0.01

with tf.name_scope("train"):

    optimizer = tf.train.GradientDescentOptimizer(learning_rate)#创建梯度下降的优化器

    training_op = optimizer.minimize(loss)#最小化损失

with tf.name_scope("eval"):#评估

    # 获取logits里面最大的那1位和y比较类别好是否相同，返回True或者False一组值

    correct = tf.nn.in_top_k(logits, y, 1)#logits返回是类别号 y也是类别号

    accuracy = tf.reduce_mean(tf.cast(correct, tf.float32))#转成1.0 0.0

init = tf.global_variables_initializer()

saver = tf.train.Saver()

# 计算图阶段

mnist = input_data.read_data_sets("MNIST_data_bak/")

n_epochs = 400 #运行400次

batch_size = 50 #每一批次运行50个

with tf.Session() as sess:

    init.run()

    for epoch in range(n_epochs):

        for iterationo in range(mnist.train.num_examples//batch_size):#总共多少条/批次大小

            X_batch, y_batch = mnist.train.next_batch(batch_size)#每次传取一小批次数据

            sess.run(training_op, feed_dict={X: X_batch, y: y_batch})#传递参数

        acc_train = accuracy.eval(feed_dict={X: X_batch, y: y_batch})#每运行一次 看训练集准确率

        acc_test = accuracy.eval(feed_dict={X: mnist.test.images,#每运行一次 看测试集准确率

                                            y: mnist.test.labels})

        print(epoch, "Train accuracy:", acc_train, "Test accuracy:", acc_test)

    save_path = saver.save(sess, "./my_dnn_model_final.ckpt")

# 使用模型预测

with tf.Session as sess:

    saver.restore(sess, "./my_dnn_model_final.ckpt")

    X_new_scaled = [...]

    Z = logits.eval(feed_dict={X: X_new_scaled})

    y_pred = np.argmax(Z, axis=1)  # 查看最大的类别是哪个

【TensorFlow篇】--DNN初始和应用的更多相关文章

TensorFlow之DNN（二）：全连接神经网络的加速技巧(Xavier初始化、Adam、Batch Norm、学习率衰减与梯度截断)
在上一篇博客<TensorFlow之DNN(一):构建“裸机版”全连接神经网络>中,我整理了一个用TensorFlow实现的简单全连接神经网络模型,没有运用加速技巧(小批量梯度下降不算哦) ...
TensorFlow之DNN（一）：构建“裸机版”全连接神经网络
博客断更了一周,干啥去了?想做个聊天机器人出来,去看教程了,然后大受打击,哭着回来补TensorFlow和自然语言处理的基础了.本来如意算盘打得挺响,作为一个初学者,直接看项目(不是指MINIST手写 ...
【TensorFlow篇】--Tensorflow框架初始，实现机器学习中多元线性回归
一.前述 TensorFlow是谷歌基于DistBelief进行研发的第二代人工智能学习系统,其命名来源于本身的运行原理.Tensor(张量)意味着N维数组,Flow(流)意味着基于数据流图的计算,T ...
DNN网络（三）python下用Tensorflow实现DNN网络以及Adagrad优化器
摘自: https://www.kaggle.com/zoupet/neural-network-model-for-house-prices-tensorflow 一.实现功能简介: 本文摘自Kag ...
TensorFlow之DNN（三）：神经网络的正则化方法(Dropout、L2正则化、早停和数据增强)
这一篇博客整理用TensorFlow实现神经网络正则化的内容. 深层神经网络往往具有数十万乃至数百万的参数,可以进行非常复杂的特征变换,具有强大的学习能力,因此容易在训练集上过拟合.缓解神经网络的过拟 ...
使用TensorFlow实现DNN
这一节使用TF实现一个多层神经网络模型来对MNIST数据集进行分类,这里我们设计一个含有两个隐藏层的神经网络,在输出部分使用softmax对结果进行预测. 使用高级API实现多层神经网络这里我们使用 ...
【TensorFlow篇】--Tensorflow框架实现SoftMax模型识别手写数字集
一.前述本文讲述用Tensorflow框架实现SoftMax模型识别手写数字集,来实现多分类. 同时对模型的保存和恢复做下示例. 二.具体原理代码一:实现代码 #!/usr/bin/python ...
keras和tensorflow搭建DNN、CNN、RNN手写数字识别
MNIST手写数字集 MNIST是一个由美国由美国邮政系统开发的手写数字识别数据集.手写内容是0~9,一共有60000个图片样本,我们可以到MNIST官网免费下载,总共4个.gz后缀的压缩文件,该文件 ...
【TensorFlow篇】--Tensorflow框架可视化之Tensorboard
一.前述 TensorBoard是tensorFlow中的可视化界面,可以清楚的看到数据的流向以及各种参数的变化,本文基于一个案例讲解TensorBoard的用法. 二.代码设计一个MLP多层神经网 ...

随机推荐

UnicodeEncodeError: 'ascii' codec can't encode character...的解决方法
在python2.7下,因为想从数据库中读出来分类名进行写入到文件,提示 Traceback (most recent call last): File "test.py", li ...
ubuntu16.04开机循环输入密码无法进入桌面的解决办法
前些天碰到一个头疼的问题,启动我的ubuntu之后,输入密码闪屏一下,又需要输入密码!!!于是再输还要再输!!!!! 经过百度一翻后终于找到原因和解决办法. 原来是我之前在profile文件里配置了一 ...
balance.go 源码阅读
) //10s +随机毫秒数后执行下面代码 for _ = range t { for _, v := range pBackendSvrs { i ...
java.lang.IllegalArgumentException异常配置文件的问题
java.lang.IllegalArgumentException: org.hibernate.hql.internal.ast.QuerySyntaxException: Student is ...
bzoj4067 [Ctsc2015]gender
好神的一道题啊! 我们发现题目中的ln的贡献非常傻逼,但是我们可以发现这个东西的取值只有40个左右,于是我们可以枚举他! 枚举完了对于题里的贡献就是一个普通的最小割,采用的是文理分科的思想,与S连代表 ...
BZOJ_4176_Lucas的数论_杜教筛+莫比乌斯反演
BZOJ_4176_Lucas的数论_杜教筛+莫比乌斯反演 Description 去年的Lucas非常喜欢数论题,但是一年以后的Lucas却不那么喜欢了. 在整理以前的试题时,发现了这样一道题目“求 ...
原生wcPop.js消息提示框(移动端)、内含仿微信弹窗效果
wcPop.js移动端消息对话框插件是之前的wxPop.js的升级版,优化了js和css,并且新增了仿微信弹窗效果, 是一款含有多种情景模式的原生模态消息对话框代码,可用于替代浏览器默认的alert弹 ...
Mtcnn进行人脸剪裁和对齐
from scipy import misc import tensorflow as tf import detect_face import cv2 import matplotlib.pyplo ...
Python档案袋（生成器、迭代器、队列 )
生成器: 简单的生成器实现: #生成器,将for循环的变量传递到前面的式子进行处理 #生成的并不是一个列表,而是一个存在算数规则的对象 #不能通过下标直接取值,必须一个一个从头到尾取 va=(i*2 ...
Python的re模块
什么是re模块,re模块有什么作用? re模块是Python提供的一个正则表达式相关的模块,主要是针对字符串进行模糊匹配,所以在字符串匹配这一功能上,re相当专业. 什么是模糊匹配? 之前的学习字符串 ...

【TensorFlow篇】--DNN初始和应用

【TensorFlow篇】--DNN初始和应用的更多相关文章

随机推荐

热门专题