tensorflow cnn+rnn基本结构

 #CNN

 x = tf.placeholder(tf.float32,[None,input_node],name="x_input")

 y_ = tf.placeholder(tf.float32,[None,output_node],name="y_output")

 #input-->layer1

 w_1 = tf.Variable(tf.truncted_normal([input_node,L1_node],stdev=0.5))

 b_1 = tf.Variable(tf.constant(0.1,shape=[L1_node]))

 l_conv1 = tf.nn.relu(tf.matmul(x,w_1)+b_1,strides=[1,2,2,1])

 l_pool1 = tf.nn.max_pool(l_conv1,strides=[1,2,2,1],ksize = [1,2,2,1],padding='SAME')

 #layer1-->layder2

 w_2 = tf.Variable(tf.truncted_normal([L1_node,L2_node],stddev=0.5))

 b_2 = tf.Variable(tf.constant(0.1,shape=[L2_node]))

 l_conv2 = tf.nn.relu(tf.matmul(l_pool1,w_2)+b_2)

 l_pool2 = tf.nn.max_pool(l_conv2,strides=[1,2,2,1],ksize = [1,2,2,1],padding='SAME')

 #layser2-->fc

 w_3 = tf.Variable(tf.truncted_normal([L2_node,fc_node],stddev=0.5))

 b_3 = tf.Variable(tf.constant(0.1,shape=[fc_node]))

 l_3 = tf.reshape(l_pool2,[-1,])

 fc_1 = tf.nn.relu(tf.matmul(l_3,w_3)+b_3)

 #fc-->dropout

 drop = tf.nn.dropout(fc_1,keep_prob)

 #dropout-->softmax

 w_4 = tf.Variable(tf.truncted_normal([fc_node,output_node],stddev=0.5))

 b_4 = tf.Variable(tf.constant(0.1,shape=[output_node]))

 y = tf.nn.softmax(tf.matmul(drop,w_4)+b_4)

 cross_entropy = tf.nn.sparse_softmax_cross_entropy_with_logits(logits=tf.argmax(y,1),labels=tf.argmax(y_,1))

 cross_entropy_mean = tf.reduce_mean(cross_entropy)

 loss = cross_entropy+reularation

 train_step = tf.train.GradientDescentOptimizer(leraning_rate).minimize(loss)#以何种方式何种学习率去优化何种目标

 correct_prediction = tf.equal(tf.argmax(y,1),tf.argmax(y_,1))

 accuracy = tf.reduce_mean(tf.cast(correct_predictiontf.float32))

 with tf.session() as sess:

     tf.global_variable_initializer().run()

     for i in range(max_steps):

         sess.run(train_step,feed_dict={x:,y:})

         if i%1000 == 0:

             validate_accu = sess.run(accuracy,feed_dict={x:x_val,y:y_val})

     test_accu = sess.run(accuracy,feed_dict = {x:x_test,y:y_dict})

 #RNN

 input_size = 28(28*28 image)

 hidden_size = 256

 layer_num = 2

 class_num =10

 x = tf.placeholder(tf.float32,[None,784])

 y = tf.placeholder(tf.float32,[None,class_num])

 keep_prob = tf.placeholder(tf.float32)

 x = tf.reshape(x,[-1,28,28])

 #一层lstm

 lstm_layer = tf.contrib.rnn.BasicLSTMCell(num_units=hidden_size,forget_bias=1.0,..)

 #添加dropout

 lstm_layer = tf.contrib.rnn.DropoutWrrapper(lstm_layer,input_keep_prob =1.0,output_keep_prob=keep_prob)

 #堆叠多层

 mlstm = tf.contrib.rnn.MultiRNNCell([lstm_layer]*layer_sum,...)

 init_state = mlstm.zero_state(batch_size,dtype=tf.float32)

 output = mlstm(x)

 #添加softmax层

 w = tf.Variable(tf.truncted_normal([hidden_size,class_num],stddev=0.1),dtype=tf.float32)

 b = tf.Variable(tf.constant(0.1,shape=[class_num]),dtype=tf.float32)

 y_ = tf.nn.softmax(tf.matmul(output,w)+b)

 cross_entropy = tf.reduce_mean(-y*tf.log(y_))

 train_step = tf.train.AdamOptimizer(learning_rate).minimize(cross_entropy)

 correct_prediction = tf.equal(tf.argmax(y,1),tf.argmax(y_,1))

 #tf.argmax(input, axis=None, name=None, dimension=None)此函数是对矩阵按行或列计算最大值,0:按列，此处按行

 accuracy = tf.reduce_mean(tf.cast(correct_prediction,'float'))#tf.cast():数据格式转换，此处bool-->float

 with tf.Session as sess:

     sess.run(train_step,feed_dict={x:,y:,keep_prob:}) #train

     if i%1000 ==0:

         train_accuracy = sess.run(accuracy,feed_dict={x:x_val,y:y_val,keep_prob:})

         print(train_accuracy)

     #测试集

     test_accuracy = sess.run(accuracy,feed_dict={x:x_test,y:y_test,keep_prob:})

     print(test_accuracy)

tensorflow cnn+rnn基本结构的更多相关文章

Android+TensorFlow+CNN+MNIST 手写数字识别实现
Android+TensorFlow+CNN+MNIST 手写数字识别实现 SkySeraph 2018 Email:skyseraph00#163.com 更多精彩请直接访问SkySeraph个人站 ...
用tensorflow搭建RNN(LSTM)进行MNIST 手写数字辨识
用tensorflow搭建RNN(LSTM)进行MNIST 手写数字辨识循环神经网络RNN相比传统的神经网络在处理序列化数据时更有优势,因为RNN能够将加入上(下)文信息进行考虑.一个简单的RNN如 ...
TensorFlow之RNN：堆叠RNN、LSTM、GRU及双向LSTM
RNN(Recurrent Neural Networks,循环神经网络)是一种具有短期记忆能力的神经网络模型,可以处理任意长度的序列,在自然语言处理中的应用非常广泛,比如机器翻译.文本生成.问答系统 ...
第二十二节，TensorFlow中RNN实现一些其它知识补充
一初始化RNN 上一节中介绍了通过cell类构建RNN的函数,其中有一个参数initial_state,即cell初始状态参数,TensorFlow中封装了对其初始化的方法. 1.初始化为0 对于 ...
用深度学习（CNN RNN Attention）解决大规模文本分类问题 - 综述和实践
https://zhuanlan.zhihu.com/p/25928551 近来在同时做一个应用深度学习解决淘宝商品的类目预测问题的项目,恰好硕士毕业时论文题目便是文本分类问题,趁此机会总结下文本分类 ...
[转] 用深度学习（CNN RNN Attention）解决大规模文本分类问题 - 综述和实践
转自知乎上看到的一篇很棒的文章:用深度学习(CNN RNN Attention)解决大规模文本分类问题 - 综述和实践近来在同时做一个应用深度学习解决淘宝商品的类目预测问题的项目,恰好硕士毕业时论文 ...
深度学习-CNN+RNN笔记
以下叙述只是简单的叙述,CNN+RNN(LSTM,GRU)的应用相关文章还很多,而且研究的方向不仅仅是下文提到的1. CNN 特征提取,用于RNN语句生成图片标注.2. RNN特征提取用于CNN内容分 ...
使用Keras搭建cnn+rnn， BRNN，DRNN等模型
Keras api 提前知道: BatchNormalization, 用来加快每次迭代中的训练速度 Normalize the activations of the previous layer a ...
TensorFlow 实现 RNN 入门教程
转子:https://www.leiphone.com/news/201705/zW49Eo8YfYu9K03J.html 最近在看RNN模型,为简单起见,本篇就以简单的二进制序列作为训练数据,而不实 ...

随机推荐

【POJ 2976 Dropping tests】
Time Limit: 1000MSMemory Limit: 65536K Total Submissions: 13849Accepted: 4851 Description In a certa ...
[CQOI2018]异或序列 (莫队,异或前缀和)
题目链接 Solution 有点巧的莫队. 考虑到区间 \([L,R]\) 的异或和也即 \(sum[L-1]~\bigoplus~sum[R]\) ,此处\(sum\)即为异或前缀和. 然后如何考虑 ...
Java并发（1）- 聊聊Java内存模型
引言在计算机系统的发展过程中,由于CPU的运算速度和计算机存储速度之间巨大的差距.为了解决CPU的运算速度和计算机存储速度之间巨大的差距,设计人员在CPU和计算机存储之间加入了高速缓存来做为他们之间 ...
foj Problem 2282 Wand
Problem 2282 Wand Accept: 432 Submit: 1537Time Limit: 1000 mSec Memory Limit : 262144 KB Prob ...
洛谷 P1343 地震逃生
P1343地震逃生题目描述汶川地震发生时,四川**中学正在上课,一看地震发生,老师们立刻带领x名学生逃跑,整个学校可以抽象地看成一个有向图,图中有n个点,m条边.1号点为教室,n号点为安全地带,每 ...
关于Local System/Local Service/Network Service账户
部署或安装系统服务时需要指定服务运行的账户.一般地,可选择Local System.Local Service或Network Service账户. Local System/Local Servic ...
小Z爱序列(NOIP信（sang）心（bin）赛)From FallDream（粗制单调队列&单调栈的算法解析）
原题: 小Z最擅长解决序列问题啦,什么最长公共上升然后下降然后上升的子序列,小Z都是轻松解决的呢. 但是小Z不擅长出序列问题啊,所以它给了你一道签到题. 给定一个n个数的序列ai,你要求出满足下述条件 ...
sqlalchemy多表查询
from datetime import datetime from sqlalchemy import Column,Integer,String,Boolean,DateTime,ForeignK ...
我读过的最好的epoll讲解--转自”知乎“ 【转】
转自:http://blog.csdn.net/xu3737284/article/details/12715963 首先我们来定义流的概念,一个流可以是文件,socket,pipe等等可以进行I/O ...
深入解析Linux内核I/O剖析（open,write实现）
Linux内核将一切视为文件,那么Linux的文件是什么呢?其既可以是事实上的真正的物理文件,也可以是设备.管道,甚至还可以是一块内存.狭义的文件是指文件系统中的物理文件,而广义的文件则可以是Linu ...

tensorflow cnn+rnn基本结构

tensorflow cnn+rnn基本结构的更多相关文章

随机推荐

热门专题