RNN-LSTM讲解-基于tensorflow实现

cnn卷积神经网络在前面已经有所了解了，目前博主也使用它进行了一个图像分类问题，基于kaggle里面的food-101进行的图像识别，识别率有点感人，基于数据集的关系，大致来说还可行。
下面我就继续学习rnn神经网络。

rnn神经网络（递归/循环神经网络）模式如下：

我们在处理文字等问题的时候，我们的输入会把上一个时间输出的数据作为下一个时间的输入数据进行处理。
例如：我们有一段话，我们将其分词，得到t个数据，我们分别将每一个词传入到x0，x1....xt里面，当x0传入后，会得到一个结果h0，同时我们会将处理后的数据传入到下个时间，到下个时间的时候，我们会再传入一个数据x1，同时还有上一个时间处理后的数据，将这两个数据进行整合计算，然后再向下传输，一直到结束。
rnn本质来说还是一个bp回路，不过他只是比bp网络多一个环节，即它可以反馈上一时间点处理后的数据。

上图细化如下：

rnn实际上还是存在梯度消失的问题，因此如上图所示，当我们在第一个时间输入的数据，可能在很久之后他就已经梯度消失了（影响很小），因此我们使用lstm(long short trem memory)

上图有三个门：输入门忘记门输出门
1.输入门：通过input * g 来判断是否输入，如果不输入就为0，输入就是0，以此判断信号是否输入
2.忘记门：这个信号是否需要衰减多少，可能为50%，衰减是根据信号来判断。
3.输入门：通过判断是否输出，或者输出多少，例如输出50%。
因此上述图可化为：

可以看出，这三个门，所有得影响都是关于输入和上一个数据得输出来进行计算的。

可以看下图：

我们使用lstm得话，通过三个门决定信号是否向下传输，传输多少都可以控制，是否传入信号，输出信息都进行控制。

下面我们还是用tensorflow实现，数据集还是手写数字，虽然rnn主要是用在文字和语言上，但是它依旧可以用在图片上。
下面给出代码：

```python

import tensorflow as tf

from tensorflow.contrib import rnn

from tensorflow.examples.tutorials.mnist import  input_data

mnist=input_data.read_data_sets("MNNIST_data",one_hot=True)

#输入图片为 28*28

n_inputs=28#输入一行，一行有28个像素

max_time=28#一共28行，所以为28*28

lstm_size=100#100个隐藏单元

batch_size=50

n_classes=10

n_batch=mnist.train.num_examples//batch_size#计算一共多少批次

#这里none表示第一个维度可以是任意长度

x=tf.placeholder(tf.float32,[None,784])

y=tf.placeholder(tf.float32,[None,10])

#初始化权值

weights=tf.Variable(tf.truncated_normal([lstm_size,n_classes],stddev=0.1))

#初始化偏置值

biases=tf.Variable(tf.constant(0.1,shape=[n_classes]))

##定义Rnn 网络

def RNN(X,weights,biases):

    inputs=tf.reshape(X,[-1,max_time,n_inputs])

    #定义lstm基本cell

    lstm_cell = rnn.BasicLSTMCell(lstm_size)

    #lstm_cell=tf.contrib.rnn.core_rnn_cell.BasicLSTMCell(lstm_size)

    outputs,final_state=tf.nn.dynamic_rnn(lstm_cell,inputs,dtype=tf.float32)

    results=tf.nn.softmax(tf.matmul(final_state[1],weights)+biases)

    return results

prediction=RNN(x,weights,biases)

#损失函数

cross_entropy=tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits(logits=prediction,labels=y))

#优化器

train_step=tf.train.AdamOptimizer(1e-4).minimize(cross_entropy)

#保存结果

correct_prediction=tf.equal(tf.argmax(y,1),tf.argmax(prediction,1))

accuracy=tf.reduce_mean(tf.cast(correct_prediction,tf.float32))

init=tf.global_variables_initializer()

with tf.Session() as sess:

    sess.run(init)

    for epoch in range(6):

        for batch in range(n_batch):

            batch_xs,batch_ys=mnist.train.next_batch(batch_size)

            sess.run(train_step,feed_dict={x:batch_xs,y:batch_ys})

        acc=sess.run(accuracy,feed_dict={x:mnist.test.images,y:mnist.test.labels})

        print("iter:"+str(epoch)+"testing accuracy"+str(acc))

```
运行结果如下：

RNN-LSTM讲解-基于tensorflow实现的更多相关文章

TensorFlow-Bitcoin-Robot:一个基于 TensorFlow LSTM 模型的 Bitcoin 价格预测机器人
简介 TensorFlow-Bitcoin-Robot:一个基于 TensorFlow LSTM 模型的 Bitcoin 价格预测机器人. 文章包括一下几个部分: 1.为什么要尝试做这个项目? 2.为 ...
TensorFlow-Bitcoin-Robot:一个基于 TensorFlow LSTM 模型的 Bitcoin 价格预测机器人。
简介 TensorFlow-Bitcoin-Robot:一个基于 TensorFlow LSTM 模型的 Bitcoin 价格预测机器人. 文章包括一下几个部分: 1.为什么要尝试做这个项目? 2.为 ...
tensorflow学习之（十一）RNN+LSTM神经网络的构造
#RNN 循环神经网络 import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data tf.se ...
Tensorflow - Tutorial (7) : 利用 RNN/LSTM 进行手写数字识别
1. 经常使用类 class tf.contrib.rnn.BasicLSTMCell BasicLSTMCell 是最简单的一个LSTM类.没有实现clipping,projection layer ...
基于TensorFlow的循环神经网络(RNN)
RNN适用场景循环神经网络(Recurrent Neural Network)适合处理和预测时序数据 RNN的特点 RNN的隐藏层之间的节点是有连接的,他的输入是输入层的输出向量.extend(上一 ...
用tensorflow搭建RNN(LSTM)进行MNIST 手写数字辨识
用tensorflow搭建RNN(LSTM)进行MNIST 手写数字辨识循环神经网络RNN相比传统的神经网络在处理序列化数据时更有优势,因为RNN能够将加入上(下)文信息进行考虑.一个简单的RNN如 ...
基于Tensorflow + Opencv 实现CNN自定义图像分类
摘要:本篇文章主要通过Tensorflow+Opencv实现CNN自定义图像分类案例,它能解决我们现实论文或实践中的图像分类问题,并与机器学习的图像分类算法进行对比实验. 本文分享自华为云社区< ...
[NL系列] RNN & LSTM 网络结构及应用
http://www.jianshu.com/p/f3bde26febed/ 这篇是 The Unreasonable Effectiveness of Recurrent Neural Networ ...
LSTM和双向LSTM讲解及实践
LSTM和双向LSTM讲解及实践目录 RNN的长期依赖问题LSTM原理讲解双向LSTM原理讲解Keras实现LSTM和双向LSTM 一.RNN的长期依赖问题在上篇文章中介绍的循环神经网络RNN在训 ...

随机推荐

Vue优化：常见会导致内存泄漏问题及优化
1. 监听在window/body等事件没有解绑2. 绑在EventBus的事件没有解绑3. 模块形成的闭包内部变量使用完后没有置成null4. 使用第三方库创建,没有调用正确的销毁函数5 . ech ...
Just 5分钟！使用k3s部署轻量Kubernetes集群快速教程
大小仅有40MB的k3s为想要节省开销进行开发和测试的企业提供了一个很好的选择.本文将用一种极为简洁的方式,教你在5分钟之内使用k3s部署轻量Kubernetes集群. Kubernetes已经改变了 ...
Javascript对this对象的理解
在JavaScript中this表示函数运行的时候自动生成的一个内部对象,只能在函数内部使用,下面是一个简单的例子: function test(){ alert(this == window); } ...
TwoHandleSlider/RangeSlider
项目需求:双滑块slider,可以实现选择一个范围 (一)添加两个slider,并把背景以及fill设置为透明,并去除RaycastTarget (二)在背景下添加个一个image,背景图为滑块划过后 ...
（一） kinect概述
Kinect可以进行身体节点定位,姿势定位,人脸识别等功能,在此先做简单介绍,后续主要介绍插件的应用,毕竟自己开发识别过程太消耗时间. (注1:Kinect官方虽然提供了Unity的APi,但是方便起 ...
vue-music 使用better-scroll遇到轮播图不能自动轮播
根据vue-music视频中slider组建的使用,当安装新版本的better-scroll,轮播组件,不能正常轮播这是因为,better-scroll发布新版本之后,参数设置发生改变这是旧版本: ...
vue 踩坑--项目名称不能与插件名称一样
今天webpack搭建,命令行一直报错百度说是项目名称为:vue npm 拒绝安装后来才发现是 package.json的name名称也设成了vue 所以修改一下就可以了.
Linux上安装mysql，实现主从复制
MYSQL(mariadb) MariaDB数据库管理系统是MySQL的一个分支,主要由开源社区在维护,采用GPL授权许可.开发这个分支的原因之一是:甲骨文公司收购了MySQL后,有将MySQL闭源的 ...
centOS7 永久关闭防火墙
查看防火墙状态: systemctl status firewalld.service 如图绿的running表示防火墙开启执行关闭命令: systemctl stop firewalld.ser ...
regexp盲注的一些改进
index.php?id=1 and 1=(SELECT 1 FROM information_schema.tables WHERE TABLE_SCHEMA="blind_sqli&qu ...

RNN-LSTM讲解-基于tensorflow实现

RNN-LSTM讲解-基于tensorflow实现的更多相关文章

随机推荐

热门专题