用LSTM分类 MNIST

LSTM是RNN的一种算法，在序列分类中比较有用。常用于语音识别，文字处理（NLP）等领域。

等同于VGG等CNN模型在在图像识别领域的位置。本篇文章是叙述LSTM 在MNIST 手写图中的使用。

用来给初步学习RNN的一个范例，便于学习和理解LSTM .

先把工作流程图贴一下：

代码片段 ：

数据准备

def makedata():

    img_rows, img_cols = 28, 28

    mnist = fetch_mldata("MNIST original")

    # rescale the data, use the traditional train/test split

    X_1D, y_int = mnist.data / 255., mnist.target

    y = np_utils.to_categorical(y_int, num_classes=10)

    X = X_1D.reshape(X_1D.shape[0], img_rows, img_cols )

    input_shape = (img_rows, img_cols, 1)

    x_train, x_test = X[:60000], X[60000:]

    y_train, y_test = y[:60000], y[60000:]

    return X, y

    pass

下载 MNIST数据，进行归一化 mnist.data / 255，把数据[7000,784 ] 转成[ 70000,28,28]

构建模型：

def buildlstm():

    import numpy as np

    data_dim = 28

    timesteps = 28

    num_classes = 10

    # expected input data shape: (batch_size, timesteps, data_dim)

    model = Sequential()

    model.add(LSTM(32, return_sequences=True,   input_shape=(timesteps, data_dim+14)))

    model.add(LSTM(32, return_sequences=True))

    model.add(LSTM(32))

    model.add(Dense(10, activation='softmax'))

    model.compile(loss='categorical_crossentropy',

                  optimizer='rmsprop',

                  metrics=['accuracy'])

    print model.summary()

    return  model

    pass

基础参数： data_dim， timesteps， num_classes 分别为 28，28， 10
网络层级： LSTM ----》LSTM ----》LSTM ----》Dense
注意点： input_shape=(timesteps, data_dim+14)) 此处应该为 data_dim ， data_dim+14是我做第二个试验使用。
网络理解： RNN是用前一部分数据对当前数据的影响，并共同作用于最后结果。用基础的深度神经网络（只有Dense层），是把MNIST一个图形，
提取成784个像素数据，把784个数据扔给神经网络，784个数据是同等的概念。训练出权重来确定最终的分类值。

RNN 之于MNIST，是把MNIST 分成 28x28 数据。可以理解为用一个激光扫描一个图片，扫成28个（行）数据，每行为28个像素。站在时间序列
的角度，其实图片没有序列概念。但是我们可以这样理解，每一行于下一行是有位置关系的，不能进行顺序变化。比如一个手写 “7”字，如果把28行
的上下行顺序打乱，那么7 上面的一横就可能在中间位置，也可能在下面的位置。这样，最终的结果就不应该是 7 .
所以MNIST 的 28x28可以理解为有时序关系的数据。

训练预测：

def runTrain(model, x_train, x_test, y_train, y_test):

    model.fit(x_train, y_train,  batch_size= nbatch_size, epochs= nEpoches)

    score = model.evaluate(x_test, y_test, batch_size=nbatch_size)

    print 'evaluate score:', score

    pass

这部分应该没什么好说的

主程序：

def test():

    X,y = makedata2()

    x_train, x_test = X[:60000], X[60000:]

    y_train, y_test = y[:60000], y[60000:]

    model = buildlstm()

    runTrain(model, x_train, x_test, y_train, y_test )

    pass

运行结果：

结构：

Layer (type)                 Output Shape              Param #

=================================================================

lstm_1 (LSTM)                (None, 28, 32)            7808

_________________________________________________________________

lstm_2 (LSTM)                (None, 28, 32)            8320

_________________________________________________________________

lstm_3 (LSTM)                (None, 32)                8320

_________________________________________________________________

dense_1 (Dense)              (None, 10)                330

=================================================================

Total params: 24,778

Trainable params: 24,778

Non-trainable params: 0

_________________________________________________________________

结果：

base    lstm for mnist

acc : 98.56%

结果2：

把数据最后增加 50%  的 0 ， (dim X 0.5)

acc : 98.39%

结果基本上 与原数据一致

该实验证明两个结论：
1. LSTM可用于图形识别
2. 在数据中每行28个基础像素后面 + 14 个空白（0）的元素，不影分类识别。

写在最后：本实验的目的是为了理解RNN(LSTM), 只有理解了才能很好的使用。本文章的目的是为记录和分享。
再说下 RNN在其它领域的应用。比如在语音识别领域，一个音谱，识别成一个单词（词语），可以理解成一个
竖向扫描的MNIST , 一个股票的K线图，也可以理解一个竖向扫描的MNIST。还有其它领域，可以归纳递推。
入门之后，如何在自己的领域，再深入（构建复杂模型，优化数据的处理），提高网络模型的识别准确，那需要
见仁见智的。

代码文件链接：

源码下载

有对金融程序化和深度学习结合有兴趣的可以加群，个人群：杭州程序化交易群 375129936

用LSTM分类 MNIST的更多相关文章

NLP用CNN分类Mnist，提取出来的特征训练SVM及Keras的使用（demo）
用CNN分类Mnist http://www.bubuko.com/infodetail-777299.html /DeepLearning Tutorials/keras_usage 提取出来的特征 ...
tensorflow学习笔记————分类MNIST数据集
在使用tensorflow分类MNIST数据集中,最容易遇到的问题是下载MNIST样本的问题. 一般是通过使用tensorflow内置的函数进行下载和加载, from tensorflow.examp ...
【转载】用Scikit-Learn构建K-近邻算法，分类MNIST数据集
原帖地址:https://www.jiqizhixin.com/articles/2018-04-03-5 K 近邻算法,简称 K-NN.在如今深度学习盛行的时代,这个经典的机器学习算法经常被轻视.本 ...
用tensorflow搭建RNN(LSTM)进行MNIST 手写数字辨识
用tensorflow搭建RNN(LSTM)进行MNIST 手写数字辨识循环神经网络RNN相比传统的神经网络在处理序列化数据时更有优势,因为RNN能够将加入上(下)文信息进行考虑.一个简单的RNN如 ...
LSTM用于MNIST手写数字图片分类
按照惯例,先放代码: import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data #载入数据集 ...
检测用户命令序列异常——使用LSTM分类算法【使用朴素贝叶斯，类似垃圾邮件分类的做法也可以，将命令序列看成是垃圾邮件】
通过搜集 Linux 服务器的 bash 操作日志, 通过训练识别出特定用户的操作习惯, 然后进一步识别出异常操作行为. 使用 SEA 数据集涵盖 70 多个 U ...
分类-MNIST（手写数字识别）
这是学习<Hands-On Machine Learning with Scikit-Learn and TensorFlow>的笔记,如果此笔记对该书有侵权内容,请联系我,将其删除. 这 ...
单向LSTM笔记, LSTM做minist数据集分类
单向LSTM笔记, LSTM做minist数据集分类先介绍下torch.nn.LSTM()这个API 1.input_size: 每一个时步(time_step)输入到lstm单元的维度.(实际输入 ...
TensorFlow技术解析与实战学习笔记（15）-----MNIST识别（LSTM）
一.任务:采用基本的LSTM识别MNIST图片,将其分类成10个数字. 为了使用RNN来分类图片,将每张图片的行看成一个像素序列,因为MNIST图片的大小是28*28像素,所以我们把每一个图像样本看成 ...

随机推荐

WCF实现长连接
由于WCF的机制,连接池会在连接建立一定时间后超时,即使设置了超时时间非常长,也可能被服务端系统主动回收.之前做项目时碰到了这个问题,所以项目上考虑采用长连接,自动管理连接池,当连接超时后,自动重建, ...
刚安装 Oracle时，登录会出现的问题， ora-28000: the account is locked
来这个连接就OK了: https://jingyan.baidu.com/article/48b37f8d1ec3fd1a6464883a.html 第一步: 进入cmd: 然后将下面的sql输入就 ...
this的理解
this的理解看了阮一峰的this讲解,下面是我的理解: 总结来说 this指向调用this所在方法的对象: 普通函数例子1 function test(){ this.x = 1; cons ...
InfluxDB:cannot use field in group by clause
最近在使用InfluxDB时,发现一个很奇怪的问题,一个本来正常的功能,做了一次改动后,就不能正常显示了. 一.查询语句 SELECT MEMORY FROM "ACM_PROCESS_MO ...
智能合约语言 Solidity 教程系列5 - 数组介绍
写在前面 Solidity 是以太坊智能合约编程语言,阅读本文前,你应该对以太坊.智能合约有所了解, 如果你还不了解,建议你先看以太坊是什么本文前半部分是参考Solidity官方文档(当前最新版本: ...
if；脚本中退出语句：exit 数字，用$?查时为exit设置的数字，此数字为程序执行完后的返回数据，可以通过此方法自动设定
if [ 条件 ];then 代码 fi if [ 条件 ] then 代码 fi [root@localhost ~]# df 文件系统 1K-块已用可用已用% 挂载点 /dev/sda5 % ...
用LinkedList集合演示栈和队列的操作
在数据结构中,栈和队列是两种重要的线性数据结构.它们的主要不同在于:栈中存储的元素,是先进后出:队列中存储的元素是先进先出.我们接下来通过LinkedList集合来演示栈和队列的操作. import ...
QT中定时器的使用方法
前言:因为QT中用死循环会开销很多内存容易崩溃,这时候使用定时器可以很好解决这个问题. 使用定时器需要用到头文件:include<QTimer> (1)定义定时器 QTimer *upda ...
[编织消息框架][JAVA核心技术]动态代理应用1
前面几篇介绍,终于到了应用阶段啦,我们来做一个RPC来加强学过的知识做基础核心时先确定解决什么问题,提供什么服务,同将来扩展等 rpc 分两部份,一个是调用者,另一方是服务提供者调用者只关心那个服 ...
shiro中 UnknownAccountException
一 shiro的session.request和response与服务端容器自身的这三个对象的关系在web.xml中配置了一个Filter,拦截/*,所有的uri.在拦截器中还会调用ShiroFil ...

用LSTM分类 MNIST

用LSTM分类 MNIST的更多相关文章

随机推荐

热门专题