1.使用RNN做MNIST分类

第一次用LSTM,从简单做起吧~~

注意事项：

batch_first=True 意味着输入的格式为（batch_size,time_step,input_size),False 意味着输入的格式为（time_step,batch_size,input_size)
取r_out[:,-1,:]，即取时间步最后一步的结果，相当于LSTM把一张图片全部扫描完后的返回的状态向量（此时的维度变为（64，64），前面的64是batch_size,后面的64是隐藏层的神经元个数）

 import torch

 from torch.autograd import Variable

 from torchvision import datasets,transforms

 #超参数

 EPOCH=1

 BATCH_SIZE=64

 TIME_STEP=28#run time step/image height

 INPUT_SIZE=28#run input size/image width

 LR=0.01

 DOWNLOAD_MNIST=True

 train_data=datasets.MNIST(root='./mnist',train=True,transform=transforms.ToTensor(),download=DOWNLOAD_MNIST)

 train_loader=torch.utils.data.DataLoader(dataset=train_data,batch_size=BATCH_SIZE,shuffle=True)

 test_data=datasets.MNIST(root='./mnist',train=False,transform=transforms.ToTensor(),download=DOWNLOAD_MNIST)

 test_loader=torch.utils.data.DataLoader(dataset=test_data,batch_size=BATCH_SIZE,shuffle=True)

 class RNN(torch.nn.Module):

     def __init__(self):

         super(RNN,self).__init__()

         self.rnn=torch.nn.LSTM(

             input_size=INPUT_SIZE,

             hidden_size=64,

             num_layers=1,

             batch_first=True,

         )

         self.out=torch.nn.Linear(64,10)

     def forward(self, x):

         r_out,(h_n,h_c)=self.rnn(x,None)#[64,28,64]

         out=self.out(r_out[:,-1,:])#[64,10]

         return out

 #time_step,batch,input  batch_first=False,

 rnn=RNN()

 print(rnn)

 optimizer=torch.optim.Adam(rnn.parameters(),lr=LR)

 loss_func=torch.nn.CrossEntropyLoss()

 for epoch in range(EPOCH):

     for step,(x,y) in enumerate(train_loader):

         b_x=Variable(x.view(-1,28,28))#reshape x to (batch,time_step.input_size)

         b_y=Variable(y).squeeze()

         output=rnn(b_x)

         loss=loss_func(output,b_y)

         optimizer.zero_grad()

         loss.backward()

         optimizer.step()

         if step %50==0:

             for test_x,test_y in test_loader:

                 test_output=rnn(test_x.view(-1,28,28))

                 pred_y=torch.max(test_output,1)[1].data.numpy().squeeze()

                 test_y=test_y.numpy()

                 acc=sum(pred_y==test_y)/test_y.size

                 print(acc)

1.使用RNN做MNIST分类的更多相关文章

芝麻HTTP：TensorFlow LSTM MNIST分类
本节来介绍一下使用 RNN 的 LSTM 来做 MNIST 分类的方法,RNN 相比 CNN 来说,速度可能会慢,但可以节省更多的内存空间. 初始化首先我们可以先初始化一些变量,如学习率.节点单元数 ...
2.使用RNN做诗歌生成
诗歌生成比分类问题要稍微麻烦一些,而且第一次使用RNN做文本方面的问题,还是有很多概念性的东西~~~ 数据下载: 链接:https://pan.baidu.com/s/1uCDup7U5rGuIlIb ...
使用CNN做文本分类——将图像2维卷积换成1维
使用CNN做文本分类 from __future__ import division, print_function, absolute_import import tensorflow as tf ...
《机器学习系统设计》之应用scikit-learn做文本分类（上）
前言: 本系列是在作者学习<机器学习系统设计>([美] WilliRichert)过程中的思考与实践,全书通过Python从数据处理.到特征project,再到模型选择,把机器学习解决这个 ...
Tensorflow实战第十课（RNN MNIST分类）
设置RNN的参数我们本节采用RNN来进行分类的训练(classifiction).会继续使用手写数据集MNIST. 让RNN从每张图片的第一行像素读到最后一行,然后进行分类判断.接下来我们导入MNI ...
深度学习原理与框架-Tensorflow卷积神经网络-卷积神经网络mnist分类 1.tf.nn.conv2d(卷积操作) 2.tf.nn.max_pool(最大池化操作) 3.tf.nn.dropout(执行dropout操作) 4.tf.nn.softmax_cross_entropy_with_logits(交叉熵损失) 5.tf.truncated_normal(两个标准差内的正态分布)
1. tf.nn.conv2d(x, w, strides=[1, 1, 1, 1], padding='SAME') # 对数据进行卷积操作参数说明:x表示输入数据,w表示卷积核, stride ...
TensorFlow入门（三）多层 CNNs 实现 mnist分类
欢迎转载,但请务必注明原文出处及作者信息. 深入MNIST refer: http://wiki.jikexueyuan.com/project/tensorflow-zh/tutorials/mni ...
用keras的cnn做人脸分类
keras介绍 Keras是一个简约,高度模块化的神经网络库.采用Python / Theano开发. 使用Keras如果你需要一个深度学习库: 可以很容易和快速实现原型(通过总模块化,极简主义,和可 ...
tensorflow RNN循环神经网络 (分类例子)-【老鱼学tensorflow】
之前我们学习过用CNN(卷积神经网络)来识别手写字,在CNN中是把图片看成了二维矩阵,然后在二维矩阵中堆叠高度值来进行识别. 而在RNN中增添了时间的维度,因为我们会发现有些图片或者语言或语音等会在时 ...

随机推荐

Android学习第8天
进程的概念 a) 四大组件都运行在主线程中 b) 服务是没有界面的,可理解为没有界面的Activity c) 进程的优先级 i. ...
consul命令记录
服务端启动脚本 #/bin/bash! echo "********************************************************************* ...
python学习day12 函数Ⅳ (闭包&内置模块)
函数Ⅳ (闭包&内置模块) 1.内置函数(补充) lambda表达式也叫匿名函数. 函数与函数之间的数据互不影响,每次运行函数都会开一个辟新的内存. item = 10 def func(): ...
常用js方法整理（个人）
开头总要有点废话今天想了下,还是分享下自己平时积累的一些实用性较高的js方法,供大家指点和评价.本想分篇介绍,发现有点画蛇添足.整理了下也没多少拿得出手的方法,自然有一些是网上看到的个人觉得很有实用 ...
secureCRT自动断开的解决方法
转: secureCRT自动断开的解决方法 secureCRT自动断开的解决方法在secureCRT上登录时,一段时间不用的话会自动断开,必须重新连接,有点麻烦. 有时候服务器端的 /etc/pro ...
什么是javabean及其用法（转）
因工作需要需要学习jsp方面的知识这篇博客文章写得比较全面我记录下: 一.什么是JavaBean JavaBean是一个遵循特定写法的Java类,它通常具有如下特点: 这个Java类必须具有一个 ...
python之OpenCv(五)---抓取摄像头视频图像
OpenCV 可以通过头videoCapture()方法打开摄像摄像头变量 = cv2.VideoCapture(n) n为整数,内置摄像头为0,若有其他摄像头则依次为1,2,3,4,... ...
应用调试(二)GDB
title: 应用调试(二)GDBdate: 2019/1/17 21:00:10 toc: true 应用调试(二)GDB gdb下载工具安装交叉工具链设置GDB介绍编译GDBtarget/host ...
usb输入子系统写程序(三)
目录 usb输入子系统写程序小结内核修改怎么写代码类型匹配 probe disconnect 程序设计 1th匹配probe 2th 获取usb数据 3th 输入子系统上报按键 title: ...
GO语言系列（二）- 基本数据类型和操作符
一.文件名 & 关键字 & 标识符 1.所有go源码以.go结尾 2.标识符以字母或下划线开头,大小写敏感 3._是特殊标识符,用来忽略结果 4.保留关键字二.Go程序的基本结构 p ...

1.使用RNN做MNIST分类

1.使用RNN做MNIST分类的更多相关文章

随机推荐

热门专题