基于PyTorch实现MNIST手写字识别

本篇不涉及模型原理，只是分享下代码。想要了解模型原理的可以去看网上很多大牛的博客。

目前代码实现了CNN和LSTM两个网络，整个代码分为四部分：

Config：项目中涉及的参数；
CNN：卷积神经网络结构；
LSTM：长短期记忆网络结构；
TrainProcess：

模型训练及评估，参数model控制训练何种模型（CNN or LSTM）。

完整代码

—Talk is cheap, show me the code.

# -*- coding: utf-8 -*-

# @author: Awesome_Tang

# @date: 2019-04-05

# @version: python3.7

import torch

from torchvision import datasets, transforms

import torch.nn as nn

import torch.optim as optim

from torch.autograd import Variable

from datetime import datetime

class Config:

    batch_size = 64

    epoch = 10

    alpha = 1e-3

    print_per_step = 100  # 控制输出

class CNN(nn.Module):

    def __init__(self):

        super(CNN, self).__init__()

        """

        Conv2d参数：

        第一位：input channels  输入通道数

        第二位：output channels 输出通道数

        第三位：kernel size 卷积核尺寸

        第四位：stride 步长，默认为1

        第五位：padding size 默认为0，不补

        """

        self.conv1 = nn.Sequential(

            nn.Conv2d(1, 32, 3, 1, 2),

            nn.ReLU(),

            nn.MaxPool2d(2, 2)

        )

        self.conv2 = nn.Sequential(

            nn.Conv2d(32, 64, 5),

            nn.ReLU(),

            nn.MaxPool2d(2, 2)

        )

        self.fc1 = nn.Sequential(

            nn.Linear(64 * 5 * 5, 128),

            nn.BatchNorm1d(128),

            nn.ReLU()

        )

        self.fc2 = nn.Sequential(

            nn.Linear(128, 64),

            nn.BatchNorm1d(64),  # 加快收敛速度的方法（注：批标准化一般放在全连接层后面，激活函数层的前面）

            nn.ReLU()

        )

        self.fc3 = nn.Linear(64, 10)

    def forward(self, x):

        x = self.conv1(x)

        x = self.conv2(x)

        x = x.view(x.size()[0], -1)

        x = self.fc1(x)

        x = self.fc2(x)

        x = self.fc3(x)

        return x

class LSTM(nn.Module):

    def __init__(self):

        super(LSTM, self).__init__()

        self.lstm = nn.LSTM(

            input_size=28,

            hidden_size=64,

            num_layers=1,

            batch_first=True,

        )

        self.output = nn.Linear(64, 10)

    def forward(self, x):

        r_out, (_, _) = self.lstm(x, None)

        out = self.output(r_out[:, -1, :])

        return out

class TrainProcess:

    def __init__(self, model="CNN"):

        self.train, self.test = self.load_data()

        self.model = model

        if self.model == "CNN":

            self.net = CNN()

        elif self.model == "LSTM":

            self.net = LSTM()

        else:

            raise ValueError('"CNN" or "LSTM" is expected, but received "%s".' % model)

        self.criterion = nn.CrossEntropyLoss()  # 定义损失函数

        self.optimizer = optim.Adam(self.net.parameters(), lr=Config.alpha)

    @staticmethod

    def load_data():

        print("Loading Data......")

        """加载MNIST数据集，本地数据不存在会自动下载"""

        train_data = datasets.MNIST(root='./data/',

                                    train=True,

                                    transform=transforms.ToTensor(),

                                    download=True)

        test_data = datasets.MNIST(root='./data/',

                                   train=False,

                                   transform=transforms.ToTensor())

        # 返回一个数据迭代器

        # shuffle：是否打乱顺序

        train_loader = torch.utils.data.DataLoader(dataset=train_data,

                                                   batch_size=Config.batch_size,

                                                   shuffle=True)

        test_loader = torch.utils.data.DataLoader(dataset=test_data,

                                                  batch_size=Config.batch_size,

                                                  shuffle=False)

        return train_loader, test_loader

    def train_step(self):

        steps = 0

        start_time = datetime.now()

        print("Training & Evaluating based on '%s'......" % self.model)

        for epoch in range(Config.epoch):

            print("Epoch {:3}.".format(epoch + 1))

            for data, label in self.train:

                data, label = Variable(data.cpu()), Variable(label.cpu())

                # LSTM输入为3维，CNN输入为4维

                if self.model == "LSTM":

                    data = data.view(-1, 28, 28)

                self.optimizer.zero_grad()  # 将梯度归零

                outputs = self.net(data)  # 将数据传入网络进行前向运算

                loss = self.criterion(outputs, label)  # 得到损失函数

                loss.backward()  # 反向传播

                self.optimizer.step()  # 通过梯度做一步参数更新

                # 每100次打印一次结果

                if steps % Config.print_per_step == 0:

                    _, predicted = torch.max(outputs, 1)

                    correct = int(sum(predicted == label))  # 计算预测正确个数

                    accuracy = correct / Config.batch_size  # 计算准确率

                    end_time = datetime.now()

                    time_diff = (end_time - start_time).seconds

                    time_usage = '{:3}m{:3}s'.format(int(time_diff / 60), time_diff % 60)

                    msg = "Step {:5}, Loss:{:6.2f}, Accuracy:{:8.2%}, Time usage:{:9}."

                    print(msg.format(steps, loss, accuracy, time_usage))

                steps += 1

        test_loss = 0.

        test_correct = 0

        for data, label in self.test:

            data, label = Variable(data.cpu()), Variable(label.cpu())

            if self.model == "LSTM":

                data = data.view(-1, 28, 28)

            outputs = self.net(data)

            loss = self.criterion(outputs, label)

            test_loss += loss * Config.batch_size

            _, predicted = torch.max(outputs, 1)

            correct = int(sum(predicted == label))

            test_correct += correct

        accuracy = test_correct / len(self.test.dataset)

        loss = test_loss / len(self.test.dataset)

        print("Test Loss: {:5.2f}, Accuracy: {:6.2%}".format(loss, accuracy))

        end_time = datetime.now()

        time_diff = (end_time - start_time).seconds

        print("Time Usage: {:5.2f} mins.".format(time_diff / 60.))

if __name__ == "__main__":

    p = TrainProcess(model='CNN')

    p.train_step()

Peace~~

基于PyTorch实现MNIST手写字识别的更多相关文章

基于tensorflow的MNIST手写识别
这个例子,是学习tensorflow的人员通常会用到的,也是基本的学习曲线中的一环.我也是! 这个例子很简单,这里,就是简单的说下,不同的tensorflow版本,相关的接口函数,可能会有不一样哟.在 ...
基于tensorflow实现mnist手写识别（多层神经网络）
标题党其实也不多,一个输入层,三个隐藏层,一个输出层老样子先上代码导入mnist的路径很长,现在还记不住 import tensorflow as tf import tensorflow.exa ...
基于tensorflow的MNIST手写数字识别（二）--入门篇
http://www.jianshu.com/p/4195577585e6 基于tensorflow的MNIST手写字识别(一)--白话卷积神经网络模型基于tensorflow的MNIST手写数字识 ...
基于TensorFlow的MNIST手写数字识别-初级
一:MNIST数据集下载地址 MNIST是一个包含很多手写数字图片的数据集,一共4个二进制压缩文件分别是test set images,test set labels,training se ...
Tensorflow之基于MNIST手写识别的入门介绍
Tensorflow是当下AI热潮下,最为受欢迎的开源框架.无论是从Github上的fork数量还是star数量,还是从支持的语音,开发资料,社区活跃度等多方面,他当之为superstar. 在前面介 ...
用TensorFlow教你手写字识别
博主原文链接:用TensorFlow教你做手写字识别(准确率94.09%) 如需转载,请备注出处及链接,谢谢. 2012 年,Alex Krizhevsky, Geoff Hinton, and Il ...
Tensorflow编程基础之Mnist手写识别实验+关于cross_entropy的理解
好久没有静下心来写点东西了,最近好像又回到了高中时候的状态,休息不好,无法全心学习,恶性循环,现在终于调整的好一点了,听着纯音乐突然非常伤感,那些曾经快乐的大学时光啊,突然又慢慢的一下子出现在了眼前, ...
tensorflow笔记（四）之MNIST手写识别系列一
tensorflow笔记(四)之MNIST手写识别系列一版权声明:本文为博主原创文章,转载请指明转载地址 http://www.cnblogs.com/fydeblog/p/7436310.html ...
tensorflow笔记（五）之MNIST手写识别系列二
tensorflow笔记(五)之MNIST手写识别系列二版权声明:本文为博主原创文章,转载请指明转载地址 http://www.cnblogs.com/fydeblog/p/7455233.html ...

随机推荐

[考试反思]1024csp-s模拟测试86：消耗
%%%两个没素质的和一个萌两小时AK 最近貌似总是可以比较快速的拿下T1,然后T2打到考试结束... T1是套路题没什么好说的. T2是一个比较蠢的博弈题,我花了很长时间干各种乱七八糟的事什么打表啊 ...
游戏辅助外gua篇：如何Dump内存获得游戏的辅助
转载请标明出处: https://dujinyang.blog.csdn.net/article/category/9267855 本文出自:[奥特曼超人的博客] 本篇邀请了 "阿七&quo ...
NOIP 模拟17
最近状态有些不对劲,总是出现各种各样的小错误...... 这次可以说是很水的一套题(T3神仙题除外),T1就是一个优化的暴力,考场上打了一个n的四次方的程序,在距考试结束还有5分钟的时候猜想出来正解, ...
Python基础学习（一）之Python的概述与环境安装
Python介绍 Python语言介绍 Python是一门高级的.面向对象的.解释性.脚本语言. 高级语言:贴近开发者,对应底层语言,底层语言贴近机器:java.C#.php .ruby 面向对象对应 ...
生活问题 | 对华为畅玩手机5X进行升级
步骤一:准备一张SD卡,建议使用Sandisk, Kingstone, 或Kingmax,大小建议在2G KIW-AL10C00B258 软件版本升级指导书 Secret 2016-11-25 Hu ...
jquery写$ document.getElementById效果
jquery写$ document.getElementById效果<pre>document.getElementById('video-canvas')和$('#video-canva ...
[视频演示].NET Core开发的iNeuOS物联网平台，实现从设备&PLC、云平台、移动APP数据链路闭环
目录 1. 概述... 1 2. 登陆信息... 2 3. 设备驱动... 3 4. 组态建模... 3 5. 手机APP. 5 6. ...
深入理解计算机系统第三章程序的机器级表示 Part1 第二遍
第一遍对应笔记链接 https://www.cnblogs.com/stone94/p/9905345.html 机器级代码计算机系统使用了多种不同形式的抽象,利用更简单的抽象模型来隐藏实现的细节. ...
C# V: 读取XML文件
在C#中读取XML有LINQ版本和非LINQ版本. LINQ版本: // Loading from a file, you can also load from a stream var xml = ...
bash6——循环
for fruit in apple orange pear #写死 do each ${fruit}s done fruits="apple orange pear" #输入变量 ...

基于PyTorch实现MNIST手写字识别

完整代码

基于PyTorch实现MNIST手写字识别的更多相关文章

随机推荐

热门专题