基于PyTorch实现MNIST手写字识别

本篇不涉及模型原理，只是分享下代码。想要了解模型原理的可以去看网上很多大牛的博客。

目前代码实现了CNN和LSTM两个网络，整个代码分为四部分：

Config：项目中涉及的参数；
CNN：卷积神经网络结构；
LSTM：长短期记忆网络结构；
TrainProcess：

模型训练及评估，参数model控制训练何种模型（CNN or LSTM）。

完整代码

—Talk is cheap, show me the code.

# -*- coding: utf-8 -*-

# @author: Awesome_Tang

# @date: 2019-04-05

# @version: python3.7

import torch

from torchvision import datasets, transforms

import torch.nn as nn

import torch.optim as optim

from torch.autograd import Variable

from datetime import datetime

class Config:

    batch_size = 64

    epoch = 10

    alpha = 1e-3

    print_per_step = 100  # 控制输出

class CNN(nn.Module):

    def __init__(self):

        super(CNN, self).__init__()

        """

        Conv2d参数：

        第一位：input channels  输入通道数

        第二位：output channels 输出通道数

        第三位：kernel size 卷积核尺寸

        第四位：stride 步长，默认为1

        第五位：padding size 默认为0，不补

        """

        self.conv1 = nn.Sequential(

            nn.Conv2d(1, 32, 3, 1, 2),

            nn.ReLU(),

            nn.MaxPool2d(2, 2)

        )

        self.conv2 = nn.Sequential(

            nn.Conv2d(32, 64, 5),

            nn.ReLU(),

            nn.MaxPool2d(2, 2)

        )

        self.fc1 = nn.Sequential(

            nn.Linear(64 * 5 * 5, 128),

            nn.BatchNorm1d(128),

            nn.ReLU()

        )

        self.fc2 = nn.Sequential(

            nn.Linear(128, 64),

            nn.BatchNorm1d(64),  # 加快收敛速度的方法（注：批标准化一般放在全连接层后面，激活函数层的前面）

            nn.ReLU()

        )

        self.fc3 = nn.Linear(64, 10)

    def forward(self, x):

        x = self.conv1(x)

        x = self.conv2(x)

        x = x.view(x.size()[0], -1)

        x = self.fc1(x)

        x = self.fc2(x)

        x = self.fc3(x)

        return x

class LSTM(nn.Module):

    def __init__(self):

        super(LSTM, self).__init__()

        self.lstm = nn.LSTM(

            input_size=28,

            hidden_size=64,

            num_layers=1,

            batch_first=True,

        )

        self.output = nn.Linear(64, 10)

    def forward(self, x):

        r_out, (_, _) = self.lstm(x, None)

        out = self.output(r_out[:, -1, :])

        return out

class TrainProcess:

    def __init__(self, model="CNN"):

        self.train, self.test = self.load_data()

        self.model = model

        if self.model == "CNN":

            self.net = CNN()

        elif self.model == "LSTM":

            self.net = LSTM()

        else:

            raise ValueError('"CNN" or "LSTM" is expected, but received "%s".' % model)

        self.criterion = nn.CrossEntropyLoss()  # 定义损失函数

        self.optimizer = optim.Adam(self.net.parameters(), lr=Config.alpha)

    @staticmethod

    def load_data():

        print("Loading Data......")

        """加载MNIST数据集，本地数据不存在会自动下载"""

        train_data = datasets.MNIST(root='./data/',

                                    train=True,

                                    transform=transforms.ToTensor(),

                                    download=True)

        test_data = datasets.MNIST(root='./data/',

                                   train=False,

                                   transform=transforms.ToTensor())

        # 返回一个数据迭代器

        # shuffle：是否打乱顺序

        train_loader = torch.utils.data.DataLoader(dataset=train_data,

                                                   batch_size=Config.batch_size,

                                                   shuffle=True)

        test_loader = torch.utils.data.DataLoader(dataset=test_data,

                                                  batch_size=Config.batch_size,

                                                  shuffle=False)

        return train_loader, test_loader

    def train_step(self):

        steps = 0

        start_time = datetime.now()

        print("Training & Evaluating based on '%s'......" % self.model)

        for epoch in range(Config.epoch):

            print("Epoch {:3}.".format(epoch + 1))

            for data, label in self.train:

                data, label = Variable(data.cpu()), Variable(label.cpu())

                # LSTM输入为3维，CNN输入为4维

                if self.model == "LSTM":

                    data = data.view(-1, 28, 28)

                self.optimizer.zero_grad()  # 将梯度归零

                outputs = self.net(data)  # 将数据传入网络进行前向运算

                loss = self.criterion(outputs, label)  # 得到损失函数

                loss.backward()  # 反向传播

                self.optimizer.step()  # 通过梯度做一步参数更新

                # 每100次打印一次结果

                if steps % Config.print_per_step == 0:

                    _, predicted = torch.max(outputs, 1)

                    correct = int(sum(predicted == label))  # 计算预测正确个数

                    accuracy = correct / Config.batch_size  # 计算准确率

                    end_time = datetime.now()

                    time_diff = (end_time - start_time).seconds

                    time_usage = '{:3}m{:3}s'.format(int(time_diff / 60), time_diff % 60)

                    msg = "Step {:5}, Loss:{:6.2f}, Accuracy:{:8.2%}, Time usage:{:9}."

                    print(msg.format(steps, loss, accuracy, time_usage))

                steps += 1

        test_loss = 0.

        test_correct = 0

        for data, label in self.test:

            data, label = Variable(data.cpu()), Variable(label.cpu())

            if self.model == "LSTM":

                data = data.view(-1, 28, 28)

            outputs = self.net(data)

            loss = self.criterion(outputs, label)

            test_loss += loss * Config.batch_size

            _, predicted = torch.max(outputs, 1)

            correct = int(sum(predicted == label))

            test_correct += correct

        accuracy = test_correct / len(self.test.dataset)

        loss = test_loss / len(self.test.dataset)

        print("Test Loss: {:5.2f}, Accuracy: {:6.2%}".format(loss, accuracy))

        end_time = datetime.now()

        time_diff = (end_time - start_time).seconds

        print("Time Usage: {:5.2f} mins.".format(time_diff / 60.))

if __name__ == "__main__":

    p = TrainProcess(model='CNN')

    p.train_step()

Peace~~

基于PyTorch实现MNIST手写字识别的更多相关文章

基于tensorflow的MNIST手写识别
这个例子,是学习tensorflow的人员通常会用到的,也是基本的学习曲线中的一环.我也是! 这个例子很简单,这里,就是简单的说下,不同的tensorflow版本,相关的接口函数,可能会有不一样哟.在 ...
基于tensorflow实现mnist手写识别（多层神经网络）
标题党其实也不多,一个输入层,三个隐藏层,一个输出层老样子先上代码导入mnist的路径很长,现在还记不住 import tensorflow as tf import tensorflow.exa ...
基于tensorflow的MNIST手写数字识别（二）--入门篇
http://www.jianshu.com/p/4195577585e6 基于tensorflow的MNIST手写字识别(一)--白话卷积神经网络模型基于tensorflow的MNIST手写数字识 ...
基于TensorFlow的MNIST手写数字识别-初级
一:MNIST数据集下载地址 MNIST是一个包含很多手写数字图片的数据集,一共4个二进制压缩文件分别是test set images,test set labels,training se ...
Tensorflow之基于MNIST手写识别的入门介绍
Tensorflow是当下AI热潮下,最为受欢迎的开源框架.无论是从Github上的fork数量还是star数量,还是从支持的语音,开发资料,社区活跃度等多方面,他当之为superstar. 在前面介 ...
用TensorFlow教你手写字识别
博主原文链接:用TensorFlow教你做手写字识别(准确率94.09%) 如需转载,请备注出处及链接,谢谢. 2012 年,Alex Krizhevsky, Geoff Hinton, and Il ...
Tensorflow编程基础之Mnist手写识别实验+关于cross_entropy的理解
好久没有静下心来写点东西了,最近好像又回到了高中时候的状态,休息不好,无法全心学习,恶性循环,现在终于调整的好一点了,听着纯音乐突然非常伤感,那些曾经快乐的大学时光啊,突然又慢慢的一下子出现在了眼前, ...
tensorflow笔记（四）之MNIST手写识别系列一
tensorflow笔记(四)之MNIST手写识别系列一版权声明:本文为博主原创文章,转载请指明转载地址 http://www.cnblogs.com/fydeblog/p/7436310.html ...
tensorflow笔记（五）之MNIST手写识别系列二
tensorflow笔记(五)之MNIST手写识别系列二版权声明:本文为博主原创文章,转载请指明转载地址 http://www.cnblogs.com/fydeblog/p/7455233.html ...

随机推荐

使用memset初始化int数组
memset()是一个来自于string库的函数,正规用法是初始化char类型的数组.因为char类型只占1个字节,memset按字节赋值后,会将char类型数组的所有元素变为你指定的值.但是4字节的 ...
MYSQL5.7修改密码强度策略
---恢复内容开始--- 在MySQL5.6.6之后,ORACLE更新了mysql密码强度必须要使用大小写数字符号来设置密码,但是有时候这样还是很不方便的.所以记录一篇如何修改mysql密码强度的博文 ...
raw文件转mha文件
raw格式在体数据(volume)中,经常会遇到raw文件,raw文件就是其实就是所有体素组成的文件,raw文件必须还有一些描信息才能用(因为得知道数据的size,type,spacing等),就像 ...
flask-sqlalchemy 迁移数据（生成数据库表）与查询数据
1, 生成表 db.Model主要用于数据库的增删改查操作, 构建表交给db.Table完成安装 pip install flask-migrate from datetime import dat ...
php ffmpeg视频和序列帧转化
php ffmpeg视频和序列帧转化 <pre>$cmd=shell_exec("ffmpeg -i ".__DIR__ . "/shipin1.mp4 -r ...
java中的线程安全
在Java中,线程的安全实际上指的是内存的安全,这是由操作系统决定的. 目前主流的操作系统都是多任务的,即多个进程同时运行.为了保证安全,每个进程只能访问分配给自己的内存空间,而不能访问别的.分配给别 ...
echo -e的扩展应用之颜色控制输出（字体+背景）
echo -e 输出带颜色字体或者背景用法:example: echo -e "\033[41;36m something here \033[0m" 其中41的位置代表底色, 3 ...
js的split()和join()的用法
split() 方法用于把一个字符串分割成字符串数组.split[splɪt]:vt. 分离:使分离:劈开:离开:分解 stringObject.split(separator,howmany) se ...
C语言|博客作业06
这个作业属于哪个课程 C语言程序设计II 这个作业的要求在哪里 https://edu.cnblogs.com/campus/zswxy/CST2019-1/homework/9885 我在这个课程的 ...
JAVA继承中子父类的构造方法
首先,构造方法本身会有一个隐式的无参构造(默认): ①不写构造方法,类中的第一行代码事实上有一个默认的无参构造(系统会隐式为你写好) public class Student { private St ...

基于PyTorch实现MNIST手写字识别

完整代码

基于PyTorch实现MNIST手写字识别的更多相关文章

随机推荐

热门专题