用pytorch做手写数字识别，识别l率达97.8%

pytorch做手写数字识别

效果如下：

工程目录如下

第一步数据获取

下载MNIST库，这个库在网上，执行下面代码自动下载到当前data文件夹下

from torchvision.datasets import MNIST

import torchvision

mnist = MNIST(root='./data',train=True,download=True)

print(mnist)

print(mnist[0])

print(len(mnist))

img = mnist[0][0]

img.show()

dataset.py文件，读取数据并做预处理

'''

准备数据集

'''

import torch

from torch.utils.data import DataLoader

from torchvision.datasets import MNIST

import torchvision

def mnist_dataset(train):

    func = torchvision.transforms.Compose([

        torchvision.transforms.ToTensor(),

        torchvision.transforms.Normalize(mean=(0.1307,),std=(0.3081,))

    ])

    #1.准备Mnist数据集

    return MNIST(root='./data',train=train,download=False,transform=func)

def get_dataloader(train = True):

    mnist = mnist_dataset(train)

    return DataLoader(mnist,batch_size=128,shuffle=True)

if __name__ == '__main__':

    for (images,labels) in get_dataloader():

        print(images.size())

        print(labels.size())

        break

models.py文件，定义训练的模型类

'''

定义模型

'''

import torch.nn as  nn

import torch.nn.functional as F

class MnistModel(nn.Module):

    def __init__(self):

        super(MnistModel,self).__init__()

        self.fc1 = nn.Linear(1*28*28,100)

        self.fc2 = nn.Linear(100,10)

    def forward(self,image):

        image_viewd = image.view(-1,1*28*28) #[batch_size,1*28*28]

        fc1_out = self.fc1(image_viewd) #[batch_size,100]

        fc1_out_relu = F.relu(fc1_out) #[batch_size,100]

        out = self.fc2(fc1_out_relu) #[batch_size,10]

        return F.log_softmax(out,dim=-1)  #带权损失计算交叉熵

cong.py文件，定义一些常亮，设置使用cpu还是GPU　　

'''

项目配置

'''

import torch

train_batch_size = 128

test_batch_size = 100

device = torch.device("cuda" if torch.cuda.is_available() else "cpu")

train.py文件，模型训练文件，保存模型

"""

进行模型的训练

"""

from dataset import get_dataloader

from models import MnistModel

from torch import optim

import torch.nn.functional as F

import conf

from tqdm import tqdm

import numpy as np

import torch

import os

from test import eval

#1. 实例化模型，优化器，损失函数

model = MnistModel().to(conf.device)

optimizer = optim.Adam(model.parameters(),lr=1e-3)

#2. 进行循环，进行训练

def train(epoch):

    train_dataloader = get_dataloader(train=True)

    bar = tqdm(enumerate(train_dataloader),total=len(train_dataloader))

    total_loss = []

    for idx,(input,target) in bar:

        input = input.to(conf.device)

        target = target.to(conf.device)

        #梯度置为0

        optimizer.zero_grad()

        #计算得到预测值

        output = model(input)

        #得到损失

        loss = F.nll_loss(output,target)

        #反向传播，计算损失

        loss.backward()

        total_loss.append(loss.item())

        #参数的更新

        optimizer.step()

        #打印数据

        if idx%10 ==0 :

            bar.set_description_str("epcoh:{} idx:{},loss:{:.6f}".format(epoch,idx,np.mean(total_loss)))

            torch.save(model.state_dict(),"./models/model.pkl")

            torch.save(optimizer.state_dict(),"./models/optimizer.pkl")

if __name__ == '__main__':

    for i in range(10):

        train(i)

        eval()

test.py文件，模型测试文件，测试模型准确率　　

'''

进行模型评估

'''

from dataset import get_dataloader

from models import MnistModel

from torch import optim

import torch.nn.functional as F

import conf

from tqdm import tqdm

import numpy as np

import torch

import os

def eval():

    #实例化模型，优化器，损失函数

    model = MnistModel().to(conf.device)

    if os.path.exists("./models/model.pkl"):

        model.load_state_dict(torch.load("./models/model.pkl"))

    test_dataloader = get_dataloader(train=False)

    total_loss = []

    total_acc = []

    with torch.no_grad():

        for input, target in test_dataloader:  # 2. 进行循环，进行训练

            input = input.to(conf.device)

            target = target.to(conf.device)

            # 计算得到预测值

            output = model(input)

            # 得到损失

            loss = F.nll_loss(output, target)

            # 反向传播，计算损失

            total_loss.append(loss.item())

            # 计算准确率

            ###计算预测值

            pred = output.max(dim=-1)[-1]

            total_acc.append(pred.eq(target).float().mean().item())

    print("test loss:{},test acc:{}".format(np.mean(total_loss), np.mean(total_acc)))

# if __name__ == '__main__':

#     # for i in range(10):

#     #     train(i)

#     eval()

用pytorch做手写数字识别，识别l率达97.8%的更多相关文章

【转】机器学习教程十四-利用tensorflow做手写数字识别
模式识别领域应用机器学习的场景非常多,手写识别就是其中一种,最简单的数字识别是一个多类分类问题,我们借这个多类分类问题来介绍一下google最新开源的tensorflow框架,后面深度学习的内容都会基 ...
用Keras搭建神经网络简单模版（三）—— CNN 卷积神经网络（手写数字图片识别）
# -*- coding: utf-8 -*- import numpy as np np.random.seed(1337) #for reproducibility再现性 from keras.d ...
opencv实现KNN手写数字的识别
人工智能是当下很热门的话题,手写识别是一个典型的应用.为了进一步了解这个领域,我阅读了大量的论文,并借助opencv完成了对28x28的数字图片(预处理后的二值图像)的识别任务. 预处理一张图片: 首 ...
pytorch CNN 手写数字识别
一个被放弃的入门级的例子终于被我实现了,虽然还不太完美,但还是想记录下 1.预处理相比较从库里下载数据集(关键是经常失败,格式也看不懂),更喜欢直接拿图片,从网上找了半天,最后从CSDN上下载了一个 ...
caffe+opencv3.3dnn模块完成手写数字图片识别
最近由于项目需要用到caffe,学习了下caffe的用法,在使用过程中也是遇到了些问题,通过上网搜索和问老师的方法解决了,在此记录下过程,方便以后查看,也希望能为和我一样的新手们提供帮助. 顺带附上老 ...
用tensorflow求手写数字的识别准确率（简单版）
import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data #载入数据集 mnist = in ...
吴裕雄 python神经网络手写数字图片识别（5）
import kerasimport matplotlib.pyplot as pltfrom keras.models import Sequentialfrom keras.layers impo ...
用Keras搭建神经网络简单模版（四）—— RNN Classifier 循环神经网络（手写数字图片识别）
# -*- coding: utf-8 -*- import numpy as np np.random.seed(1337) from keras.datasets import mnist fro ...
吴裕雄 python 神经网络——TensorFlow 卷积神经网络手写数字图片识别
import os import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data INPUT_N ...

随机推荐

【LeetCode】141.环形链表
题目描述 141.环形链表给定一个链表,判断链表中是否有环. 为了表示给定链表中的环,我们使用整数 pos 来表示链表尾连接到链表中的位置(索引从 0 开始). 如果 pos 是 -1,则在该链表中 ...
CentOS7配置环境变量
执行命令env查看当前环境变量: [duanyongchun@192 3DUnetCNN]$ env 例如扩展环境变量为/tmp/bin: PATH=$PATH:/tmp/bin 查看特定环境变量命令 ...
Maximum splitting
Maximum splitting You are given several queries. In the i-th query you are given a single positive i ...
【tensorflow2.0】处理文本数据
一,准备数据 imdb数据集的目标是根据电影评论的文本内容预测评论的情感标签. 训练集有20000条电影评论文本,测试集有5000条电影评论文本,其中正面评论和负面评论都各占一半. 文本数据预处理较为 ...
stm32：简单按键输入实现
开发环境keil4,芯片STM32F103C8T6 1.main.c //串口实验 #include "sys.h" #include "delay.h" #i ...
Appium自动化（2） - appium环境安装常见问题的解决方案
如果你还想从头学起Appium,可以看看这个系列的文章哦! https://www.cnblogs.com/poloyy/category/1693896.html 问题1:adb检测不到设备解决 ...
1065 A+B and C (64bit) (20分)(水)
Given three integers A, B and C in [−], you are supposed to tell whether A+B>C. Input Specificati ...
shell查询目标jvm的perm占比
#查询指定进程号下面的方法区使用率,jdk1.7是perm,jdk1.8是metaspace function get_perm_use_percent() { pid="$1" ...
HttpClient来自官方的JSON扩展方法
System.Net.Http.Json Json的序列化和反序列化是我们日常常见的操作,通过System.Net.Http.Json我们可以用少量的代码实现上述操作.正如在github设计文档中所描 ...
01 微信小程序创建组件和使用组件
01 创建组件遇见的困难图标显示不出来,是因为你没有在组件的css中引入,所以显示不出来. 我一直以为是一个坑.结果是自己没有整清楚 01==>在page的同级目录下,创建一个文件夹,命名为 ...

用pytorch做手写数字识别，识别l率达97.8%

用pytorch做手写数字识别，识别l率达97.8%的更多相关文章

随机推荐

热门专题