Task7.手写数字识别

用PyTorch完成手写数字识别

 import numpy as np

 import torch

 from torch import nn, optim

 import torch.nn.functional as F

 from torch.autograd import Variable

 from torch.utils.data import DataLoader

 from torchvision import transforms

 from torchvision import datasets

 batch_size = 128

 learning_rate = 0.01

 num_epoch = 10

 # 实例化MNIST数据集对象

 train_data = datasets.MNIST('./dataset', train=True, transform=transforms.ToTensor(), download=True)

 test_data = datasets.MNIST('./dataset', train=False, transform=transforms.ToTensor(), download=True)

 # train_loader：以batch_size大小的样本组为单位的可迭代对象

 train_loader = DataLoader(train_data, batch_size, shuffle=True)

 test_loader = DataLoader(test_data)

 class CNN(nn.Module):

     def __init__(self, in_dim, out_dim):

         super(CNN, self).__init__()

         self.conv1 = nn.Conv2d(in_dim, 6, 3, stride=1, padding=1)

         self.batch_norm1 = nn.BatchNorm2d(6)

         self.relu = nn.ReLU(True)

         self.conv2 = nn.Conv2d(6, 16, 5, stride=1, padding=0)

         self.pool = nn.MaxPool2d(2, 2)

         self.batch_norm2 = nn.BatchNorm2d(16)

         self.fc1 = nn.Linear(400, 120)

         self.fc2 = nn.Linear(120, 84)

         self.fc3 = nn.Linear(84, out_dim)

     def forward(self, x):

         x = self.batch_norm1(self.conv1(x))

         x = F.relu(x)

         x = self.pool(x)

         x = self.batch_norm2(self.conv2(x))

         x = self.relu(x)

         x = self.pool(x)

         x = x.view(x.size(0), -1)

         x = F.relu(self.fc1(x))

         x = F.relu(self.fc2(x))

         x = self.fc3(x)

         return x

     def print_model_name(self):

         print("Model Name: CNN")

 class Cnn(nn.Module):

     def __init__(self, in_dim, n_class):

         super(Cnn, self).__init__()

         self.conv = nn.Sequential(

             nn.Conv2d(in_dim, 6, 3, stride=1, padding=1),

             nn.ReLU(True),

             nn.MaxPool2d(2, 2),

             nn.Conv2d(6, 16, 5, stride=1, padding=0),

             nn.ReLU(True),

             nn.MaxPool2d(2, 2))

         self.fc = nn.Sequential(

             nn.Linear(400, 120), nn.Linear(120, 84), nn.Linear(84, n_class))

     def forward(self, x):

         # print(x.size()) torch.Size([1024, 1, 28, 28])

         out = self.conv(x)

         out = out.view(out.size(0), -1)

         # print(out.size()) = torch.Size([1024, 400])

         out = self.fc(out)

         # print(out.size()) torch.Size([1024, 10])

         return out

     def print_model_name(self):

         print("Model Name: Cnn")

 isGPU = torch.cuda.is_available()

 print(isGPU)

 model = CNN(1, 10)

 if isGPU:

     model = model.cuda()

 criterion = nn.CrossEntropyLoss()

 optimizer = optim.SGD(model.parameters(), lr=learning_rate)

 for epoch in range(num_epoch):

     running_acc = 0.0

     running_loss = 0.0

     for i, data in enumerate(train_loader, 1): # train_loader：以batch_size大小的样本组为单位的可迭代对象

         img, label = data

         img = Variable(img)

         label = Variable(label)

         if isGPU:

             img = img.cuda()

             label = label.cuda()

         # forward

         out = model(img)

         loss = criterion(out, label)

         # print(label)

         # backward

         optimizer.zero_grad()

         loss.backward()

         optimizer.step()

         _, pred = torch.max(out, dim=1)  # 按维度dim 返回最大值

         running_loss += loss.item()*label.size(0)

         current_num = (pred == label).sum() # variable

         acc = (pred == label).float().mean()        # variable

         running_acc += current_num.item()

         if i % 100 == 0:

             print("epoch: {}/{}, loss: {:.6f}, running_acc: {:.6f}"

                   .format(epoch+1, num_epoch, loss.item(), acc.item()))

     print("epoch: {}, loss: {:.6f}, accuracy: {:.6f}".format(epoch+1, running_loss, running_acc/len(train_data)))

 model.eval()

 current_num = 0

 for i , data in enumerate(test_loader, 1):

     img, label = data

     if isGPU:

         img = img.cuda()

         label = label.cuda()

     with torch.no_grad():

         img = Variable(img)

         label = Variable(label)

     out = model(img)

     _, pred = torch.max(out, 1)

     current_num += (pred == label).sum().item()

 print("Test result: accuracy: {:.6f}".format(float(current_num/len(test_data))))

 torch.save(model.state_dict(), './cnn.pth') # 保存模型

Task7.手写数字识别的更多相关文章

C#中调用Matlab人工神经网络算法实现手写数字识别
手写数字识别实现设计技术参数:通过由数字构成的图像,自动实现几个不同数字的识别,设计识别方法,有较高的识别率关键字:二值化投影矩阵目标定位 Matlab 手写数字图像识别简介: 手写 ...
CNN 手写数字识别
1. 知识点准备在了解 CNN 网络神经之前有两个概念要理解,第一是二维图像上卷积的概念,第二是 pooling 的概念. a. 卷积关于卷积的概念和细节可以参考这里,卷积运算有两个非常重要特性, ...
【深度学习系列】PaddlePaddle之手写数字识别
上周在搜索关于深度学习分布式运行方式的资料时,无意间搜到了paddlepaddle,发现这个框架的分布式训练方案做的还挺不错的,想跟大家分享一下.不过呢,这块内容太复杂了,所以就简单的介绍一下padd ...
【深度学习系列】手写数字识别卷积神经--卷积神经网络CNN原理详解(一)
上篇文章我们给出了用paddlepaddle来做手写数字识别的示例,并对网络结构进行到了调整,提高了识别的精度.有的同学表示不是很理解原理,为什么传统的机器学习算法,简单的神经网络(如多层感知机)都可 ...
机器学习（二）-kNN手写数字识别
一.kNN算法是机器学习的入门算法,其中不涉及训练,主要思想是计算待测点和参照点的距离,选取距离较近的参照点的类别作为待测点的的类别. 1,距离可以是欧式距离,夹角余弦距离等等. 2,k值不能选择太大 ...
利用神经网络算法的C＃手写数字识别
欢迎大家前往云+社区,获取更多腾讯海量技术实践干货哦~ 下载Demo - 2.77 MB (原始地址):handwritten_character_recognition.zip 下载源码 - 70. ...
Android+TensorFlow+CNN+MNIST 手写数字识别实现
Android+TensorFlow+CNN+MNIST 手写数字识别实现 SkySeraph 2018 Email:skyseraph00#163.com 更多精彩请直接访问SkySeraph个人站 ...
深度学习之 mnist 手写数字识别
深度学习之 mnist 手写数字识别开始学习深度学习,先来一个手写数字的程序 import numpy as np import os import codecs import torch from ...
手写数字识别 ----在已经训练好的数据上根据28*28的图片获取识别概率（基于Tensorflow,Python）
通过: 手写数字识别 ----卷积神经网络模型官方案例详解(基于Tensorflow,Python) 手写数字识别 ----Softmax回归模型官方案例详解(基于Tensorflow,Pytho ...

随机推荐

Delphi XE2 之 FireMonkey 入门(32) - 数据绑定: TBindingsList: TBindList、TBindPosition [未完成...]
Delphi XE2 之 FireMonkey 入门(32) - 数据绑定: TBindingsList: TBindList.TBindPosition [未完成...] //待补...
阶段3 1.Mybatis_08.动态SQL_01.mybatis中的动态sql语句-if标签
创建新的工程复制到新建的项目里面 pom.xml依赖部分复制过来 dao中整理代码只保留四个查询映射文件也只保留四个查询方法增加一个根据条件查询的方法. 由于用了别名,所以parpameter ...
中国MOOC_面向对象程序设计——Java语言_第2周对象交互_1有秒计时的数字时钟
第2周编程题查看帮助返回第2周编程题,在课程所给的时钟程序的基础上修改依照学术诚信条款,我保证此作业是本人独立完成的. 温馨提示: 1.本次作业属于Online Judge题目,提交后由系 ...
学用 TStringGrid [6] - Options
本例运行效果图: 一般修改 TStringGrid 的 Options 直接在设计时选一下 True 或 False 就行了; 代码中可以像下面操作: StringGrid1.Options := ...
spring（二） AOP注入
AOP概念 l AOP采取横向抽取机制,取代了传统纵向继承体系重复性代码 l 经典应用:事务管理.性能监视.安全检查.缓存 .日志等 l Spring AOP使用纯Java实现,不需要专门的编译 ...
【转载】PHP中foreach的用法
http://www.php.cn/php-weizijiaocheng-399438.html 很好用的PHP中foreach的用法详解,收藏!
【Qt开发】【Linux开发】调试记录：QFontDatabase::loadFromCache Error
最近做嵌入式的Qt界面,在移植成功后遇到了一个问题:QFontDatabase::loadFromCache: Font path doesn't match.后面跟着便是两个路径. 解决方案就是对比 ...
SCUT - 484 - 平面上的点 - 数据结构
https://scut.online/p/484 一开始想的是按固定斜率的直线从无穷扫下来,但是一直都WA,不知道是哪里错了还是精度问题? #include<bits/stdc++.h> ...
asp.net table表格表头及列固定实现
http://blog.csdn.net/zdw_wym/article/details/48630337 在开发中常会遇到table表格中列特别多,下拉后,表头就看不见了,水平滚动后,第1.2列就看 ...
Xdex（百度版）脱壳工具基本原理
[原创]Xdex(百度版)脱壳工具基本原理作者: sherrydl时间: 2015-12-13,10:52:45链接: http://bbs.pediy.com/showthread.php?t ...

Task7.手写数字识别

Task7.手写数字识别的更多相关文章

随机推荐

热门专题