卷积神经网络CNN实战：MINST手写数字识别—

数据集下载

这一部分比较简单，就不过多赘述了，把代码粘贴到自己的项目文件里，运行一下就可以下载了。

from torchvision import datasets, transforms

# 定义数据转换，将数据转换为张量并进行标准化

transform = transforms.Compose([

    transforms.ToTensor(),  # 转换为张量

    transforms.Normalize((0.5,), (0.5,))  # 标准化

])

# 下载和加载训练集

train_data = datasets.MNIST(root='./data', train=True, download=True, transform=transform)

# 下载和加载测试集

test_data = datasets.MNIST(root='./data', train=False, download=True, transform=transform)

该代码运行效果如下图：

下载好的数据集可以将其中的图片保存，这里给出两个代码，分别采用matplotlib库和opencv库进行可视化和保存

# matplotlib

from torchvision import datasets, transforms

import matplotlib.pyplot as plt

import os

# 创建保存图片的文件夹

os.makedirs('mnist_images', exist_ok=True)

# 定义数据转换（转换为Tensor）

transform = transforms.Compose([

    transforms.ToTensor()

])

# 下载 MNIST 数据集

dataset = datasets.MNIST(root='./data', train=True, transform=transform, download=True)

# 获取前100张图片

for i in range(100):

    image, _ = dataset[i]

    image = image.squeeze()  # 去掉单通道维度

    plt.imshow(image, cmap='gray')

    plt.axis('off')  # 不显示坐标轴

    plt.savefig(f'mnist_images/image_{i+1}.png', bbox_inches='tight', pad_inches=0)

print("前 100 张图片已保存为 PNG 文件")

# opencv

import cv2

import numpy as np

from torchvision import datasets, transforms

import os

# 创建保存图片的文件夹

os.makedirs('mnist_images', exist_ok=True)

# 定义数据转换（转换为Tensor）

transform = transforms.Compose([

    transforms.ToTensor()

])

# 下载 MNIST 数据集

dataset = datasets.MNIST(root='./data', train=True, transform=transform, download=True)

# 获取前100张图片

for i in range(100):

    image, _ = dataset[i]

    image = image.squeeze().numpy()  # 去掉单通道维度，并转换为 numpy 数组

    # OpenCV 需要图像的范围在 0 到 255 之间

    image = (image * 255).astype(np.uint8)

    # 保存图像

    cv2.imwrite(f'mnist_images/image_{i+1}.png', image)

# 可选：显示图像

cv2.imshow('image_1', image)

cv2.waitKey(0)

cv2.destroyAllWindows()

# 如果你启用了显示图像的功能，记得在最后调用以下代码：

cv2.destroyAllWindows()

网络训练

该代码运行效果如下图

import torch

'''=============== 数据集部分 ==============='''

# 定义数据转换

import torchvision.transforms as transforms

transform = transforms.Compose([

    transforms.ToTensor(),

    transforms.Normalize((0.5,), (0.5,))

])

# 打开已经下载的训练集和测试集

from torchvision.datasets import MNIST

train_dataset = MNIST(root='./data', train=True, download=False, transform=transform)

test_dataset = MNIST(root='./data', train=False, download=False, transform=transform)

# 创建数据加载器

batch_size = 256

from torch.utils.data import random_split

from torch.utils.data import DataLoader

# 将数据集分割为6000和剩余的数据

train_size = 6000

train_subset, _ = random_split(train_dataset, [train_size, len(train_dataset) - train_size])

train_loader = DataLoader(dataset=train_subset, batch_size=batch_size, shuffle=True)

test_loader = DataLoader(dataset=test_dataset, batch_size=batch_size, shuffle=False)

'''=============== 网络定义 ==============='''

# 初始化网络

from net import CNN

net = CNN()

# 初始化优化器、学习率调整器、评价函数

import torch.nn as nn

from torch import optim

learning_rate = 0.001 # 0.05 ~ 1e-6

weight_decay = 1e-4 # 1e-2 ~ 1e-8

momentum = 0.8 # 0.3~0.9

optimizer = optim.RMSprop(net.parameters(), lr=learning_rate, weight_decay=weight_decay, momentum=momentum)

scheduler = optim.lr_scheduler.ReduceLROnPlateau(optimizer, 'min', patience=2)

criterion = nn.CrossEntropyLoss()

# GPU

device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')

net.to(device=device)

'''=============== 模型信息管理 ==============='''

model_path = None

if model_path is not None:

    net.load_state_dict(torch.load(model_path, map_location=device))

'''=============== 网络训练 ==============='''

epochs = 50

def train(net, device, optimizer, scheduler, criterion):

    net.train() 

    for epoch in range(epochs):

        epoch_loss = 0      # 集损失置0

        for images, labels in train_loader:

            ''' ========== 数据获取和转移 ========== '''

            images = images.to(device=device, dtype=torch.float32)

            labels = labels.to(device=device, dtype=torch.long)

            ''' ========== 数据操作 ========== '''

            outputs = net(images)

            # net.forward()

            loss = criterion(outputs, labels)

            epoch_loss += loss.detach().item()

            ''' ========== 反向传播 ========== '''

            optimizer.zero_grad()

            loss.requires_grad_(True)

            loss.backward() 

            # 梯度裁剪

            for param in net.parameters():

                if param.grad is not None and param.grad.nelement() > 0:

                    nn.utils.clip_grad_value_([param], clip_value=0.1)

            optimizer.step()

        epoch_loss /= len(train_loader)

        # 输出每个 epoch 的平均损失

        print(f'Epoch [{epoch+1}/{epochs}], Loss: {epoch_loss}')

train(net, device, optimizer, scheduler, criterion)

'''=============== 网络保存 ==============='''

from datetime import datetime

# 获取当前时间

current_time = datetime.now().strftime('%Y%m%d_%H%M%S')

model_path = f'./output/final_model_{current_time}.pth'

# 保存模型

torch.save(net.state_dict(), model_path)

卷积神经网络CNN实战：MINST手写数字识别——数据集下载与网络训练的更多相关文章

卷积神经网络应用于tensorflow手写数字识别（第三版）
import tensorflow as tf from tensorflow.examples.tutorials.mnist import input_data mnist = input_dat ...
keras和tensorflow搭建DNN、CNN、RNN手写数字识别
MNIST手写数字集 MNIST是一个由美国由美国邮政系统开发的手写数字识别数据集.手写内容是0~9,一共有60000个图片样本,我们可以到MNIST官网免费下载,总共4个.gz后缀的压缩文件,该文件 ...
实现手写数字识别(数据集50000张图片)比较3种算法神经网络、灰度平均值、SVM各自的准确率—Jason niu
对手写数据集50000张图片实现阿拉伯数字0~9识别,并且对结果进行分析准确率, 手写数字数据集下载:http://yann.lecun.com/exdb/mnist/ 首先,利用图片本身的属性,图片 ...
MINST手写数字识别（三）—— 使用antirectifier替换ReLU激活函数
这是一个来自官网的示例:https://github.com/keras-team/keras/blob/master/examples/antirectifier.py 与之前的MINST手写数字识 ...
TensorFlow 卷积神经网络手写数字识别数据集介绍
欢迎大家关注我们的网站和系列教程:http://www.tensorflownews.com/,学习更多的机器学习.深度学习的知识! 手写数字识别接下来将会以 MNIST 数据集为例,使用卷积层和池 ...
[Python]基于CNN的MNIST手写数字识别
目录一.背景介绍 1.1 卷积神经网络 1.2 深度学习框架 1.3 MNIST 数据集二.方法和原理 2.1 部署网络模型 (1)权重初始化 (2)卷积和池化 (3)搭建卷积层1 (4)搭建卷积 ...
第三节，CNN案例-mnist手写数字识别
卷积:神经网络不再是对每个像素做处理,而是对一小块区域的处理,这种做法加强了图像信息的连续性,使得神经网络看到的是一个图像,而非一个点,同时也加深了神经网络对图像的理解,卷积神经网络有一个批量过滤器, ...
MINST手写数字识别（一）—— 全连接网络
这是一个简单快速入门教程——用Keras搭建神经网络实现手写数字识别,它大部分基于Keras的源代码示例 minst_mlp.py. 1.安装依赖库首先,你需要安装最近版本的Python,再加上一些 ...
MINST手写数字识别（二）—— 卷积神经网络（CNN）
今天我们的主角是keras,其简洁性和易用性简直出乎David 9我的预期.大家都知道keras是在TensorFlow上又包装了一层,向简洁易用的深度学习又迈出了坚实的一步. 所以,今天就来带大家写 ...
NN：利用深度学习之神经网络实现手写数字识别(数据集50000张图片)—Jason niu
import mnist_loader import network training_data, validation_data, test_data = mnist_loader.load_dat ...

随机推荐

基于 SQLite 3 的 C 学习：1-开发流程与基本函数
背景 SQLite 是一个常用于嵌入式平台的轻量级的关系型数据库. 我们已经介绍了移植 SQLite 3 ,这一讲我们来介绍它的开发,这里仅仅涉及最基本的开发. 高级api:https:/ ...
关于kubesphere集群calico网络组件报错的修复
最近公司的项目用到了Kubesphere,于是自己先在虚拟机上测试了一番,遇到了很多的问题,现将遇到的有关calico的问题记录一下上一篇介绍了如何离线安装kubesphere v3.0,安装之后我 ...
【Mysql】 MysqlDump导表结构或数据
mysqldump只导出表结构或只导出数据的实现方法语法: 默认不带参数的导出,导出文本内容大概如下:创建数据库判断语句-删除表-创建表-锁表-禁用索引-插入数据-启用索引-解锁表. Usage: ...
P9576 题解
赛时没仔细想,赛后才发现并不难. 将 \(l,r\) 与 \(l',r'\) 是否相交分开讨论. 假若不相交,那么 \(l',r' < l\) 或者 \(l',r' > r\) 并且 \( ...
Java中final用法与详解
final作为Java中经常用到的关键字,了解final的使用方法是非常有必要的. 这里从final关键字在数据域.方法和类中三个方面分析final关键字的主要用法. final应用于基本数据类型 1 ...
Eggjs 设置跨域请求指定地址跨域 nodejs
首先egg自身框架没有直接设置允许跨域请求的功能和接口,所以需要第三方包来设置跨域请求! 先安装第三方包来设置跨域,使用egg-cors // npm npm i egg-cors --save // ...
Nuxt框架中内置组件详解及使用指南（五）
title: Nuxt框架中内置组件详解及使用指南(五) date: 2024/7/10 updated: 2024/7/10 author: cmdragon excerpt: 摘要:本文详细介绍了 ...
UE导入FBX、GLTF模型
楔子虽然做了很多年的三维可视化,不过都主要还是web端开发为主(webgl,threejs,有兴趣的读者也可以关注下我的相关专栏).最近准备入手一下UE,顺便做一下知识梳理. 所以文章可能都是比较粗 ...
Fiddler+proxifier解决抓取不到客户端接口的问题
工作中偶尔会遇到Fiddler抓不到客户端接口问题,那么就要借助第三方工具proxifier来实现了: 下载地址: 原地址:链接: https://pan.baidu.com/s/1JPJ4cILEs ...
AppiumDesktop控制手机和安卓模拟器
前言: 本期内容如何用AppiumDesktop连接安卓手机和安卓模拟器 AppiumDesktop基本参数的获取方法,及如何驱动安卓设备 AppiumDesktop在模拟登陆和爬虫中用到的基本功能 ...

卷积神经网络CNN实战：MINST手写数字识别——数据集下载与网络训练

数据集下载

网络训练

卷积神经网络CNN实战：MINST手写数字识别——数据集下载与网络训练的更多相关文章

随机推荐

热门专题