以Mnist为例从头开始自己建立数据集，搭建resnet34,识别Mnist

写在前面：

本人小白研一，刚开始学习深度学习，将自己的第一个实验过程总结下来，看了很多的大牛的博客，在下面的程序中也参考了很多大牛的博客。在刚开始入门的学习的时候，直接编写程序下载数据集，但是后来觉得可能会用到自己手动构建数据集。所以自己参考了一些博客，尝试了从自己手动构造数据集——搭建Resnet34网络——训练——验证的一整个过程。下面将自己的实验过程记录如下。本文重点介绍自己构建数据集与神经网络搭建部分

本人才疏学浅，刚入门，有错误纰漏的地方恳请各位批评指正。

第一章：

首先需要自己构建Mnist数据集，当然也可以自己从网络上下载。在这里，由于本人有点作，想尝试自己构造数据集，话不多说，直接贴代码

 #!/usr/bin/env python 3.6

 #_*_coding:utf-8 _*_

 #@Time    :2019/11/7 9:10

 #@Author  :控制工程小白

 #@FileName: 自己制作Mnist数据集.py

 #@Software: PyCharm

 import torch

 import torchvision

 from skimage import io

 #import os

 mnist_train=torchvision.datasets.MNIST('./make_mnistdata',train=True,download=True)#首先下载数据集，并数据分割成训练集与数据集

 mnist_test=torchvision.datasets.MNIST('./make_mnistdata',train=False,download=True)

 print('testset:',len(mnist_test))

 #txt_path = "G:/Mnist_Recognition/mnist_label.txt"

 # if not os.path.exists(txt_path):

 #     os.makedirs(txt_path)

 f=open("./mnist_test.txt",'w')#在指定路径之下生成.txt文件

 for i,(img,label) in enumerate(mnist_test):

     img_path = "./mnist_test/" + str(i) + ".jpg"

     io.imsave(img_path, img)#将图片数据以图片.jpg格式存在指定路径下

     img_paths=img_path+str(i)+".jpg"

     f.write(img_path+' '+str(label)+'\n')#将路径与标签组合成的字符串存在.txt文件下

 f.close()#关闭文件

注意，在运行这段代码之前应该在根目录下新建一个mnist_train文件夹用于存放训练集的图片，新建mnist_test文件夹用于存放测试集的图片，运行这段代码之后会生成一个mnist_test.txt与mnist_train.txt 文件，用来储存各个字符串，这个字符串由每个图片的路径与对应的标签组成，至于这样做有什么用，请看下文。贴一下上述代码运行结果

第二章：

下面将会用到上一章生成的.txt 文件，先上代码

 #!/usr/bin/env python 3.6

 #_*_coding:utf-8 _*_

 #@Time    :2019/11/7 11:38

 #@Author  :控制工程小白

 #@FileName: My_dataset.py

 #@Software: PyCharm

 from PIL import Image

 import torch

 from torch.utils import data

 import torchvision.transforms as transforms

 from torch.utils.data import DataLoader

 import matplotlib.pyplot as plt

 class MyDataset(data.Dataset):

     def __init__(self,datatxt,transform=None,target_transform=None):

         super(MyDataset,self).__init__()

         fh=open(datatxt,'r')#读取标签文件.txt

         imgs=[]#暂时定义一个空的列表

         for line in fh:

             line.strip('\n')#出去字符串末尾的空格、制表符

             words=line.split()#将路径名与标签分离出来

             imgs.append((words[0],int(words[1])))#word[0]表示图片的路径名，word[1]表示该数字图片对应的标签

         self.imgs=imgs

         self.transform=transform

         self.target_transform=target_transform

         #self.loader=loader

     def __getitem__(self, index):

         fn,label=self.imgs[index]#fn表示图片的路径

         img = Image.open(fn)#.convert('RGB'),这里时候需要转换成RGB图像视神经网络结构而定，读取文件的路径名，也即打开图片

         if self.transform is not None:

             img=self.transform(img)

         return img,label#返回图片与标签

     def __len__(self):

         return len(self.imgs)

这段代码构造了一个类，用于获取刚刚建立的数据集，思想就是读取刚刚建立的.txt文件，将其中的图片的路径名与该图片对应的标签分离，然后根据根据图片的路径名获取数据集。

第三章：

搭建神经网络，随着深度学习的发展，已经出现了很多种神经网络，一般而言，神经网络越深越好，但是神经网络的维度太深的话，会导致神经网络过拟合，于是开发者开发了一种残差神经网络Resnet，它是由很多个残差快组成，每个残差块都包含跳连接，防止过拟合，这样可以达到网络更深同时性能不会受到过拟合的影响。

下面直接贴Resnet34代码

#!/usr/bin/env python 3.6

#_*_coding:utf-8 _*_

#@Time    :2019/11/7 15:44

#@Author  :hujinzhou 

#@FileName: neural_network4.py

#@Software: PyCharm

import torch.nn as nn

class Reslock(nn.Module):

     def __init__(self, in_channels, out_channels, stride=1):

         super(Reslock, self).__init__()

         self.conv1 = nn.Conv2d(in_channels, out_channels, kernel_size=3, stride=stride, padding=1)

         self.bn1 = nn.BatchNorm2d(out_channels)

         self.relu = nn.ReLU(inplace=True)

         self.conv2 = nn.Conv2d(out_channels, out_channels, kernel_size=3, stride=1, padding=1)

         self.bn2 = nn.BatchNorm2d(out_channels)

         if in_channels != out_channels:

            self.downsample = nn.Sequential(

                 nn.Conv2d(in_channels, out_channels, kernel_size=1, stride=2),

                 nn.BatchNorm2d(out_channels)

             )

         else:

             self.downsample = None

     def forward(self, x):

         identity = x

         out = self.conv1(x)

         out = self.bn1(out)

         out = self.relu(out)

         out = self.conv2(out)

         out = self.bn2(out)

         if self.downsample is not None:

             identity = self.downsample(x)

         out += identity

         out = self.relu(out)

         return out

class ResNet34(nn.Module):

     def __init__(self, num_classes=10):

         super(ResNet34, self).__init__()

         self.first = nn.Sequential(

             nn.Conv2d(1, 64, 7, 2, 3),

             nn.BatchNorm2d(64),

             nn.ReLU(inplace=True),

             nn.MaxPool2d(3, 1, 1)

         )

         self.layer1 = self.make_layer(64, 64, 3, 1)

         self.layer2 = self.make_layer(64, 128, 4, 2)

         self.layer3 = self.make_layer(128, 256, 6, 2)

         self.layer4 = self.make_layer(256, 512, 3, 2)

         self.avg_pool = nn.AvgPool2d(2)

         self.fc = nn.Linear(512, num_classes)

     def make_layer(self, in_channels, out_channels, block_num, stride):

         layers = []

         layers.append(Reslock(in_channels, out_channels, stride))

         for i in range(block_num - 1):

             layers.append(Reslock(out_channels, out_channels, 1))

         return nn.Sequential(*layers)

     def forward(self, x):

         x = self.first(x)

         x = self.layer1(x)

         x = self.layer2(x)

         x = self.layer3(x)

         x = self.layer4(x)

         x = self.avg_pool(x)

         # x.size()[0]: batch size

         x = x.view(x.size()[0], -1)

         x = self.fc(x)

         return x

第四章：

上述过程弄好了，下面的过程就非常简单了，下面直接训练并识别验证就可以了，训练代码与验证代码就很简单了，在本文中直接贴训练结果图与识别精度图

以Mnist为例从头开始自己建立数据集，搭建resnet34,识别Mnist的更多相关文章

tensorflow学习笔记----tensorflow在windows的安装及TensorBoard中mnist样例
前言: ...
机器学习（1） - TensorflowSharp 简单使用与KNN识别MNIST流程
机器学习是时下非常流行的话题,而Tensorflow是机器学习中最有名的工具包.TensorflowSharp是Tensorflow的C#语言表述.本文会对TensorflowSharp的使用进行一个 ...
keras框架的MLP手写数字识别MNIST，梳理？
keras框架的MLP手写数字识别MNIST 代码: # coding: utf-8 # In[1]: import numpy as np import pandas as pd from kera ...
如何入门Pytorch之四：搭建神经网络训练MNIST
上一节我们学习了Pytorch优化网络的基本方法,本节我们将以MNIST数据集为例,通过搭建一个完整的神经网络,来加深对Pytorch的理解. 一.数据集 MNIST是一个非常经典的数据集,下载链接: ...
TensorFlow 入门之手写识别(MNIST) softmax算法
TensorFlow 入门之手写识别(MNIST) softmax算法 MNIST flyu6 softmax回归 softmax回归算法 TensorFlow实现softmax softmax回归算 ...
机器学习（2） - KNN识别MNIST
代码 https://github.com/s055523/MNISTTensorFlowSharp 数据的获得数据可以由http://yann.lecun.com/exdb/mnist/下载.之后 ...
matlab练习程序（神经网络识别mnist手写数据集）
记得上次练习了神经网络分类,不过当时应该有些地方写的还是不对. 这次用神经网络识别mnist手写数据集,主要参考了深度学习工具包的一些代码. mnist数据集训练数据一共有28*28*60000个像素 ...
Python实现bp神经网络识别MNIST数据集
title: "Python实现bp神经网络识别MNIST数据集" date: 2018-06-18T14:01:49+08:00 tags: [""] cat ...
RNN入门（一）识别MNIST数据集
RNN介绍在读本文之前,读者应该对全连接神经网络(Fully Connected Neural Network, FCNN)和卷积神经网络( Convolutional Neural Netwo ...

随机推荐

短视频处理LanSoEditor-SDK之功能介绍
短视频处理LanSoEditor-SDK之功能介绍 (注释: 我们的SDK每3周更新一次, 一下功能是在2.8.2版本上列出的,可能不是最新的功能, 请知悉) 和别家最大的不同在于: 别人提供功能, ...
Java诊断利器Arthas
1 简介 Arthas 是Alibaba开源的Java诊断工具,深受开发者喜爱当你遇到以下类似问题而束手无策时,Arthas可以帮助你解决: 这个类从哪个 jar 包加载的?为什么会报各种类相关的 ...
Openshift 部署第一个应用hello-openshift
Openshift 部署第一个应用hello-openshift: cd /opt/ wget https://github.com/openshift/origin/releases/downloa ...
03-Django基础概念和MVT架构
一.Django基础掌握Django的 MVT 架构的使用掌握Git管理源代码主要内容了解Django的 MVT 架构的使用流程使用Django完成案例 : 书籍信息管理 MVC介绍 MVC ...
Github配合Jenkins，实现vue等前端项目的自动构建与发布
本篇文章前端项目以vue为例(其实前端工程化项目的操作方法都相同),部署在Linux系统上(centos). 之前做前端项目的部署,一直都是手动运行打包命令,打包完.再使用FTP.Xshell等这类的 ...
.NET斗鱼直播弹幕客户端(下)
.NET斗鱼直播弹幕客户端(下) 在上篇文章中,我们提到了如何使用.NET连接斗鱼TV直播弹幕的基本操作.然而想要做得好,做得容易扩展,就需要做进一步的代码整理. 本文将涉及以下内容: 介绍如何使用R ...
python编程基础之二十六
偏函数:当一个函数有大量的参数时候,调用时候非常不方便,于是就可以用偏函数解决,将一些参数固定(默认值),达到简化函数调用的目的使用偏函数需要导入functools import functools ...
Django与drf 源码视图解析
0902自我总结 Django 与drf 源码视图解析一.原生Django CBV 源码分析:View """ 1)as_view()是入口,得到view函数地址 2) ...
Sublime Text3工具的安装、破解、VIM功能vintage插件教程（已经实践、绝对可用）
工欲善其事,必先利其器.Sublime Text是一款很好的开发工具,开发php项目很好用,尤其是Sublime Text的一些插件功能,可以享用VIM的快捷编辑和html.js等自动补全 ...
ARM64架构下，OpenJDK的官方Docker镜像为何没有8版本
为什么需要ARM64架构的OpenJDK8的Docker镜像对现有的Java应用,之前一直运行在x86处理器环境下,编译和运行都是JDK8,如今在树莓派的Docker环境运行(也可能是其他ARM环境 ...

以Mnist为例从头开始自己建立数据集，搭建resnet34,识别Mnist

以Mnist为例从头开始自己建立数据集，搭建resnet34,识别Mnist的更多相关文章

随机推荐

热门专题