动手学深度学习8-softmax分类pytorch简洁实现

定义和初始化模型
softamx和交叉熵损失函数
定义优化算法
训练模型

import torch

from torch import nn

from torch.nn import init

import numpy as np

import sys

sys.path.append('..')

import d2lzh_pytorch as d2l

import torchvision

import torchvision.transforms as transforms

定义和初始化模型

#与上一节同样的数据集以及批量大小

batch_size= 256

mnist_train= torchvision.datasets.FashionMNIST(root='~/Datasets/FashionMNIST',download=True,train=True,transform=transforms.ToTensor())

mnist_test = torchvision.datasets.FashionMNIST(root='~/Datasets/FashionMNIST',download=True,train=False,transform=transforms.ToTensor())

if sys.platform.startswith('win'):

    num_worker=0   # 表示不用额外的进程来加速读取数据

else:

    num_worker=4

train_iter = torch.utils.data.DataLoader(mnist_train,batch_size=batch_size,shuffle=True,num_workers=num_worker)

test_iter = torch.utils.data.DataLoader(mnist_test,batch_size=batch_size,shuffle=False,num_workers=num_worker)

softmax的输出层是一个全连接层，所以我们使用一个线性模块就可以，因为前面我们数据返回的每个batch的样本X的形状为(batch_size,1,28,28)，我们先用view()将X转化为(batch_size,784)才送入全连接层

num_inputs = 784

num_outputs = 10

class LinearNet(nn.Module):

    def __init__(self,num_inputs,num_outputs):

        super(LinearNet,self).__init__()

        self.linear = nn.Linear(num_inputs,num_outputs)

    def forward(self,x):

        y = self.linear(x.view(x.shape[0],-1))

        return y

net = LinearNet(num_inputs,num_outputs)

# 我们将形状转化的这个功能定义成一个FlattenLayer

class FlattenLayer(nn.Module):

    def __init__(self):

        super(FlattenLayer,self).__init__()

    def forward(self,x):

        return x.view(x.shape[0],-1)

from collections import OrderedDict

net = nn.Sequential(

    OrderedDict(

[

    ('flatten',FlattenLayer()),

    ('linear',nn.Linear(num_inputs,num_outputs))

])

)

# 之前线性回归的是num_output是1

init.normal_(net.linear.weight,mean=0,std=0.01)

init.constant_(net.linear.bias,val=0)

Parameter containing:

tensor([0., 0., 0., 0., 0., 0., 0., 0., 0., 0.], requires_grad=True)

print(net)

Sequential(

  (flatten): FlattenLayer()

  (linear): Linear(in_features=784, out_features=10, bias=True)

)

softamx和交叉熵损失函数

#pytorch提供了一个包括softmax预算和交叉熵损失计算的函数

loss = nn.CrossEntropyLoss()

定义优化算法

optimizer = torch.optim.SGD(net.parameters(),lr=0.1)

def evaluate_accuracy(data_iter, net):

    acc_sum, n = 0.0, 0

    for X, y in data_iter:

        acc_sum += (net(X).argmax(dim=1) == y).float().sum().item()

        n += y.shape[0]

    return acc_sum / n

训练模型

num_epochs, lr = 5, 0.1

def train_ch3(net, train_iter, test_iter, loss, num_epochs, batch_size,

              params=None, lr=None, optimizer=None):

    for epoch in range(num_epochs):

        train_l_sum, train_acc_sum, n = 0.0, 0.0, 0

        for X, y in train_iter:

            y_hat = net(X)

            l = loss(y_hat, y).sum()

            # 梯度清零

            if optimizer is not None:

                optimizer.zero_grad()

            elif params is not None and params[0].grad is not None:

                for param in params:

                    param.grad.data.zero_()

            l.backward()

            if optimizer is None:

                # 上节的代码optimizer is None,使用的手写的代码SGD

                sgd(params, lr, batch_size)

            else:

                # optimizer 非None，

                optimizer.step()  # “softmax回归的简洁实现”一节将用到

            train_l_sum += l.item()

            train_acc_sum += (y_hat.argmax(dim=1) == y).sum().item()

            n += y.shape[0]

        test_acc = evaluate_accuracy(test_iter, net)

        print('epoch %d, loss %.4f, train acc %.3f, test acc %.3f'

              % (epoch + 1, train_l_sum / n, train_acc_sum / n, test_acc))

train_ch3(net, train_iter, test_iter, loss, num_epochs, batch_size, None, None,optimizer)

epoch 1, loss 0.0031, train acc 0.749, test acc 0.765

epoch 2, loss 0.0022, train acc 0.813, test acc 0.808

epoch 3, loss 0.0021, train acc 0.826, test acc 0.818

epoch 4, loss 0.0020, train acc 0.832, test acc 0.816

epoch 5, loss 0.0019, train acc 0.837, test acc 0.821

动手学深度学习8-softmax分类pytorch简洁实现的更多相关文章

动手学深度学习9-多层感知机pytorch
多层感知机隐藏层激活函数小结多层感知机之前已经介绍过了线性回归和softmax回归在内的单层神经网络,然后深度学习主要学习多层模型,后续将以多层感知机(multilayer percetro ...
小白学习之pytorch框架(2)-动手学深度学习(begin-random.shuffle()、torch.index_select()、nn.Module、nn.Sequential())
在这向大家推荐一本书-花书-动手学深度学习pytorch版,原书用的深度学习框架是MXNet,这个框架经过Gluon重新再封装,使用风格非常接近pytorch,但是由于pytorch越来越火,个人又比 ...
对比《动手学深度学习》 PDF代码+《神经网络与深度学习》PDF
随着AlphaGo与李世石大战的落幕,人工智能成为话题焦点.AlphaGo背后的工作原理"深度学习"也跳入大众的视野.什么是深度学习,什么是神经网络,为何一段程序在精密的围棋大赛中 ...
【动手学深度学习】Jupyter notebook中 import mxnet出错
问题描述打开d2l-zh目录,使用jupyter notebook打开文件运行,import mxnet 出现无法导入mxnet模块的问题, 但是命令行运行是可以导入mxnet模块的. 原因: 激活 ...
《动手学深度学习》系列笔记—— 1.2 Softmax回归与分类模型
目录 softmax的基本概念交叉熵损失函数模型训练和预测获取Fashion-MNIST训练集和读取数据 get dataset softmax从零开始的实现获取训练集数据和测试集数据模型参 ...
动手学深度学习7-从零开始完成softmax分类
获取和读取数据初始化模型参数实现softmax运算定义模型定义损失函数计算分类准确率训练模型小结 import torch import torchvision import numpy ...
动手学深度学习14- pytorch Dropout 实现与原理
方法从零开始实现定义模型参数网络评估函数优化方法定义损失函数数据提取与训练评估 pytorch简洁实现小结针对深度学习中的过拟合问题,通常使用丢弃法(dropout),丢弃法有很多的 ...
动手学深度学习6-认识Fashion_MNIST图像数据集
获取数据集读取小批量样本小结本节将使用torchvision包,它是服务于pytorch深度学习框架的,主要用来构建计算机视觉模型. torchvision主要由以下几个部分构成: torchv ...
动手学深度学习1- pytorch初学
pytorch 初学 Tensors 创建空的tensor 创建随机的一个随机数矩阵创建0元素的矩阵直接从已经数据创建tensor 创建新的矩阵计算操作加法操作转化形状 tensor 与nu ...

随机推荐

MySQL优化常见Extra分析——慢查询优化
数据准备: create table user ( id int primary key, name ), sex ), index(name) )engine=innodb; 数据说明:用户表:id ...
JSTL+EL表达式+JSP自定义框架案例
不会框架不要紧,我带你自定义框架前言:这标题说的有点大了,当一回标题党,之前在学JSP的时候提到了JSTL和EL表达式,由于一直钟情于Servlet,迟迟没有更新别的,这回算是跳出来了.这回放个大招 ...
原生PHP和MYSQL练习登陆验证和查询数据到表格
直接上代码吧 <?php header("Content-type: text/html; charset=utf-8"); //数据量链接 $conn=mysqli_con ...
Caused by: java.lang.ClassNotFoundException: org.springframework.data.repository.config.BootstrapMode
1.起因,启动SpringBoot2.0的时候报了这个错误.说找不到类,咱也是刚学SpringBoot2.0,咱也不懂,咱也不知道问谁,研究一翻,找不到原因就百度了. 参考链接:https://blo ...
C# 去除数字中多于的0
decimal i = decimal.Parse(Console.ReadLine()); Console.WriteLine((i).ToString(")); Console.Writ ...
python 跟踪IP模块
#coding=utf-8 import re import subprocess def tracertIP(ip): p = subprocess.Popen(['tracert',ip],std ...
MySQL基础（四）（子查询与链接）
1.子查询简介其中,所谓的“外层查询”并不是指“查找”,指的是所有SQL语句的统称:结构化查询语言(Structured Query Language),简称SQL. : 2.由比较运算符引发的子查 ...
关于css中的定位
关于前端的几种定位方式近期自己感觉自己对于前端定位的知识还是不是太理解,所以自己就在这里做一个总结 1.元素的定位属性主要包括定位模式和边偏移两部分. 边偏移属性描述 top bott ...
NoSuchMethodError 常见原因及解决方法
相关阅读导读『StabilityGuide』是阿里多位阿里技术工程师共同发起的稳定性领域的知识库开源项目,涵盖性能压测.故障演练.JVM.应用容器.服务框架.流量调度.监控.诊断等多个技术领 ...
Linux计划任务，定时清空日志
以Ubuntu为例,利用系统自带计划任务,即cron ,计划任务,是任务在约定的时间执行已经计划好的工作,这是表面的意思.在Linux中,我们经常用到 cron 服务器来完成这项工作.cron服务器可 ...

动手学深度学习8-softmax分类pytorch简洁实现

定义和初始化模型

softamx和交叉熵损失函数

定义优化算法

训练模型

动手学深度学习8-softmax分类pytorch简洁实现的更多相关文章

随机推荐

热门专题