pytorch1.0进行Optimizer 优化器对比

import torch

import torch.utils.data as Data  # Torch 中提供了一种帮助整理数据结构的工具, 叫做 DataLoader, 能用它来包装自己的数据, 进行批训练.

import torch.nn.functional as F  # 包含激励函数

import matplotlib.pyplot as plt

LR = 0.01   # 学习率

BATCH_SIZE = 32

EPOCH = 12

# 伪数据

# fake dataset

x = torch.unsqueeze(torch.linspace(-1, 1, 1000), dim=1)

y = x.pow(2) + 0.1*torch.normal(torch.zeros(*x.size()))

# plot dataset

plt.scatter(x.numpy(), y.numpy())

plt.show()

# DataLoader 是 torch 用来包装开发者自己的数据的工具.

# 将自己的 (numpy array 或其他) 数据形式装换成 Tensor, 然后再放进这个包装器中.

# 使用 DataLoader 的好处就是他们帮你有效地迭代数据

# 先转换成 torch 能识别的 Dataset

# put dateset into torch dataset

torch_dataset = Data.TensorDataset(x, y)

# 把 dataset 放入 DataLoader

loader = Data.DataLoader(dataset=torch_dataset, batch_size=BATCH_SIZE, shuffle=True, num_workers=2,) # 随机打乱数据 (打乱比较好)

# 每个优化器优化一个神经网络

# 默认的 network 形式

# default network

class Net(torch.nn.Module):

    def __init__(self):

        super(Net, self).__init__()

        self.hidden = torch.nn.Linear(1, 20)   # hidden layer

        self.predict = torch.nn.Linear(20, 1)   # output layer

    def forward(self, x):

        x = F.relu(self.hidden(x))      # activation function for hidden layer

        x = self.predict(x)             # linear output

        return x

# 创建不同的优化器, 用来训练不同的网络. 并创建一个 loss_func 用来计算误差.

if __name__ == '__main__':

    # different nets

    net_SGD         = Net()

    net_Momentum    = Net()

    net_RMSprop     = Net()

    net_Adam        = Net()

    nets = [net_SGD, net_Momentum, net_RMSprop, net_Adam]

    # different optimizers

    opt_SGD         = torch.optim.SGD(net_SGD.parameters(), lr=LR)

    opt_Momentum    = torch.optim.SGD(net_Momentum.parameters(), lr=LR, momentum=0.8)

    opt_RMSprop     = torch.optim.RMSprop(net_RMSprop.parameters(), lr=LR, alpha=0.9)

    opt_Adam        = torch.optim.Adam(net_Adam.parameters(), lr=LR, betas=(0.9, 0.99))

    optimizers = [opt_SGD, opt_Momentum, opt_RMSprop, opt_Adam]

    loss_func = torch.nn.MSELoss()

    losses_his = [[], [], [], []]   # record loss

    # 训练/出图

    # training

    for epoch in range(EPOCH):

        print('Epoch: ', epoch)

        for step, (b_x, b_y) in enumerate(loader):          # for each training step

            # 对每个优化器, 优化属于他的神经网络

            for net, opt, l_his in zip(nets, optimizers, losses_his):

                output = net(b_x)                           # get output for every net

                loss = loss_func(output, b_y)               # compute loss for every net

                opt.zero_grad()                             # clear gradients for next train

                loss.backward()                             # backpropagation, compute gradients

                opt.step()                                  # apply gradients

                l_his.append(loss.data.numpy())             # loss recoder

    labels = ['SGD', 'Momentum', 'RMSprop', 'Adam']

    for i, l_his in enumerate(losses_his):

        plt.plot(l_his, label=labels[i])

    plt.legend(loc='best')

    plt.xlabel('Steps')

    plt.ylabel('Loss')

    plt.ylim((0, 0.2))

    plt.show()

# SGD是最普通的优化器, 也可以说没有加速效果, 而Momentum是SGD的改良版,它加入了动量原则.后面的RMSprop又是Momentum的升级版.
# 而Adam又是RMSprop的升级版.Adam的效果似乎比RMSprop要差一点.所以说并不是越先进的优化器, 结果越佳.
# 在自己的试验中可以尝试不同的优化器, 找到那个最适合你数据网络的优化器.

pytorch1.0进行Optimizer 优化器对比的更多相关文章

PLSQL_性能优化系列04_Oracle Optimizer优化器
2014-09-25 Created By BaoXinjian
pytorch 7 optimizer 优化器加速训练
import torch import torch.utils.data as Data import torch.nn.functional as F import matplotlib.pyplo ...
莫烦pytorch学习笔记（七）——Optimizer优化器
各种优化器的比较莫烦的对各种优化通俗理解的视频 import torch import torch.utils.data as Data import torch.nn.functional as ...
各种优化器对比--BGD/SGD/MBGD/MSGD/NAG/Adagrad/Adam
指数加权平均 (exponentially weighted averges) 先说一下指数加权平均, 公式如下: \[v_{t}=\beta v_{t-1}+(1-\beta) \theta_{t} ...
Tensorflow 2.0 深度学习实战 —— 详细介绍损失函数、优化器、激活函数、多层感知机的实现原理
前言 AI 人工智能包含了机器学习与深度学习,在前几篇文章曾经介绍过机器学习的基础知识,包括了监督学习和无监督学习,有兴趣的朋友可以阅读< Python 机器学习实战 >.而深度学习开始只 ...
[PyTorch 学习笔记] 4.3 优化器
本章代码: https://github.com/zhangxiann/PyTorch_Practice/blob/master/lesson4/optimizer_methods.py https: ...
Oracle SQL优化器简介
目录一.Oracle的优化器 1.1 优化器简介 1.2 SQL执行过程二.优化器优化方式 2.1 优化器的优化方式 2.2 基于规则的优化器 2.3 基于成本的优化器三.优化器优化模式 3.1 ...
【MySQL】MySQL/MariaDB的优化器对in子查询的处理
参考:http://codingstandards.iteye.com/blog/1344833 上面参考文章中<高性能MySQL>第四章第四节在第三版中我对应章节是第六章第五节最近分析 ...
Pytorch1.0深度学习：损失函数、优化器、常见激活函数、批归一化详解
不用相当的独立功夫,不论在哪个严重的问题上都不能找出真理:谁怕用功夫,谁就无法找到真理. —— 列宁本文主要介绍损失函数.优化器.反向传播.链式求导法则.激活函数.批归一化. 1 经典损失函数 1. ...

随机推荐

TCP的几个知识点
1. 三次握手.四次挥手详细查看:https://www.cnblogs.com/amiezhang/p/6703390.html 2. ARQ 协议 ARQ 就是超时重传机制,分为 2 种:停止等 ...
Mybatis 代码生成器（集成通用Mapper）
0.确保通用Mapper被正确配置 1.pom.xml追加 <properties> <targetJavaProject>${basedir}/src/main/java&l ...
Compiling OpenCV: VTK Not Found on Ubuntu 16.04 LTS
When installing OpenCV: /usr/bin/vtk not found libvtkRenderingPythonTkWidgets.so not found /usr/bin/ ...
分布式缓存Redis集群搭建
redis安装 1.下载tar包至/opt/redis 2.解压tar包 tar -xvf redis-4.0.14.tar.gz 3. cd redis-4.0.14 make一下. 单节点的red ...
SQL学习笔记（二）
连接查询数据准备例1:查询学生信息及学生的成绩等值连接此方法会产生笛卡尔积,生成的记录总数=表1的总数*表2的总数,会产生临时表内连接 select * from 表1 inner join ...
linux中截取字段与#、$区别
1.Linux shell 截取字符变量的前8位实现方法有如下几种: expr substr “$a” 1 8 echo $a|awk ‘{print substr(,1,8)}’ echo $a| ...
拒绝让Eclipse帮倒忙，解决其复制粘贴时把反斜杠变成双反斜杠的问题
比如,你粘贴到字符串的文本是“C:\Users\horn1\Desktop”,结果变成了“C:\\Users\\horn1\\Desktop\\”,这还好,不会带来麻烦. 但是,比如你输入的是正则表达 ...
post请求头中常见content-type（非常重要）
定义和用法 enctype 属性规定在发送到服务器之前应该如何对表单数据进行编码.默认地,表单数据会编码为 "application/x-www-form-urlencoded". ...
Flutter响应式编程 - RxDart
import 'package:flutter/material.dart'; import 'package:rxdart/rxdart.dart'; import 'dart:async'; cl ...
Java回调机制在RPC框架中的应用示例
完整源码: https://gitee.com/shiyanjun/x-callback-demo 应用场景描述: 服务提供者在项目启动时,创建并启动一个TCP服务器,然后将自己提供的所有服务注册到注 ...

pytorch1.0进行Optimizer 优化器对比

pytorch1.0进行Optimizer 优化器对比的更多相关文章

随机推荐

热门专题