pytorch之 optimizer comparison

 import torch

 import torch.utils.data as Data

 import torch.nn.functional as F

 import matplotlib.pyplot as plt

 import torch.optim

 # torch.manual_seed(1)    # reproducible

 LR = 0.01

 BATCH_SIZE = 32

 EPOCH = 12

 # fake dataset

 x = torch.unsqueeze(torch.linspace(-1, 1, 1000), dim=1)

 y = x.pow(2) + 0.1*torch.normal(torch.zeros(*x.size()))

 # plot dataset

 plt.scatter(x.numpy(), y.numpy())

 plt.show()

 # put dateset into torch dataset

 torch_dataset = Data.TensorDataset(x, y)

 loader = Data.DataLoader(dataset=torch_dataset, batch_size=BATCH_SIZE, shuffle=True, num_workers=2,)

 # default network

 class Net(torch.nn.Module):

     def __init__(self):

         super(Net, self).__init__()

         self.hidden = torch.nn.Linear(1, 20)   # hidden layer

         self.predict = torch.nn.Linear(20, 1)   # output layer

     def forward(self, x):

         x = F.relu(self.hidden(x))      # activation function for hidden layer

         x = self.predict(x)             # linear output

         return x

 if __name__ == '__main__':

     # different nets

     net_SGD         = Net()

     net_Momentum    = Net()

     net_RMSprop     = Net()

     net_Adam        = Net()

     nets = [net_SGD, net_Momentum, net_RMSprop, net_Adam]

     # different optimizers

     opt_SGD         = torch.optim.SGD(net_SGD.parameters(), lr=LR)

     opt_Momentum    = torch.optim.SGD(net_Momentum.parameters(), lr=LR, momentum=0.8)

     opt_RMSprop     = torch.optim.RMSprop(net_RMSprop.parameters(), lr=LR, alpha=0.9)

     opt_Adam        = torch.optim.Adam(net_Adam.parameters(), lr=LR, betas=(0.9, 0.99))

     optimizers = [opt_SGD, opt_Momentum, opt_RMSprop, opt_Adam]

     loss_func = torch.nn.MSELoss()

     losses_his = [[], [], [], []]   # record loss

     # training

     for epoch in range(EPOCH):

         print('Epoch: ', epoch)

         for step, (b_x, b_y) in enumerate(loader):          # for each training step

             for net, opt, l_his in zip(nets, optimizers, losses_his):

                 output = net(b_x)              # get output for every net

                 loss = loss_func(output, b_y)  # compute loss for every net

                 opt.zero_grad()                # clear gradients for next train

                 loss.backward()                # backpropagation, compute gradients

                 opt.step()                     # apply gradients

                 l_his.append(loss.data.numpy())     # loss recoder

     labels = ['SGD', 'Momentum', 'RMSprop', 'Adam']

     for i, l_his in enumerate(losses_his):

         plt.plot(l_his, label=labels[i])

     plt.legend(loc='best')

     plt.xlabel('Steps')

     plt.ylabel('Loss')

     plt.ylim((0, 0.2))

     plt.show()

pytorch之 optimizer comparison的更多相关文章

pytorch 7 optimizer 优化器加速训练
import torch import torch.utils.data as Data import torch.nn.functional as F import matplotlib.pyplo ...
[源码解析] 深度学习分布式训练框架 horovod (21) --- 之如何恢复训练
[源码解析] 深度学习分布式训练框架 horovod (21) --- 之如何恢复训练目录 [源码解析] 深度学习分布式训练框架 horovod (21) --- 之如何恢复训练 0x00 摘要 0 ...
[源码解析] PyTorch 分布式(14) --使用 Distributed Autograd 和 Distributed Optimizer
[源码解析] PyTorch 分布式(14) --使用 Distributed Autograd 和 Distributed Optimizer 目录 [源码解析] PyTorch 分布式(14) - ...
pytorch adam 源码关于优化函数的调整 optimizer 调参重点
关于优化函数的调整拆下包:https://ptorch.com/docs/1/optim class torch.optim.Optimizer(params, defaults)所有优化的基类. 参 ...
莫烦pytorch学习笔记（七）——Optimizer优化器
各种优化器的比较莫烦的对各种优化通俗理解的视频 import torch import torch.utils.data as Data import torch.nn.functional as ...
Pytorch学习笔记08----优化器算法Optimizer详解（SGD、Adam）
1.优化器算法简述首先来看一下梯度下降最常见的三种变形 BGD,SGD,MBGD,这三种形式的区别就是取决于我们用多少数据来计算目标函数的梯度,这样的话自然就涉及到一个 trade-off,即参数更 ...
pytorch bert 源码解读
https://daiwk.github.io/posts/nlp-bert.html 目录概述 BERT 模型架构 Input Representation Pre-training Tasks ...
Comparison of B-Tree and Hash Indexes
Understanding the B-tree and hash data structures can help predict how different queries perform on ...
基于pytorch的CNN、LSTM神经网络模型调参小结
(Demo) 这是最近两个月来的一个小总结,实现的demo已经上传github,里面包含了CNN.LSTM.BiLSTM.GRU以及CNN与LSTM.BiLSTM的结合还有多层多通道CNN.LSTM. ...

随机推荐

Django框架初体验
前言从今天开始学习测试开发知识,并会把每一次学习的过程和成果记录到博客,由于我也没怎么接触过python相关的开发框架,所以前期应该是艰难的,但是我相信努力就会有收获,如果你和我一样是个小白,那我们 ...
Unity3d组件实现令人惊叹的像素粒子特效！
我们先看看两个特效,感受一下,有没有学习的动力? =========================================================================== ...
Windows Terminal入门
目录 0.引言 1.简易安装 2.初识WT 3.初识Settings 3.1全局配置 3.2每一个终端配置 3.3配色方案 3.4键位绑定 4.连接云服务器 5.连接WSL 6.玩转Emoji 0.引 ...
requests快速构造请求头的方法
上图请求头内容,内容多不说,也不确认哪些数据是必须的,网上找到一个懒办法快速一键生成 Python 爬虫请求头实战演练抓取网站:https://developer.mozilla.org... ...
jenkins集成jmeter-进阶篇
1.gitlab自动触发jenkins构建 1⃣️安装插件: 2⃣️新建工程,设置git url,build when a change is pushed auto.sh /bin/sh echo ...
LeetCode-指针法
LeetCode刷题总结-指针法方法介绍:指针法主要使用在一组按从小到大排好序的数组中,当按照条件查找对应元素时,在数组的前后定义两个指针,当两个指针代表的元素进行运算时:若结果大于目标值,则左移右 ...
了解人工智能？-百度AI
了解人工智能? 什么是人工智能? 由人创造的"智慧能力",同样具备智慧生物的能力耳朵=倾听=麦克风=语音识别 ASR Automatic Speech Recognition 嘴 ...
GC原理---垃圾收集器
垃圾收集器如果说收集算法是内存回收的方法论,垃圾收集器就是内存回收的具体实现 Serial收集器串行收集器是最古老,最稳定以及效率高的收集器,可能会产生较长的停顿,只使用一个线程去回收.新生代.老 ...
springboot开发之配置自定义的错误界面和错误信息
如何定制错误页面? (1)在有模板引擎的情况下:在template文件夹下的error/状态码:即将错误页面命名为:错误状态码.html放在template文件夹里面的error文件夹下,发生此状态码 ...
linux 内存使用分析
查看当前内存使用情况,最常用的指令就是 [root@t ~]# free -m total used free shared buffers cached Mem: -/+ buffers/cac ...

pytorch之 optimizer comparison

pytorch之 optimizer comparison的更多相关文章

随机推荐

热门专题