pytorch之 optimizer comparison

 import torch

 import torch.utils.data as Data

 import torch.nn.functional as F

 import matplotlib.pyplot as plt

 import torch.optim

 # torch.manual_seed(1)    # reproducible

 LR = 0.01

 BATCH_SIZE = 32

 EPOCH = 12

 # fake dataset

 x = torch.unsqueeze(torch.linspace(-1, 1, 1000), dim=1)

 y = x.pow(2) + 0.1*torch.normal(torch.zeros(*x.size()))

 # plot dataset

 plt.scatter(x.numpy(), y.numpy())

 plt.show()

 # put dateset into torch dataset

 torch_dataset = Data.TensorDataset(x, y)

 loader = Data.DataLoader(dataset=torch_dataset, batch_size=BATCH_SIZE, shuffle=True, num_workers=2,)

 # default network

 class Net(torch.nn.Module):

     def __init__(self):

         super(Net, self).__init__()

         self.hidden = torch.nn.Linear(1, 20)   # hidden layer

         self.predict = torch.nn.Linear(20, 1)   # output layer

     def forward(self, x):

         x = F.relu(self.hidden(x))      # activation function for hidden layer

         x = self.predict(x)             # linear output

         return x

 if __name__ == '__main__':

     # different nets

     net_SGD         = Net()

     net_Momentum    = Net()

     net_RMSprop     = Net()

     net_Adam        = Net()

     nets = [net_SGD, net_Momentum, net_RMSprop, net_Adam]

     # different optimizers

     opt_SGD         = torch.optim.SGD(net_SGD.parameters(), lr=LR)

     opt_Momentum    = torch.optim.SGD(net_Momentum.parameters(), lr=LR, momentum=0.8)

     opt_RMSprop     = torch.optim.RMSprop(net_RMSprop.parameters(), lr=LR, alpha=0.9)

     opt_Adam        = torch.optim.Adam(net_Adam.parameters(), lr=LR, betas=(0.9, 0.99))

     optimizers = [opt_SGD, opt_Momentum, opt_RMSprop, opt_Adam]

     loss_func = torch.nn.MSELoss()

     losses_his = [[], [], [], []]   # record loss

     # training

     for epoch in range(EPOCH):

         print('Epoch: ', epoch)

         for step, (b_x, b_y) in enumerate(loader):          # for each training step

             for net, opt, l_his in zip(nets, optimizers, losses_his):

                 output = net(b_x)              # get output for every net

                 loss = loss_func(output, b_y)  # compute loss for every net

                 opt.zero_grad()                # clear gradients for next train

                 loss.backward()                # backpropagation, compute gradients

                 opt.step()                     # apply gradients

                 l_his.append(loss.data.numpy())     # loss recoder

     labels = ['SGD', 'Momentum', 'RMSprop', 'Adam']

     for i, l_his in enumerate(losses_his):

         plt.plot(l_his, label=labels[i])

     plt.legend(loc='best')

     plt.xlabel('Steps')

     plt.ylabel('Loss')

     plt.ylim((0, 0.2))

     plt.show()

pytorch之 optimizer comparison的更多相关文章

pytorch 7 optimizer 优化器加速训练
import torch import torch.utils.data as Data import torch.nn.functional as F import matplotlib.pyplo ...
[源码解析] 深度学习分布式训练框架 horovod (21) --- 之如何恢复训练
[源码解析] 深度学习分布式训练框架 horovod (21) --- 之如何恢复训练目录 [源码解析] 深度学习分布式训练框架 horovod (21) --- 之如何恢复训练 0x00 摘要 0 ...
[源码解析] PyTorch 分布式(14) --使用 Distributed Autograd 和 Distributed Optimizer
[源码解析] PyTorch 分布式(14) --使用 Distributed Autograd 和 Distributed Optimizer 目录 [源码解析] PyTorch 分布式(14) - ...
pytorch adam 源码关于优化函数的调整 optimizer 调参重点
关于优化函数的调整拆下包:https://ptorch.com/docs/1/optim class torch.optim.Optimizer(params, defaults)所有优化的基类. 参 ...
莫烦pytorch学习笔记（七）——Optimizer优化器
各种优化器的比较莫烦的对各种优化通俗理解的视频 import torch import torch.utils.data as Data import torch.nn.functional as ...
Pytorch学习笔记08----优化器算法Optimizer详解（SGD、Adam）
1.优化器算法简述首先来看一下梯度下降最常见的三种变形 BGD,SGD,MBGD,这三种形式的区别就是取决于我们用多少数据来计算目标函数的梯度,这样的话自然就涉及到一个 trade-off,即参数更 ...
pytorch bert 源码解读
https://daiwk.github.io/posts/nlp-bert.html 目录概述 BERT 模型架构 Input Representation Pre-training Tasks ...
Comparison of B-Tree and Hash Indexes
Understanding the B-tree and hash data structures can help predict how different queries perform on ...
基于pytorch的CNN、LSTM神经网络模型调参小结
(Demo) 这是最近两个月来的一个小总结,实现的demo已经上传github,里面包含了CNN.LSTM.BiLSTM.GRU以及CNN与LSTM.BiLSTM的结合还有多层多通道CNN.LSTM. ...

随机推荐

Java架构师线上问题排查，这些命令程序员一定用得到！
Java架构师线上问题排查,这些命令程序员一定用得到! 线上问题排查,以下场景,你遇到过吗? 一.了解机器连接数情况问题:1.2.3.4的sshd的监听端口是22,如何统计1.2.3.4的sshd服 ...
redis 注意事项
1.scan_iter car_key = 'shopping*' # print(car_key) data_li = [] for i in con.scan_iter(car_key): # p ...
Manipulating Data from Oracle Object Storage to ADW with Oracle Data Integrator (ODI)
0. Introduction and Prerequisites This article presents an overview on how to use Oracle Data Integr ...
java中常用的锁机制
基础知识基础知识之一:锁的类型锁就那么几个,只是根据特性,分为不同的类型锁的概念在计算机科学中,锁(lock)或互斥(mutex)是一种同步机制,用于在有许多执行线程的环境中强制对资源的访问限 ...
if continue的用法（跳过本次循环，执行下一个循环）
Python continue 语句跳出本次循环当需要跳过本次循环的时候,使用continue能跳过本次循环,直接下一个循环如下脚本: for url in alllink: if url == ...
Basic Thought / Data Structure: 前缀和 Prefix Sum
Intro: 在OI中,前缀和是一种泛用性很高的数据结构,也是非常重要的优化思想 Function: 求静态区间和模板题:输入序列\(a_{1..n}\),对于每一个输入的二元组\((l,r)\), ...
Python3.6在win7中无法正常运行的问题
Python3.6在启动时报缺少api-ms-win-crt-runtime-l1-1-0.dll解决靠谱方法:1.到正常的机器,或者就在开发环境,去搜索api-ms-win-crt-runtime- ...
Git详解之服务部署
前言到目前为止,你应该已经学会了使用 Git 来完成日常工作.然而,如果想与他人合作,还需要一个远程的 Git 仓库.尽管技术上可以从个人的仓库里推送和拉取修改内容,但我们不鼓励这样做,因为一不留心 ...
Docker底层架构之联合文件系统
联合文件系统(UnionFS)是一种分层.轻量级并且高性能的文件系统,它支持对文件系统的修改作为一次提交来一层层的叠加,同时可以将不同目录挂载到同一个虚拟文件系统下(unite several di ...
Spring博客专栏
1. IOC和DI的理解 2. IOC的实现原理-反射与工厂模式 3. Spring进阶之路 4. SpringBoot配置类的使用 5. @ModelAttribute详解 6. @RequestP ...

pytorch之 optimizer comparison

pytorch之 optimizer comparison的更多相关文章

随机推荐

热门专题