MATLAB常见的学习率下降策略

凯鲁嘎吉 - 博客园 http://www.cnblogs.com/kailugaji/

1. 几种常见的学习率下降策略（learning rate decay strategy）

t：自变量，迭代次数，λ(t)：因变量，学习率，T：常量，最大迭代次数，其他参数均为常量，可自行设定。可以设定初始学习率λ(0)：

1) exp

2) inv

3) plot

4) sigmoid

5) cosine_decay

6) Gaussian

2. MATLAB程序

function learning_rate_decay(choose)

% Author: kailugaji 凯鲁嘎吉 - 博客园 http://www.cnblogs.com/kailugaji/

max_iter=1000;

y=zeros(1, max_iter);

t=1:max_iter;

if choose==1

    % cosine decay

    y(t)=0.5*(1+cos(pi*t/max_iter));

elseif choose==2

    % plot p>1:凹曲线, 0<p<1:凸曲线

    p=0.25;

    y(t)=(1-(t/max_iter)).^p;

elseif choose==3

    % inv

    gamma=0.99; p=0.25;

    y(t)=(1+gamma*t).^(-p);

elseif choose==4

    % exp

    gamma=0.99;

    y(t)=gamma.^t;

elseif choose==5

    % sigmoid

    gamma=-0.01; stepsize=max_iter/2;

    y(t)=1./(1+exp(-gamma*(t-stepsize)));

elseif choose==6

    % Gaussian

    sigma=300;

    y(t)=exp(-(t.^2)/(2*(sigma^2)));

else

    disp('input error!');

end

%%

plot(t, y);

axis([1, max_iter, 0, 1]);

xlabel('iter');

ylabel('learning rate');

3. 学习率衰减

4. 参考文献

梯度下降学习率的设定策略

Tensorflow中learning rate decay的奇技淫巧

TensorFlow学习－－学习率衰减/learning rate decay

图像分类训练技巧集锦（论文笔记）

邱锡鹏, 神经网络与深度学习[M]. 2019.

MATLAB常见的学习率下降策略的更多相关文章

史上最全学习率调整策略lr_scheduler
学习率是深度学习训练中至关重要的参数,很多时候一个合适的学习率才能发挥出模型的较大潜力.所以学习率调整策略同样至关重要,这篇博客介绍一下Pytorch中常见的学习率调整方法. import torch ...
机器学习_线性回归和逻辑回归_案例实战：Python实现逻辑回归与梯度下降策略_项目实战：使用逻辑回归判断信用卡欺诈检测
线性回归: 注:为偏置项,这一项的x的值假设为[1,1,1,1,1....] 注:为使似然函数越大,则需要最小二乘法函数越小越好线性回归中为什么选用平方和作为误差函数?假设模型结果与测量值误差满足 ...
【转载】 PyTorch学习之六个学习率调整策略
原文地址: https://blog.csdn.net/shanglianlm/article/details/85143614 ----------------------------------- ...
tensorflow中的学习率调整策略
通常为了模型能更好的收敛,随着训练的进行,希望能够减小学习率,以使得模型能够更好地收敛,找到loss最低的那个点. tensorflow中提供了多种学习率的调整方式.在https://www.tens ...
PyTorch学习之六个学习率调整策略
PyTorch学习率调整策略通过torch.optim.lr_scheduler接口实现.PyTorch提供的学习率调整策略分为三大类,分别是有序调整:等间隔调整(Step),按需调整学习率(Mul ...
深度学习训练过程中的学习率衰减策略及pytorch实现
学习率是深度学习中的一个重要超参数,选择合适的学习率能够帮助模型更好地收敛. 本文主要介绍深度学习训练过程中的6种学习率衰减策略以及相应的Pytorch实现. 1. StepLR 按固定的训练epoc ...
tensorflow中常用学习率更新策略
神经网络训练过程中,根据每batch训练数据前向传播的结果,计算损失函数,再由损失函数根据梯度下降法更新每一个网络参数,在参数更新过程中使用到一个学习率(learning rate),用来定义每次参数 ...
matlab练习程序（演化策略ES）
还是这本书上的内容,不过我看演化计算这一章是倒着看的,这里练习的算法正好和书中介绍的顺序是相反的. 演化策略是最古老的的演化算法之一,和上一篇DE算法类似,都是基于种群的随机演化产生最优解的算法. 算 ...
matlab常见使用
可以新建一个.m文件,将代码放入其中 1.求平均 A=[ 1 2; 3 4; ] a=mean(A,1) %按列平均 b=mean(A,2) %按行平均 c=mean(A(:)) %全部平均 2.清屏 ...

随机推荐

java中的IO流操作总结
概要:
pymysql增删改查操作
表结构 CREATE TABLE `students` ( `id` int(10) unsigned NOT NULL AUTO_INCREMENT, `name` varchar(20) DEFA ...
python-初始网络编程
一.服务端和客户端 BS架构 (腾讯通软件:server+client) CS架构 (web网站) C/S架构与socket的关系: 我们学习socket就是为了完成C/S架构的开发二.OSI七层 ...
Export Receives The Errors ORA-1555 ORA-22924 ORA-1578 ORA-22922 (Doc ID 787004.1)
Export Receives The Errors ORA-1555 ORA-22924 ORA-1578 ORA-22922 (Doc ID 787004.1) APPLIES TO: Oracl ...
【tf.keras】Resource exhausted: OOM when allocating tensor with shape [9216,4096] and type float on /job:localhost/replica:0/task:0/device:GPU:0 by allocator GPU_0_bfc
运行以下类似代码: while True: inputs, outputs = get_AlexNet() model = tf.keras.Model(inputs=inputs, outputs= ...
deepin安装nginx失败记录
问题描述在deepin系统中,apt install nginx 返回信息报错: nginx 依赖于 nginx-full (<< 1.10.3-1+deb9u2.1~) | nginx ...
物理像素[设备像素] & 逻辑像素[CSS像素]；
为什么移动端CSS里面写了1px,实际上看起来比1px粗了解设备物理像素和逻辑像素的同学应该很容易理解,其实这两个px的含义其实是不一样的, UI设计师要求的1px是指设备的物理像素1px,而CSS ...
2019年最新50道java基础部分面试题（二）
前11题请看上一篇文章 12.静态变量和实例变量的区别? 在语法定义上的区别:静态变量前要加static关键字,而实例变量前则不加. 在程序运行时的区别:实例变量属于某个对象的属性,必须创建了实例对 ...
【AtCoder】AtCoder Grand Contest 039 解题报告
点此进入比赛 \(A\):Connection and Disconnection(点此看题面) 大致题意: 给你一个字符串,将它重复\(k\)次.进行尽量少的操作,每次修改一个位置上的字符,使得不存 ...
Linux 命名管道
前文中笔者介绍了管道,本文接着介绍命名管道.文中演示所用环境为 Ubuntu 18.04 desktop. 命名管道(named pipe)又被称为先进先出队列(FIFO),是一种特殊的管道,存在于文 ...

MATLAB常见的学习率下降策略

MATLAB常见的学习率下降策略

1. 几种常见的学习率下降策略（learning rate decay strategy）

1) exp

2) inv

3) plot

4) sigmoid

5) cosine_decay

6) Gaussian

2. MATLAB程序

3. 学习率衰减

4. 参考文献

MATLAB常见的学习率下降策略的更多相关文章

随机推荐

热门专题