Deep Learning —— 异步优化器 —— RMSpropAsync —

看到了一个概念，叫做异步更新优化器，也就是使用异步的方式实现deep learning中的参数优化的method，这个概念比较新奇，虽然看到的异步更新神经网络的代码比较多，但是很少见到有人单独把异步优化器这个概念单独提出来，大部分实现异步更新的算法中都是对各个线程加锁以实现异步更新神经网络参数的。

那么这种单独的异步优化器（RMSpropAsync）和加Lock锁的异步更新参数的方法有什么不同呢？

看了一下其实没啥不同的，可以说基本就是一个东西，只不过实现方法不同而已。我们现在所使用的优化器除了SGD（随机梯度下降）方法外都是要保存之前计算梯度下降的过程结果的，这个过程结果也叫做“二阶动量部分”，使用异步优化器（RMSpropAsync）方法则是在不同线程进行梯度更新时从全局中取出这个之前的计算结果，保存在自己的线程中，因此每个线程在更新时都会单独从全局中取出并保存一份过程结果，并在线程内进行计算并得到更新后的神经网络参数，但是要注意，由于异步优化器（RMSpropAsync）一般不采用加锁的方法，因此在更新“二阶动量部分”和神经网络参数部分已经可能与其他线程发生竞争，因此如果不加锁异步优化器（RMSpropAsync）是不能完全保证线程安全的。

可以说，不加锁的异步优化器（RMSpropAsync）只能一定程度上减少线程竞争带来的不同步问题，但是根据一些网上的资料显示，该种方式其最大优点时加快异步优化器的运算，也就是说提速才是该方法的主要目的。

============================================

不过也有些代码实现对异步优化器（RMSpropAsync）采用了一些微小的差异改变，如：

代码地址：

https://github.com/chainer/chainerrl/blob/master/chainerrl/optimizers/rmsprop_async.py

异步优化器（RMSpropAsync）代码：

    def init_state(self, param):

        xp = cuda.get_array_module(param.array)

        with cuda.get_device_from_array(param.array):

            self.state['ms'] = xp.zeros_like(param.array)

    def update_core_cpu(self, param):

        grad = param.grad

        if grad is None:

            return

        hp = self.hyperparam

        ms = self.state['ms']

        ms *= hp.alpha

        ms += (1 - hp.alpha) * grad * grad

        param.array -= hp.lr * grad / numpy.sqrt(ms + hp.eps)

    def update_core_gpu(self, param):

        grad = param.grad

        if grad is None:

            return

        cuda.elementwise(

            'T grad, T lr, T alpha, T eps',

            'T param, T ms',

            '''ms = alpha * ms + (1 - alpha) * grad * grad;

               param -= lr * grad / sqrt(ms + eps);''',

            'rmsprop')(grad, self.hyperparam.lr, self.hyperparam.alpha,

                       self.hyperparam.eps, param.array, self.state['ms'])

优化器（RMSpropAsync）代码：

----------------------------------------------------------------------

可以看到在这个框架下所实现的差别是epsilon变量是否在开方运算内：

RMSprop for asynchronous methods.

The only difference from chainer.optimizers.RMSprop in that the epsilon is

outside the square root.

================================================

附注：

Deep Learning —— 异步优化器 —— RMSpropAsync —— 异步RMSprop的更多相关文章

（1）Deep Learning之感知器
What is deep learning? 在人工智能领域,有一个方法叫机器学习.在机器学习这个方法里,有一类算法叫神经网络.神经网络如下图所示: 上图中每个圆圈都是一个神经元,每条线表示神经元之间 ...
深度学习（deep learning）优化调参细节（trick）
https://blog.csdn.net/h4565445654/article/details/70477979
机器学习(Machine Learning)&深度学习(Deep Learning)资料
机器学习(Machine Learning)&深度学习(Deep Learning)资料機器學習.深度學習方面不錯的資料,轉載. 原作:https://github.com/ty4z2008 ...
Tensorflow-各种优化器总结与比较
优化器总结机器学习中,有很多优化方法来试图寻找模型的最优解.比如神经网络中可以采取最基本的梯度下降法. 梯度下降法(Gradient Descent) 梯度下降法是最基本的一类优化器,目前主要分为三 ...
深度学习——优化器算法Optimizer详解（BGD、SGD、MBGD、Momentum、NAG、Adagrad、Adadelta、RMSprop、Adam）
在机器学习.深度学习中使用的优化算法除了常见的梯度下降,还有 Adadelta,Adagrad,RMSProp 等几种优化器,都是什么呢,又该怎么选择呢? 在 Sebastian Ruder 的这篇论 ...
【深度学习】深入理解优化器Optimizer算法（BGD、SGD、MBGD、Momentum、NAG、Adagrad、Adadelta、RMSprop、Adam）
在机器学习.深度学习中使用的优化算法除了常见的梯度下降,还有 Adadelta,Adagrad,RMSProp 等几种优化器,都是什么呢,又该怎么选择呢? 在 Sebastian Ruder 的这篇论 ...
Deep Learning基础--参数优化方法
1. 深度学习流程简介 1)一次性设置(One time setup) -激活函数(Activation functions) - 数据预处理(Data Preprocessing) ...
【python实现卷积神经网络】优化器的实现（SGD、Nesterov、Adagrad、Adadelta、RMSprop、Adam）
代码来源:https://github.com/eriklindernoren/ML-From-Scratch 卷积神经网络中卷积层Conv2D(带stride.padding)的具体实现:https ...
Yarn源码分析之事件异步分发器AsyncDispatcher
AsyncDispatcher是Yarn中事件异步分发器,它是ResourceManager中的一个基于阻塞队列的分发或者调度事件的组件,其在一个特定的单线程中分派事件,交给AsyncDispatch ...
优化器，SGD+Momentum；Adagrad；RMSProp；Adam
Optimization 随机梯度下降(SGD): 当损失函数在一个方向很敏感在另一个方向不敏感时,会产生上面的问题,红色的点以“Z”字形梯度下降,而不是以最短距离下降:这种情况在高维空间更加普遍. ...

随机推荐

腾讯视频遇到“前设备播放4K可能引发卡顿等异常，建议降低清晰度”
腾讯视频遇到"前设备播放4K可能引发卡顿等异常,建议降低清晰度". 解决方法: 在菜单-设置-播放设置-勾选"开启硬件加速"-应用,然后退出腾讯视频,重新打开腾 ...
dubbo~全局异常拦截器的使用与设计缺陷~续
上一次的介绍,主要围绕如何统一去捕获异常,以及为每一种异常添加自己的Mapper实现,并且我们知道,当在ExceptionMapper中返回非200的Response,不支持application/j ...
如何监控文件变化，比如密码修改导致 shadow 文件变化
原始需求是如果系统的密码被修改,或者创建了新用户,就告警出来.本质上,只需要监控 /etc/shadow 文件变化即可.但是在指标监控体系里,这个事情就比较棘手,只能把文件的 mtime 作为指标的值 ...
mysql备份实战
1.备份恢复演练(mysqldump+binlog) 知识储备如下内容.. 全量备份全量数据,指的是某一整个数据库(如kings)中所有的表.以及表数据,进行备份. 例如备份所有数据库.以及所有数 ...
升级babel7后，直接引用element-ui中没有暴露出来的组件image-viewer.vue导致的打包错误
问题 & 解决方案升级babel7后,原先代码中像这样直接引用element-ui组件的地方,出现了报错 Module parse failed: Unexpected token (1:0 ...
Atcoder Beginner Contest 324 G Generate Arrays 题解-Treap
为了更好的阅读体验,请点击这里题目链接套上平衡树板子就能做的很快的题,然后因为是指针存树,因此交换只需要把序列大小较小的挨个拿出来插到相应的地方即可.复杂度 $O(N \log^2 N)$. ...
MySQL自定义函数(User Define Function)开发实例——发送TCP/UDP消息
开发背景当数据库中某个字段的值改为特定值时,实时发送消息通知到其他系统. 实现思路监控数据库中特定字段值的变化可以用数据库触发器实现.还需要实现一个自定义的函数,接收一个字符串参数,然后将这个字符 ...
Ubuntu 18.04 安装OneDrive自动同步
Ubuntu 18.04 安装OneDrive自动同步 Windows10系统已经自带了OneDrive的自动同步功能,对于多设备用户而言已经成为了一个非常方便传输保存文件的途径,在Ubuntu下也有 ...
Linux 修改 hostname
背景之前安装Linux系统的时候,没有明确指定.现在因为在做某些实验的时候,为了更好地区分我所登录的每一台服务器. 于是有了此文. 做法首先修改/etc/hostname,修改为自己想要的名字xx ...
【Hive报错】java.lang.NoSuchMethodError(com.facebook.fb303.FacebookService$Client.sendBaseOneway
Hive2.3版本 Hadoop2.7版本执行hive命令报错: 报错内容: CONSOLE#21/03/24 17:32:54 ERROR ql.Driver: FAILED: Hive Inte ...

Deep Learning —— 异步优化器 —— RMSpropAsync —— 异步RMSprop

Deep Learning —— 异步优化器 —— RMSpropAsync —— 异步RMSprop的更多相关文章

随机推荐

热门专题