Key

时序卷积+注意力机制（前者从过去的经验中收集信息，而后者则精确定位具体的信息。）

解决的主要问题

手工设计的限制：最近的许多元学习方法都是大量手工设计的，要么使用专门用于特定应用程序的架构，要么使用硬编码算法（已经内置了特定高级策略的一些方面）组件来约束元学习者解决任务的方式。

文章内容

Introduction

使用传统的监督学习或强化学习方法训练的 artificial learners在只有少量数据可用或需要适应不断变化的任务时通常表现不佳，元学习旨在解决这一缺陷，扩大learner的范围，以分配相关的任务。meta-learner训练是一个相似的任务分配、与目标相关的学习策略,概括了但是看不见的任务从一个类似的任务分配，而不是训练学习者在一个任务。

传统上，一个成功的learner发现了一个在数据点上泛化的规则，而一个成功的meta-learner学习了一个在任务上泛化的算法。

元学习可以形式化为一个sequence-to-sequence的问题，在采用这种观点的现有方法中，瓶颈在于元学习者内化和引用过去经验的能力。

Meta-Learning Preliminaries

给定任务T = P(Ti)的分布，元学习者的目标是使其关于θ的期望损失最小化。
A Simple Neural Attentive Meta-Learner
- RNN不足
  
  传统的RNN架构在从一个时间步到下一个时间步的过程中保持信息处于隐藏状态来传播信息，这种时间线性依赖性限制了它们对输入流执行复杂计算的能力
- TC不足
  
  时间卷积(TC)是因果关系，因此在下一个时间步中生成的值只受过去时间步的影响，而不受未来时间步的影响。与传统的rnn相比，它们提供了对过去信息更直接、高带宽的访问，允许它们在固定大小的时间上下文中执行更复杂的计算。
  
  然而，对于长序列，膨胀率一般呈指数级增长，因此所需层数随序列长度呈对数级增长。因此，他们可以更粗略地访问更早以前的输入;对于元学习者来说，他们有限的容量和位置的依赖是不可取的，元学习者应该能够充分利用越来越多的经验
- soft attention不足
  
  相比之下，软注意允许模型从潜在的无限大的背景中精确定位特定的信息。它将上下文视为无序的键值存储，可以根据每个元素的内容进行查询。
  
  然而，缺乏位置依赖也可能是不可取的，特别是在强化学习中，在这种学习中，观察、行动和奖励本质上是连续的。
- SNAIL
  - 结合：
    
    TC以有限的上下文大小为代价提供高带宽访问
    
    soft attention在无限大的上下文上提供精确访问
  - 结构：TC层+attention层+TC层+attention层
    
    它根据当前的观察结果以及之前的观察结果、行动和奖励，输出操作的分布。
    
    通过将TC层与因果注意层交错，SNAIL可以在其过去经验的基础上获得高带宽访问，而不会受到有效使用经验量的限制。通过在一个端到端训练的模型的多个阶段使用注意力，SNAIL可以学习从它收集的经验中挑选出哪些信息，以及容易做到这一点的特征表示
  - 网络blocks
    
    composition：A dense block、A TC block、A attention block
    
    【其中A dense block是为了加速深度卷积训练（batch normalization、residual connections、dense connections都可以加速）】
Experiments
- 研究问题
  - SNAIL的普遍性如何影响它在一系列元学习任务中的表现?
  - 与专门针对特定任务领域的现有方法相比，它的性能如何，或已经内置了高级策略的元素?
  - SNAIL如何适应高维输入和长期时间依赖关系?
- 实验设置（与RL2实验相似，并参考了里面数据）
  - 赌博机实验
  - 表格MDPs
  - 可视化航行
  - 连续动作
Conclusion

简单神经注意学习者(SNAIL)利用了一种新的时间卷积和因果注意的组合，这是两个具有互补优势和弱点的序列对序列模型的构建模块。

未来：终身学习，即训练一个可以在其整个生命周期中都参与的元学习者(而不是像本研究中那样，只在最近几次经历中参与)。具有终身记忆的代理人可以学习得更快，概括得更好;然而，为了保持计算需求的实用性，它还需要学习如何决定哪些经历值得记住。

元学习方法的核心是在性能和普遍性之间进行权衡

文章方法的优缺点

优点
- 与传统的rnn(如LSTM或gru)相比，SNAIL更容易训练（RNN：底层的优化可能会很困难，因为存在时间线性的隐藏状态依赖关系）
- 有效地实现整个序列可以在单个向前传递中处理
缺点
- 基于上下文的，RL中在处理的时候需要一个完整episode

Summary

这篇论文对RNN的长期依赖性提出了两点解决方法：TC时序卷积（允许访问更久之前的信息），注意力机制（弥补TC有限容量的问题，进行键值访问，精确定位特定的信息）。相对于前几次论文中，SNAIL着重解决于网络架构问题，通过网络架构的优化来提高学习效率。

【疑问】但是如果访问之前更久的信息，会不会增大计算量以及时间？Meta-learner是否能够充分的利用之前更久的信息？如果相对于更久信息和较近信息内部特征相似时，learner该如何取舍？

论文链接

 版权归原作者 Lee_ing 所有

未经原作者允许不得转载本文内容，否则将视为侵权；转载或者引用本文内容请注明来源及原作者；

ICLR 2018-A Simple Neural Attentive Meta-Learner的更多相关文章

PyNest——Part1:neurons and simple neural networks
neurons and simple neural networks pynest – nest模拟器的界面神经模拟工具(NEST:www.nest-initiative.org)专为仿真点神经元的 ...
AB实验人群定向HTE模型5 - Meta Learner
Meta Learner和之前介绍的Casual Tree直接估计模型不同,属于间接估计模型的一种.它并不直接对treatment effect进行建模,而是通过对response effect(ta ...
NASH：基于丰富网络态射和爬山算法的神经网络架构搜索 | ICLR 2018
论文提出NASH方法来进行神经网络结构搜索,核心思想与之前的EAS方法类似,使用网络态射来生成一系列效果一致且继承权重的复杂子网,本文的网络态射更丰富,而且仅需要简单的爬山算法辅助就可以完成搜索,耗时 ...
UOJ#435. 【集训队作业2018】Simple Tree 树链剖分,分块
原文链接www.cnblogs.com/zhouzhendong/p/UOJ435.html 前言分块题果然是我这种蒟蒻写不动的.由于种种原因,我写代码的时候打错了很多东西,最致命的是数组开小了.* ...
【UOJ#435】【集训队作业2018】Simple Tree 分块+树链剖分
题目大意: 有一棵有根树,根为 1 ,点有点权.现在有 m 次操作,操作有 3 种:1 x y w ,将 x 到 y 的路径上的点点权加上 w (其中 w=±1w=±1 ):2 x y ,询问在 x ...
@uoj - 435@ 【集训队作业2018】Simple Tree
目录 @description@ @solution@ @accepted code@ @details@ @description@ 有一棵有根树,根为 1,点有点权. 现在有 m 次操作,操作有 ...
基于层级表达的高效网络搜索方法 | ICLR 2018
论文基于层级表达提出高效的进化算法来进行神经网络结构搜索,通过层层堆叠来构建强大的卷积结构.论文的搜索方法简单,从实验结果看来,达到很不错的准确率,值得学习来源:[晓飞的算法工程笔记] 公众号 ...
ICLR 2018 | Deep Gradient Compression: Reducing the Communication Bandwidth for Distributed Training
为了降低大规模分布式训练时的通信开销,作者提出了一种名为深度梯度压缩(Deep Gradient Compression, DGC)的方法.DGC通过稀疏化技术,在每次迭代时只选择发送一部分比较&qu ...
最新小样本学习综述 A Survey on Few-Shot Learning | 四大模型Multitask Learning、Embedding Learning、External Memory…
目录原文链接: 小样本学习与智能前沿 01 Multitask Learning 01.1 Parameter Sharing 01.2 Parameter Tying. 02 Embedding ...
Generalizing from a Few Examples: A Survey on Few-Shot Learning 小样本学习最新综述 | 三大数据增强方法
目录原文链接:小样本学习与智能前沿 01 Transforming Samples from Dtrain 02 Transforming Samples from a Weakly Labeled ...

随机推荐

30天帮你一步步学会Python的开源项目
最近发现一个不错的免费开源学习项目:30天学会Python 如果您最近有学习Python的打算,不妨看看这个是否适合你? 项目地址:https://github.com/Asabeneh/30-Day ...
Cisco Packet Tracer(思科模拟器)安装，注册用户
下载下载地址见湖南科技大学老师:http://mooc1.xueyinonline.com/nodedetailcontroller/visitnodedetail?courseId=2226402 ...
网络安全(中职组)-B模块:Web隐藏信息获取
Web隐藏信息获取任务环境说明:服务器场景名:web20200604服务器场景用户名:未知(关闭链接) 1. 通过本地PC中渗透测试平台Kali使用Nmap扫描目标靶机HTTP服务子目录,将扫描 ...
今日Python相关练习
1.计算日期范围内的所有日期 def get_date_list(begin_date,end_date): date_list = [] while begin_date <= end_dat ...
Three.js 进阶之旅：物理效果-3D乒乓球小游戏 🏓
声明:本文涉及图文和模型素材仅用于个人学习.研究和欣赏,请勿二次修改.非法传播.转载.出版.商用.及进行其他获利行为. 摘要本文在专栏上一篇内容<Three.js 进阶之旅:物理效果-碰撞和声 ...
ABAP 调用HTTP上传附件（二）之中文乱码
1.这篇文章的由来之前已经发表了<ABAP 调用HTTP上传附件>的文章,详细介绍了如何通过HTTP请求传输附件,可点击链接参考原有文档因为之前对传输文件的中文文件名处理上解释不够详细 ...
Hash 表
更多内容,前往 IT-BLOG 哈希表(Hash table,也叫散列表),是根据关键码值(Key value)而直接进行访问的数据结构.也就是说,它通过把关键码值映射到表中一个位置来访问记录,以加快 ...
小编亲身实操，教你配置phpstorm与xdebug的调试配置，不成功你骂我
开发php,还是找个专业的Ide较好,vscode毕竟在php上不专业,需要下载各种插件才行,还不支持多线程调试,因此小编下载了phpstorm,打算以后用phpstorm来开发php项目,断点调试代 ...
【超详细】Ubuntu 20.04 安装 Apache+PHP网页环境图文教程，常见问题和解决方案
本文将介绍在Ubuntu20.04 LTS环境下安装Apache的全过程,针对其中可能出现的一些坑也会提供解决方案. 作者:Eriktse 简介:19岁,211计算机在读,现役ACM银牌选手力争以通俗 ...
webrtc QOS笔记三 Nack机制浅析
nack源码浅析 nack源码浅析 Video Nack nack模块 nack list keyFrame list & recovered list nack 发送的策略 nack 模块的 ...

ICLR 2018-A Simple Neural Attentive Meta-Learner

Key

解决的主要问题

文章内容

Introduction

Meta-Learning Preliminaries

A Simple Neural Attentive Meta-Learner

Experiments

Conclusion

文章方法的优缺点

Summary

ICLR 2018-A Simple Neural Attentive Meta-Learner的更多相关文章

随机推荐

热门专题