学界 | 华为诺亚方舟实验室提出新型元学习法 Meta-SGD ，在回归与分类任务中表现超群

机器之心发表于机器之心订阅

499

广告关闭

11.11 智慧上云

云服务器企业新用户优先购，享双11同等价格

立即抢购

选自arXiv

机器之心编译

参与：Smith

从小数据中进行学习和调整的能力对于智能化来说是至关重要的，然而，我们现有的深度学习方面的成功则需要高度依赖大量标注数据。最近，华为公司诺亚方舟实验室的几名研究员提出了一种新型优化器 Meta-SGD，它非常易于训练，而且比其它元学习方法速度更快。机器之心对本文做出了概述。

原文链接：https://arxiv.org/pdf/1707.09835.pdf

Few-shot 学习对于那些对每一个任务都进行从零开始的孤立学习的算法来说是很有挑战性的。与之相反，元学习（meta-learning）则可以从很多相关性任务中进行学习，一个元学习者仅利用少量的样本实例就可以更精准且快速地对一个新的任务进行学习，在这里，元学习者的相关选择则是至关重要的。在本篇文章中，我们研发了一种类似于随机梯度下降（SGD），且易于训练的元学习方法，叫做 Meta-SGD，它可以仅在单步中就对任意可微分学习者进行初始化和调整。与流行的元学习者 LSTM 相比较，Meta-SGD 在概念上很简单，易于执行，并且可以被有效地学习。与最新的元学习者 MAML 相比，Meta-SGD 则有着更高的容量，不仅会对学习者初始化（learner initialization）进行学习，而且会对学习者的更新方向（update direction）和学习速率进行学习，所有的过程都是在一个单一元学习流程中完成的。Meta-SGD 在与回归（regression）和分类（classification）相关的 few-shot 学习方面展现出了具有高度竞争力的性能表现。

图 1: Meta-SGD 的 2 级学习过程的相关说明。逐步学习（Gradual learning）在元空间 (θ, α) 中的不同任务中被执行，以对元学习者（meta-learner）进行学习。快速学习（Rapid learning）在学习者空间 θ 中通过学习者被执行，以对特定任务学习者（task-specific learners）进行学习。

元训练

我们的目标是对元学习者进行训练，以让其在多个相关任务中表现出色。出于此种目的，假定在相关性任务空间中有一个分布 p(T)，在这里我们可以随机地对任务进行采样。一个任务 T 包含被记为 train(T) 的一组训练数据以及被记为 test(T) 的一组测试数据。测试集中测试样本的标签也是已知的。我们的目的是使元学习者在任务空间中的期望泛化能力（expected generalization power）最大化。具体来说，给定一个从 p(T) 中采样出来的任务 T，元学习者基于训练集 train(T) 对学习者进行学习，但是泛化损失（ generalization loss）是在测试集 test(T) 上被衡量的。我们的目的是对元学习者进行训练，以对期望泛化损失（expected generalization loss）进行最小化。在数学上，元学习者的学习法作为最优化问题被建立，如下式：

我们可以看到目标函数对 θ 和 α 来说都是可微分的，可以使用随机梯度下降来高效地解决上述优化问题，如图 2 和算法 1 所示。

图 2：Meta-SGD 的元训练过程。

部分实验结果：

1.回归（Regression）

表 1：Meta-SGD 与 MAML 在 few-shot 回归方面的对比情况。

图 3：左：在一个随机 5-shot 回归任务中 Meta-SGD 与 MAML 的对比情况，两种情况下的初始化（虚线）和单步调适（adaption）后的结果（实线）如该图所示。右：在训练样本更多的情况下，Meta-SGD（10-shot 元训练）在元测试中表现地更好。

2. 分类（Classification）

表 2：在 Omniglot 上的分类精度。

表 3：在 MiniImagenet 上的分类精度。

本文为机器之心编译，转载请联系本公众号获得授权。

原文发布于微信公众号 - 机器之心（almosthuman2014）

原文发表时间：2017-08-02

本文参与腾讯云自媒体分享计划，欢迎正在阅读的你也加入，一起分享。

学界 | 华为诺亚方舟实验室提出新型元学习法 Meta-SGD ，在回归与分类任务中表现超群的更多相关文章

CVPR2021 | 华为诺亚实验室提出Transformer in Transformer
前言: transformer用于图像方面的应用逐渐多了起来,其主要做法是将图像进行分块,形成块序列,简单地将块直接丢进transformer中.然而这样的做法忽略了块之间的内在结构信息,为此,这篇论 ...
学界| UC Berkeley提出新型分布式框架Ray：实时动态学习的开端—— AI 应用的系统需求：支持（a）异质、并行计算，（b）动态任务图，（c）高吞吐量和低延迟的调度，以及（d）透明的容错性。
学界| UC Berkeley提出新型分布式框架Ray:实时动态学习的开端 from:https://baijia.baidu.com/s?id=1587367874517247282&wfr ...
DeepMind提出新型超参数最优化方法：性能超越手动调参和贝叶斯优化
DeepMind提出新型超参数最优化方法:性能超越手动调参和贝叶斯优化 2017年11月29日 06:40:37 机器之心V 阅读数 2183 版权声明:本文为博主原创文章,遵循CC 4.0 BY ...
ICML论文｜阿尔法狗CTO讲座： AI如何用新型强化学习玩转围棋扑克游戏
今年8月,Demis Hassabis等人工智能技术先驱们将来到雷锋网“人工智能与机器人创新大会”.在此,我们为大家分享David Silver的论文<不完美信息游戏中的深度强化学习自我对战&g ...
从图像中检测和识别表格，北航＆微软提出新型数据集 TableBank
纯学术的识别表格的文章: http://hrb-br.com/5007404/20190321A0B99Y00.html https://github.com/doc-analysis/TableB ...
ECCV 2018 | 给Cycle-GAN加上时间约束，CMU等提出新型视频转换方法Recycle-GAN
CMU 和 Facebook 的研究者联合进行的一项研究提出了一种新型无监督视频重定向方法 Recycle-GAN,该方法结合了时间信息和空间信息,可实现跨域转换,同时保留目标域的风格.相较于只关注空 ...
微软&中科大提出新型自动神经架构设计方法NAO
近期,来自微软和中国科学技术大学的刘铁岩等人发表论文,介绍了一种新型自动神经架构设计方法 NAO,该方法由三个部分组成:编码器.预测器和解码器.实验证明,该方法所发现的架构在 CIFAR-10 上的图 ...
华为开发者联盟方舟编译器 DevEco IDE
华为开发者联盟 https://developer.huawei.com/consumer/cn/ 方舟编译器是为支持多种编程语言.多种芯片平台的联合编译.运行而设计的统一编程平台,包含编译器.工具链 ...
谷歌推出新型强化学习框架Dopamine
今日,谷歌发布博客介绍其最新推出的强化学习新框架 Dopamine,该框架基于 TensorFlow,可提供灵活性.稳定性.复现性,以及快速的基准测试. GitHub repo:https://git ...

随机推荐

go无缓冲通道
package main import ( "fmt" "math/rand" "sync" "time" ) //wg ...
spring boot + vue 前后分离实现登录功能（二）
安装 axios 进行路由转发 npm install axios --save-dev 或者 cnpm install axios --save-dev 修改 Main.js 新增 var axio ...
jQuery Ajax calls and the Html.AntiForgeryToken()
jQuery Ajax calls and the Html.AntiForgeryToken() https://stackoverflow.com/a/4074289/3782855 I use ...
wmi 远程访问问题解决
WMI远程访问问题解决方法 WMI 全称为:Microsoft Windows Management Instrumentation (WMI) 按微软的介绍大致如下: WMI 是 Mic ...
uboot自定义添加命令
1.添加命令 1.u-boot的命令格式: U_BOOT_CMD(name,maxargs,repeatable,command,”usage”,"help") name:命令的名 ...
VGG网络-ILSVRC-2014亚军
用于大尺度图片识别的非常深的卷积网络使用一个带有非常小的(3*3)的卷积核的结构去加深深度,该论文的一个十分重要的改进就是它将卷机网络的深度增加到了16-19层,且可以用于比较大224*224的图片 ...
38 Flutter仿京东商城项目渲染结算页面商品数据
加群452892873 下载对应38课文件,运行方法,建好项目,直接替换lib目录 CartServices.dart import 'dart:convert'; import 'Storage.d ...
阶段5 3.微服务项目【学成在线】_day09 课程预览 Eureka Feign_11-课程详情页面静态化-课程信息模板设计
测试模板页面的模板已经做好了直接那来用测试模板,把这个模板copy到这个测试freemarker的resources目录远程调用获取数据返回模板的文件名 tomcat不支持ssr.ngin ...
Ubunut16.04 安装 g++ gcc 降级
1. 查看gcc版本和g++版本 cd /usr/bin ls -l gcc* ls -l g++* 2. 安装gcc和g++ 4.4版本 sudo apt-get install gcc-4.4 g ...
python中的列表推导式——轻量级循环
列表推导式(list comprehension)是利用其他列表创建新列表(类似于数学术语中的集合推导式)的一种方法.它的工作方式类似于for循环,也很简单. 列表推导式书写形式: [表达式 for ...

学界 | 华为诺亚方舟实验室提出新型元学习法 Meta-SGD ，在回归与分类任务中表现超群

学界 | 华为诺亚方舟实验室提出新型元学习法 Meta-SGD ，在回归与分类任务中表现超群

学界 | 华为诺亚方舟实验室提出新型元学习法 Meta-SGD ，在回归与分类任务中表现超群的更多相关文章

随机推荐

热门专题