Key

Gradient Descent+LSTM元学习器

解决的主要问题

在之前的机器学习的学习方法中，不会利用到之前的经验，利用到之前经验的“knowledge transfer”（元学习是其中一个）。meta-learner会搜索并找到适合特定学习任务的学习算法。要想有这样的学习方法，必须增加一个监督算法来审查和修改训练算法。现有的方法中是存在“人作为监督器”。

作者主要是通过适当的系统替换人体部分，自动获得这种学习方法的改进。
处理多个自由参数

文章内容

Introduction

介绍元学习系统的组成：固定的监督系统和可调整的从属系统
Theoretical considerations
- 数据如何设置
  - 从属系统input：y(j-1),x(j)
  - 监督属系统input：y(j),x(j),output(从属系统)
  如果元学习系统输出不是正确的target y(j)，元学习系统就会在每个时间点受到惩罚，这就迫使元学习系统对从属算法进行改进，使其变得更快更准确
- 为何选择循环架构LSTM
  
  （公式推导没看懂）
  
  查阅资料上的理解：考虑到梯度爆炸和梯度消失现象，所以使用LSTM
- 从bayes角度理解
  
  元学习可以被视为不断地适应和移动超参数和先验(“归纳偏差移动”)
Experiments

分别实验布尔函数、半线性函数、二次函数
Conclusion

以前的元学习方法对于大量的系统参数是不可行的。为了处理多个自由参数，提出了利用递归网的梯度下降法在元学习中的应用。

理论分析表明，LSTM是一种良好的元学习者，实验也证实了这一点。通过一个LSTM网络，我们的系统得到了一个学习算法，可以在35个例子后近似任何二次函数。

该方法需要一个单一的训练序列，因此，它可能适用于终身学习和自主机器人。

提出的元学习器能够进行非平稳时间序列预测。我们演示了机器如何从零开始推导出新颖、快速的算法

文章方法的优缺点

优点
- 对于含有大量参数的系统，梯度下降处理会比较容易
- LSTM会利用之前经验信息
缺点
- 基于上下文的，RL中在处理的时候需要一个完整episode

论文链接

[版权归原作者 Lee_ing 所有]

未经原作者允许不得转载本文内容，否则将视为侵权；

ICANN 2001-Learning to Learn Using Gradient Descent的更多相关文章

（转）Paper list of Meta Learning/ Learning to Learn/ One Shot Learning/ Lifelong Learning
Meta Learning/ Learning to Learn/ One Shot Learning/ Lifelong Learning 2018-08-03 19:16:56 本文转自:http ...
FITTING A MODEL VIA CLOSED-FORM EQUATIONS VS. GRADIENT DESCENT VS STOCHASTIC GRADIENT DESCENT VS MINI-BATCH LEARNING. WHAT IS THE DIFFERENCE?
FITTING A MODEL VIA CLOSED-FORM EQUATIONS VS. GRADIENT DESCENT VS STOCHASTIC GRADIENT DESCENT VS MIN ...
（转）Introduction to Gradient Descent Algorithm (along with variants) in Machine Learning
Introduction Optimization is always the ultimate goal whether you are dealing with a real life probl ...
[Machine Learning] 梯度下降（BGD）、随机梯度下降（SGD）、Mini-batch Gradient Descent、带Mini-batch的SGD
一.回归函数及目标函数以均方误差作为目标函数(损失函数),目的是使其值最小化,用于优化上式. 二.优化方式(Gradient Descent) 1.最速梯度下降法也叫批量梯度下降法Batch Gr ...
machine learning (7)---normal equation相对于gradient descent而言求解linear regression问题的另一种方式
Normal equation: 一种用来linear regression问题的求解Θ的方法,另一种可以是gradient descent 仅适用于linear regression问题的求解,对其 ...
machine learning(10) -- classification:logistic regression cost function 和使用 gradient descent to minimize cost function
logistic regression cost function(single example) 图像分布 logistic regression cost function(m examples) ...
Logistic Regression and Gradient Descent
Logistic Regression and Gradient Descent Logistic regression is an excellent tool to know for classi ...
(转) An overview of gradient descent optimization algorithms
An overview of gradient descent optimization algorithms Table of contents: Gradient descent variants ...
斯坦福机器学习视频笔记 Week1 Linear Regression and Gradient Descent
最近开始学习Coursera上的斯坦福机器学习视频,我是刚刚接触机器学习,对此比较感兴趣:准备将我的学习笔记写下来, 作为我每天学习的签到吧,也希望和各位朋友交流学习. 这一系列的博客,我会不定期的更 ...
An overview of gradient descent optimization algorithms
原文地址:An overview of gradient descent optimization algorithms An overview of gradient descent optimiz ...

随机推荐

一文带你了解 JS Module 的始末
写在前面模块化开发是我们日常工作潜移默化中用到的基本技能,发展至今非常地简洁方便,但开发者们(指我自己)却很少能清晰透彻地说出它的发展背景, 发展过程以及各个规范之间的区别.故笔者决定一探乾坤,深入 ...
OVS学习博客推荐
博客学习大致看一遍 openvswitch处理upcall过程分析 upcall-cost分析连接跟踪(conntrack):原理.应用及 Linux 内核实现 ovs upcall处理流程 Li ...
Mathematica的Combinatorica`程序包使用笔记
目录官方给出的程序包使用指南和一些示例引论步骤 0x00 导入程序包 0x01 Integer Partitions 0x02 Integer Compositions 0x03 partiti ...
flex弹性盒子中flex-grow与flex的区别
大家在使用flex布局的时候很多情况下都会用到flex-grow这个属性, flex-grow 属性用于设置父元素剩余空间的瓜分比例, flex 属性是 flex-grow.flex-shrink ...
SpringCloud Fegin 负载均衡
Spring Cloud Ribbon 和 Spring Cloud Hystrix 在微服务中实现了客户端负载均衡的服务调用以及通过断路器来保护微服务应用.这两者作为基础工具类框架广泛地应用在各个微 ...
深入理解 Python 虚拟机：字节（bytes）的实现原理及源码剖析
深入理解 Python 虚拟机:字节(bytes)的实现原理及源码剖析在本篇文章当中主要给大家介绍在 cpython 内部,bytes 的实现原理.内存布局以及与 bytes 相关的一个比较重要的优 ...
flutter issue---->Scaffold.of(context)
当我们想showSnackBar的时候,需要通过Scaffold.of(context)得到Scaffold.但是如果这个context用错的话,flutter就会抛出错误.下面我们通过代码仔细看一下 ...
ChatGPT搭建AI网站实战
1.概述 ChatGPT是一款基于GPT-3.5架构的大型语言模型,它能够进行自然语言处理和生成对话等任务.作为一款智能化的聊天机器人,ChatGPT有着广泛的应用场景,如在线客服.智能助手.个性化推 ...
[SpringBoot]Spring Boot Framework @ Environment / ApplicationContext & SpringApplication
[#]: 表示较为重要 1 Spring Boot Overview SpringBoot是一个快速开发框架,快速的将一些常用的第三方依赖整合(原理:通过Maven子父工程的方式),简化XML配置,全 ...
[AIGC]GPT模型概述
2 Open AI: ChatGPT 2.0 ChatGPT 官网 https://openai.com/ https://platform.openai.com/ 原 : https://beta. ...

ICANN 2001-Learning to Learn Using Gradient Descent

Key

解决的主要问题

文章内容

Introduction

Theoretical considerations

Experiments

Conclusion

文章方法的优缺点

ICANN 2001-Learning to Learn Using Gradient Descent的更多相关文章

随机推荐

热门专题