Learning to Learn and Predict: A Meta-Learning Approach for Multi-Label Classification

Learning to Learn and Predict: A Meta-Learning Approach for Multi-Label Classification

2019-10-01 11:29:54

Paper: https://arxiv.org/pdf/1909.04176.pdf

1. Background and Motivation:

多标签分类问题的目标是同时进行多个 label 的识别，且这些 label 是有一定关联的；而传统的多类别分类问题，仅仅是一个样本包含一个 label。现有的方法，从统计模型到神经网络的方法，都是共享标准的交叉熵损失函数进行训练的。在训练之后，这些模型尝试用单个预测策略来对所有的 label 进行最终的预测。实际上，这些方法都是基于如下的假设：no dependency among the labels。然而，如图1 所示，这种假设在实际情况下是很难满足的，但是 multi-label classification 的 label 依赖关系的问题却很少受到关注。

由于受到标签依赖关系的影响，这些 label 的预测难度是大不相同的。

首先，高层的 label 更加容易进行分类，如：organization，person 等；但是更加低层的 label，如 news，broadcast 等，则更加困难。

其次，对于 label 之间没有显示关系的，可能仍然存在着一些隐层的关系，这在 NLP 领域中，是相当常见的。

基于上述观察，作者考虑学习不同的训练策略和预测策略来进行多标签的识别。

对于所有 label 的训练和预测策略，可以看做是一系列的超参数。然而，想要指定显示和隐式的标签依赖，也是不显示的。为了解决上述问题，本文提出一种 meta-learning 的框架来建模这些 label dependency，然后自动的学习训练和测试策略。具体来说，作者引入一种联合 meta-learning 和 multi-label classification 的学习框架。作者用一种基于 GRU 的 meta-learner 在训练阶段来捕获 label dependencies 和学习这些参数。

本文的贡献可以总结为如下几点：

1). 首次在多标签分类问题上，提出联合的 “learning to learn” 和 “learning to predict” 。

2). 本文方法可以对每一个 label 学习一个 weight 和 decision policy，并且可以用于训练和测试阶段。

3). 本文方法是一种 model-agnostic，可以结合到多种模型中，并且取得了比 baseline 方法要好很多的效果。

2. The Proposed Method：

2.1 Classifier Model：

对于一个 N 类的多标签分类问题来说，我们将训练策略表示为 w，测试策略表示为 p，其中 wi 和 pi 是第 i 类的训练权重和预测阈值。wt 和 pt 表示时刻 t 的权重向量和阈值向量。然后，本文的学习目标就变成了：learn a high-quality w and p for a certain classifier C. 为了更新分类器 C 的参数，作者在每个时刻采样一个 batch Bt。然后设置一个加权的交叉熵目标函数来更新 C，定义如下：

其中，$y_i^*$ 表示第 i 个样本的真值，$y_i^{(j)}$ 是输出向量 yi 的第 j 个值。

2.2 Meta-Learner：

作者这里认为 meta-learning 是一种 reinforcement learning 技术。而每一个时刻，meta-learner 观测到当前的状态 st，然后产生一个训练策略 wt 和测试策略 pt，基于这些策略，分类器 C 的参数可以进行更新。在训练后，meta-learner 接收到一个奖励 rt。而本文 meta-learner 的目标就是选择两个策略，使得将来的奖励最大化：

2.2.1　　State Representation：

在本文中，作者将 meta-learner 建模为 RNN 结构，实际上用的是 GRU。状态表达 st 直接定义为 GRU 在每一个时刻 t 的隐层状态 ht。然后，st 是根据如下的公式进行计算的：

其中，GRU 在时刻 t 的输入是预测策略和训练策略的组合。

2.2.2　　Policy Generation：

在每一个时间步骤，meta-learner 可以产生两个策略，即：训练策略 wt 和预测策略 pt。这两个策略均被表达为 N-dimensional 的向量格式。为了将训练策略 wt 结合到交叉熵的目标函数中，并且保持 classifier 的训练梯度在同一个数量级，wt 需要满足加和为 1 的约束。然后，在每一个时刻 t，训练策略可以按照如下的方法得到：

对于测试策略，其定义为：

在上述两个公式中，除了 st 是状态外，其他的参数都是可学习的参数。

2.2.3　　Reward Function：

奖励按照如下的公式进行计算：

其中，$y_i$ 是第 i 个样本的输出概率，$y_i^*$ 是对应的真值向量。作者这里也给了一个例子，来说明奖励的计算过程：

2.3　　Training and Testing：

Learning to Learn and Predict: A Meta-Learning Approach for Multi-Label Classification的更多相关文章

（转）Paper list of Meta Learning/ Learning to Learn/ One Shot Learning/ Lifelong Learning
Meta Learning/ Learning to Learn/ One Shot Learning/ Lifelong Learning 2018-08-03 19:16:56 本文转自:http ...
什么是 Meta Learning / Learning to Learn ?
Learning to Learn Chelsea Finn Jul 18, 2017 A key aspect of intelligence is versatility – the cap ...
[转载]Meta Learning单排小教学
原文链接:Meta Learning单排小教学虽然Meta Learning现在已经非常火了,但是还有很多小伙伴对于Meta Learning不是特别理解.考虑到我的这个AI游乐场将充斥着Meta ...
【元学习】Meta Learning 介绍
目录元学习(Meta-learning) 元学习被用在了哪些地方? Few-Shot Learning(小样本学习) 最近的元学习方法如何工作 Model-Agnostic Meta-Learnin ...
The Rise of Meta Learning
The Rise of Meta Learning 2019-10-18 06:48:37 This blog is from: https://towardsdatascience.com/the- ...
【MetaPruning】2019-ICCV-MetaPruning Meta Learning for Automatic Neural Network Channel Pruning-论文阅读
MetaPruning 2019-ICCV-MetaPruning Meta Learning for Automatic Neural Network Channel Pruning Zechun ...
论文笔记：Visual Question Answering as a Meta Learning Task
Visual Question Answering as a Meta Learning Task ECCV 2018 2018-09-13 19:58:08 Paper: http://openac ...
深度学习课程笔记（十七）Meta-learning (Model Agnostic Meta Learning)
深度学习课程笔记(十七)Meta-learning (Model Agnostic Meta Learning) 2018-08-09 12:21:33 The video tutorial can ...
论文阅读之：Deep Meta Learning for Real-Time Visual Tracking based on Target-Specific Feature Space
Deep Meta Learning for Real-Time Visual Tracking based on Target-Specific Feature Space 2018-01-04 ...

随机推荐

linux-Windows文件上传Linux
使用Xshell5工具: 1.使用cmd在Windows上压缩文件 2.在Xshell5上使用SSH协议与Linux服务器建立连接 3.新建文件传输 4.切换到Linux文件目录 5.使用put命令进 ...
idea在maven中引入了jar包依赖，但是编译过程中报出XXX程序包不存在，已解决
idea在maven中引入了jar包依赖,但是编译过程中报出XXX程序包不存在 1. 报错具体情况 2. Project Structure中的Libraries没有任何红色波浪线 3. 发现自己要引 ...
Golang: 创建Web服务
使用 Go 语言,我们可以轻松创建出 Web 服务,这一点比 Node.js 还要简单,今天就来总结一下 Go 语言中 Web 服务的创建方式. 首先,我们需要引入 net/http 这个包来处理 H ...
Linux安装在虚拟机上
虚拟机上安装centos7 minimal 详细操作链接:https://blog.csdn.net/babyxue/article/details/80970526 镜像文件 xxx.iso 本质就 ...
使用MPU6050陀螺仪自制Arduino数字量角器
MPU6050惯性单元是一个3轴加速度计和一个3轴陀螺仪组合的单元.它还包含温度传感器和DCM,可执行复杂的任务. MPU6050通常用于制作无人机和其他远程控制机器人,如自平衡机器人.在本篇文章中, ...
discuz添加标签聚合页
discuz使用视频教程前段时间把discuz原本的标签聚合页修改了一下,原本的标签聚合页只显示100条最新的标签,把它修改成了所有标签都显示,并加上分页. 修改方法: 1.修改/source/mod ...
includes方法使用 Object.defineProperty 扩展，解决不兼容问题
原文链接 https://developer.mozilla.org/zh-CN/docs/Web/JavaScript/Reference/Global_Objects/Array/includes ...
iOS App开发那些事：如何选择合适的人、规范和框架？
http://www.cocoachina.com/ios/20141202/10386.html 自从做Team Leader之后,身上权责发生了变化,于是让我烦恼的不再是具体某个功能,某个界面的实 ...
The Role of View Controllers
https://developer.apple.com/library/content/featuredarticles/ViewControllerPGforiPhoneOS/index.html# ...
PHP函数file_get_contents()使用 https 协议时报错：SSL operation failed
场景: file_get_contents() 函数是用于将文件的内容读入到一个字符串中,是读取文件内容常用的函数之一. 但是有时在服务器上使用file_get_contents() 函数请求http ...

Learning to Learn and Predict: A Meta-Learning Approach for Multi-Label Classification

Learning to Learn and Predict: A Meta-Learning Approach for Multi-Label Classification的更多相关文章

随机推荐

热门专题