论文解读(MetaAdapt)《MetaAdapt: Domain Adaptive Few-Shot Misinformation Detection via Meta Learning》
Note:[ wechat:Y466551 | 可加勿骚扰,付费咨询 ]
论文信息
论文标题:MetaAdapt: Domain Adaptive Few-Shot Misinformation Detection via Meta Learning
论文作者:Zhenrui Yue、Huimin Zeng、Yang Zhang、Lanyu Shang、Dong Wang
论文来源:2023 ACL
论文地址:download
论文代码:download
视屏讲解:click
1 介绍
出发点:域偏移导致的性能下降 ;
简介:为了解决数据稀缺性的问题,提出了一种基于元学习的领域自适应小样本错误信息检测方法。MetaAdapt 利用有限的目标例子来提供反馈,并指导从源领域到目标领域的知识转移。特别地,本文用多个源任务来训练初始模型,并计算它们与元任务的相似性得分。基于相似性得分,重新调整了元梯度,以自适应地从源任务中学习;
2 方法

场景:
小样本元域适应:源域带标记数据+目标域 k-shot 带标记数据;
2.1 MetaAdapt
双层优化目标(训练目标):
$\underset{\boldsymbol{\theta}}{\text{min}}\frac{1}{n} \sum^{n} \mathcal{L}\left(\mathcal{A} l g\left(\boldsymbol{\theta}, \operatorname{Sampler}\left(\boldsymbol{X}_{s}\right)\right), \boldsymbol{X}_{t}^{\prime}\right) \quad\quad(1)$
内部优化目标(源域):
$\mathcal{A} l g(\boldsymbol{\theta}, \boldsymbol{X})=\boldsymbol{\phi}=\boldsymbol{\theta}-\alpha \nabla_{\boldsymbol{\theta}} \mathcal{L}(\boldsymbol{\theta}, \boldsymbol{X}) \quad\quad(2)$
任务梯度(task gradient):
$\text{task gradient}\doteq \phi_{i}-\theta \quad\quad(3)$
其中:
$\begin{array}{l}\phi &= \frac{d \mathcal{L}\left(\mathcal{A l g}(\boldsymbol{\theta}, \boldsymbol{X}), \boldsymbol{X}_{t}^{\prime}\right)}{d \boldsymbol{\theta}}\\&=\quad \frac{d \mathcal{A l g}(\boldsymbol{\theta}, \boldsymbol{X})}{d \boldsymbol{\theta}} \nabla_{\boldsymbol{\phi}} \mathcal{L}\left(\mathcal{A l g}(\boldsymbol{\theta}, \boldsymbol{X}), \boldsymbol{X}_{t}^{\prime}\right)\end{array}\quad\quad(4)$
元梯度(meta gradient):
假设:如果任务梯度和元梯度产生较高的相似性得分,则参数在内环和外环优化中都收敛到相同的方向;
假设源域上存在 $n$ 个任务,则得到 $n$ 个相似性得分:
$s_{i}=\operatorname{CosSim}\left(\phi_{i}-\boldsymbol{\theta}, \frac{d \boldsymbol{\phi}_{i}}{d \boldsymbol{\theta}} \nabla_{\boldsymbol{\phi}_{i}} \mathcal{L}\left(\boldsymbol{\phi}_{i}, \boldsymbol{X}_{t}^{\prime}\right)\right)\quad\quad(5)$
因此,计算相似性得分概率分布:
$s=\operatorname{softmax}\left(\left[\frac{s_{1}}{\tau}, \frac{s_{2}}{\tau}, \ldots, \frac{s_{n}}{\tau}\right]\right) \quad\quad(6)$
目标域参数的更新如下(任务相似性得分加权):
$\boldsymbol{\theta}-\beta \sum_{i}^{n} s_{i} \cdot \frac{d \boldsymbol{\phi}_{i}}{d \boldsymbol{\theta}} \nabla_{\boldsymbol{\phi}_{i}} \mathcal{L}\left(\boldsymbol{\phi}_{i}, \boldsymbol{X}_{t}^{\prime}\right) \quad\quad(7)$
2.2 算法

3 实验
监督训练

小样本元域适应

大模型

鲁棒性研究

消融研究

论文解读(MetaAdapt)《MetaAdapt: Domain Adaptive Few-Shot Misinformation Detection via Meta Learning》的更多相关文章
- paper 159:文章解读:From Facial Parts Responses to Face Detection: A Deep Learning Approach--2015ICCV
文章链接:https://arxiv.org/pdf/1509.06451.pdf 1.关于人脸检测的一些小小总结(Face Detection by Literature) (1)Multi-vie ...
- 论文解读(USIB)《Towards Explanation for Unsupervised Graph-Level Representation Learning》
论文信息 论文标题:Towards Explanation for Unsupervised Graph-Level Representation Learning论文作者:Qinghua Zheng ...
- 论文解读(AGE)《Adaptive Graph Encoder for Attributed Graph Embedding》
论文信息 论文标题:Adaptive Graph Encoder for Attributed Graph Embedding论文作者:Gayan K. Kulatilleke, Marius Por ...
- 论文解读GALA《Symmetric Graph Convolutional Autoencoder for Unsupervised Graph Representation Learning》
论文信息 Title:<Symmetric Graph Convolutional Autoencoder for Unsupervised Graph Representation Learn ...
- 论文解读(GGD)《Rethinking and Scaling Up Graph Contrastive Learning: An Extremely Efficient Approach with Group Discrimination》
论文信息 论文标题:Rethinking and Scaling Up Graph Contrastive Learning: An Extremely Efficient Approach with ...
- 目标检测论文解读1——Rich feature hierarchies for accurate object detection and semantic segmentation
背景 在2012 Imagenet LSVRC比赛中,Alexnet以15.3%的top-5 错误率轻松拔得头筹(第二名top-5错误率为26.2%).由此,ConvNet的潜力受到广泛认可,一炮而红 ...
- Relational Learning with Gated and Attentive Neighbor Aggregator for Few-Shot Knowledge Graph Completion 小样本关系学习论文解读
小样本知识图补全--关系学习.利用三元组的邻域信息,提升模型的关系表示学习,来实现小样本的链接预测.主要应用的思想和模型包括:GAT.TransH.SLTM.Model-Agnostic Meta-L ...
- 论文解读(AGC)《Attributed Graph Clustering via Adaptive Graph Convolution》
论文信息 论文标题:Attributed Graph Clustering via Adaptive Graph Convolution论文作者:Xiaotong Zhang, Han Liu, Qi ...
- Domain Adaptive Faster R-CNN:经典域自适应目标检测算法,解决现实中痛点,代码开源 | CVPR2018
论文从理论的角度出发,对目标检测的域自适应问题进行了深入的研究,基于H-divergence的对抗训练提出了DA Faster R-CNN,从图片级和实例级两种角度进行域对齐,并且加入一致性正则化来学 ...
- CVPR2020论文解读:三维语义分割3D Semantic Segmentation
CVPR2020论文解读:三维语义分割3D Semantic Segmentation xMUDA: Cross-Modal Unsupervised Domain Adaptation for 3 ...
随机推荐
- mysql 新建数据库 排序规则
utf8_unicode_ci和utf8_general_ci对中.英文来说没有实质的差别.utf8_general_ci校对速度快,但准确度稍差.utf8_unicode_ci准确度高,但校对速度稍 ...
- Value '0000-00-00 00:00:00' can not be represented as java.sql.Timestamp; nested exception is java.sql.SQLException: Value '0000-00-00 00:00:00' can not be represented as java.sql.Timestamp
好久没记录了,最近一直在忙着工作以及码前后端 记录下这种大多数人都会碰到但是又不一定找得到问题的错误 1 Value '0000-00-00 00:00:00' can not be represen ...
- win10双系统Ubuntu的安装之旅(安装+美化+问题解决方案)
一.前言 最近想用一下Ubuntu,于是乎开始了win10安装Ubuntu的旅程,安装的过程中是看到了很多前人已经写好的非常详细的教程,那这里我就不再重复造轮子啦,直接放上链接咯- 看看我的成果图- ...
- 音容笑貌,两臻佳妙,人工智能AI换脸(deepfake)技术复刻《卡萨布兰卡》名场面(Python3.10)
影史经典<卡萨布兰卡>是大家耳熟能详的传世名作,那一首壮怀激烈,激奋昂扬的马赛曲,应当是通片最为激动人心的经典桥段了,本次我们基于faceswap和so-vits库让AI川普复刻美国演员保 ...
- 2023-05-25:给定一个正整数 x,我们将会写出一个形如 x (op1) x (op2) x (op3) x ... 的表达式 其中每个运算符 op1,op2,… 可以是加、减、乘、除之一 例如
2023-05-25:给定一个正整数 x,我们将会写出一个形如 x (op1) x (op2) x (op3) x ... 的表达式 其中每个运算符 op1,op2,- 可以是加.减.乘.除之一 例如 ...
- 代码随想录算法训练营Day7哈希表| 454.四数相加II383. 赎金信15. 三数之和18. 四数之和 |总结
454.四数相加Ⅱ 题目链接:454.四数相加 给你四个整数数组 nums1.nums2.nums3 和 nums4 ,数组长度都是 n ,请你计算有多少个元组 (i, j, k, l) 能满足:. ...
- MYSQL数据库的创建和删除
打开Windows命令行,输入登录用户和密码 mysql -h localhost -u root -p 创建新数据 CREATE DATABASE zoo; 查看系统中的数据库 SHOW DATAB ...
- Sublime Text Windows/Linux平台快捷键
编辑 按键 对应命令 Ctrl + X 删除行 Ctrl + 行后插入 Ctrl + ⇧ + 行前插入 Ctrl + ⇧ + ↑ 上移文本/选择 Ctrl + ⇧ + ↓ 下移文本/选择 Ctrl + ...
- 【重学C++】05 | 说透右值引用、移动语义、完美转发(下)
文章首发 [重学C++]05 | 说透右值引用.移动语义.完美转发(下) 引言 大家好,我是只讲技术干货的会玩code,今天是[重学C++]的第五讲,在第四讲<[重学C++]04 | 说透右值引 ...
- Docker安装MS SQL Server并使用Navicat远程连接
MS SQL Server简介 Microsoft SQL Server(简称SQL Server)是由微软公司开发的关系数据库管理系统,它是一个功能强大.性能卓越的企业级数据库平台,用于存储和处理大 ...