论文发表于人工智能顶会NeurIPS（原文链接）。当前的模型编辑器会因多次编辑损害模型性能，提出用于连续编辑的通用检索适配器(General Retrieval Adapters for Continual Editing, GRACE)：使用一个类似字典的结构（适配器）为需要修改的潜在表示构建新的映射，通过更新适配器来实现持续的模型行为编辑。

方法

GRACE是一种不修改模型权重编辑预训练模型行为的方法，适用于任何模型。为模型$f$在需要修改的层$l$添加一个适配器，其中包含一个编码本$\mathcal{C}=\{(k_i,v_i,\epsilon_i)\}_{i=1}^C$。其中的$k_i,v_i$表示修改后的输入和它对应的输出（通过反向传播微调得到），$\epsilon_i$表示当该层输入$h^{l-1}$与$k_i$的距离$d(h^{l-1},k_i)$小于$\epsilon_i$时，就使用$v_i$作为该层输出，否则正常输出该层的推理结果。这里的距离计算方式$d(\cdot)$使用欧氏距离。

GRACE编辑模型某层$l$的过程就是往编码本$\mathcal{C}$中添加词条的过程。如果$f(x_t)\neq y_t$，就期望通过修改所选的某层$l$关于$x_t$的输出$h^l$来使得$f(x_t)= y_t$：

1、对于第一个模型不满足的样本$(x_0,y_0)$来说，就是直接往$\mathcal{C}$中添加$(h^{l-1}_0,h^l_0,\epsilon_{ini})$。其中$h^{l-1}_0$是$x_0$在第$l-1$层的输出，$h^l_0$则是通过优化第$l$层的输出使得模型输出为$y_t$得到，$\epsilon_{ini}$是需要人为定义的初始化距离。

2、对于后续$f(x_t)\neq y_t$的情况，使用算法1来对$\mathcal{C}$进行更新。

对于PLM来说，作者仅在相应的层上对输入句子的最后一个token进行编辑，通过实验验证。

实验

图2：在toy二分类MLP上的编辑结果。a可视化模型正确分类两类样本。b在红色样本区域额外添加了要被判别为蓝色的样本。c修改前，模型将新增的样本判别为红。d修改后，模型将新增样本判别为蓝，并不影响其他判别。

表1：各方法在三个数据集和对应模型上的编辑效果。TRR：模型编辑后对原始测试集的保留度。ERR：按顺序编辑模型对之前编辑的记忆的保留度。#E：模型使用各方法编辑的次数。Hallucination是对大模型幻觉的编辑，测试的是根据prompt生成句子的PPL。ROME没有在T5上实验是因为它只适用于GPT。

图4：初始距离$\epsilon_{ini}$和模型编辑块的选择对编辑效果的影响。其中，Holdout是在没见过的数据集上的泛化效果。可以看出：

随着编辑数量的增加，在Holdout上的准确率会变高，说明了编辑的泛化效果。
中间层的编辑效果相较于两端编辑效果更好。
$\epsilon_{ini}$越小，对原始记忆的保留程度越不容易随着编辑次数的增加而降低。
$\epsilon_{ini}$越大，随着编辑次数的增加，在$\mathcal{C}$中添加的词条增长越缓慢。

问题

1、球之间的重叠不能避免：当添加第二个不同标签的球后，第一个球和第二个球相切，如果再来一个样本需要扩大前两个球之一，也就是算法中的Expand情况，两个球就会重叠，导致重叠部分输出不一致。

2、无法确定潜在变量之间的距离能表征输出之间的语义相似性，如果属于某个非线性空间，计算欧氏距离可能有问题

论文解读：Aging with GRACE: Lifelong Model Editing with Discrete Key-Value Adapters的更多相关文章

论文解读《Plug-and-Play Priors for Model Based Reconstruction》
这篇论文主要概述了model-baesd的方法在解决图像恢复的逆问题的很好的效果,降噪问题其实就是前向模型的H是一个恒等算子,将state-of-the-art的降噪算法(先验模型)和相对应的逆问题的 ...
A Unified Deep Model of Learning from both Data and Queries for Cardinality Estimation 论文解读（SIGMOD 2021）
A Unified Deep Model of Learning from both Data and Queries for Cardinality Estimation 论文解读(SIGMOD 2 ...
AAAI2019 | 基于区域分解集成的目标检测论文解读
Object Detection based on Region Decomposition and Assembly AAAI2019 | 基于区域分解集成的目标检测论文解读作者 | 文永亮学 ...
[论文解读] 阿里DIEN整体代码结构
[论文解读] 阿里DIEN整体代码结构目录 [论文解读] 阿里DIEN整体代码结构 0x00 摘要 0x01 文件简介 0x02 总体架构 0x03 总体代码 0x04 模型基类 4.1 基本逻辑 ...
图像分类：CVPR2020论文解读
图像分类:CVPR2020论文解读 Towards Robust Image Classiﬁcation Using Sequential Attention Models 论文链接:https:// ...
自监督学习(Self-Supervised Learning)多篇论文解读（下）
自监督学习(Self-Supervised Learning)多篇论文解读(下) 之前的研究思路主要是设计各种各样的pretext任务,比如patch相对位置预测.旋转预测.灰度图片上色.视频帧排序等 ...
自监督学习(Self-Supervised Learning)多篇论文解读（上）
自监督学习(Self-Supervised Learning)多篇论文解读(上) 前言 Supervised deep learning由于需要大量标注信息,同时之前大量的研究已经解决了许多问题.所以 ...
论文解读（SDNE）《Structural Deep Network Embedding》
论文题目:<Structural Deep Network Embedding>发表时间: KDD 2016 论文作者: Aditya Grover;Aditya Grover; Ju ...
论文解读第三代GCN《 Deep Embedding for CUnsupervisedlustering Analysis》
Paper Information Titlel:<Semi-Supervised Classification with Graph Convolutional Networks>Aut ...
论文解读（IDEC）《Improved Deep Embedded Clustering with Local Structure Preservation》
Paper Information Title:<Improved Deep Embedded Clustering with Local Structure Preservation>A ...

随机推荐

关于我这周学习SQL注入的一些笔记：
sql注入的原理: 通过恶意的SQL语句插入到应用的输入参数中,再在后台数据库服务器上解析执行的攻击. Web程序的三层结构: 界面层( User Interface layer ) 业务逻辑层( ...
WARN Issues with peer dependencies found，pnpm peer dependencies auto-install
前言 pnpm 也需要设置自动安装对等依赖项解决 pnpm 使用 npm 的配置格式,所以应该以与 npm 相同的方式设置配置: pnpm config set auto-install-peers ...
protobuf优缺点及编码原理
什么是protobuf protobuf(Google Protocol Buffers),官方文档对 protobuf 的定义:protocol buffers 是一种语言无关.平台无关.可扩展的序 ...
Delphi 非主窗体(即子窗体)在任务栏显示按钮
type TForm2 = class(TForm) private { Private declarations } public { Public declarations } procedure ...
emlog 制作一个小插件（截取正文生成 xx 字摘要）的过程
blockquote { background: rgba(255, 255, 0, 1); color: rgba(255, 0, 0, 1) !important } 如果熟悉其他 PHP 平台的 ...
Hack The Box-Cap靶机
该靶机通过信息收集拿到大致信息,利用IDOR访问控制缺陷漏洞获得目标流量包,通过流量分析获取到ftp流量包存在用户名密码,可以ftp登录/ssh登录拿到第一个flag,利用linpeas.sh内网收集 ...
nacos(九)：sentinel——规则持久化
接上回,sentinel基本使用我们已经掌握.但是在设置限流规则时,会发现规则都是临时的,一段时间没访问资源或者重启sentinel,规则就会消失.所以,我们需要有一个将规则持久化保存的地方,让规则一 ...
Apollo批量给新创建的用户授可编辑权限
背景: 我们要在Apollo中批量给新创建的用户授可编辑权限 apollo系统版本: java-2.1.0 管理员账号:Apollo 可编辑账号:guoyabin 过程: 在没写这段代码的时候从网上搜 ...
Linux系统中的目录和文件夹的区别
Linux系统中的目录和文件夹的区别目录 Linux系统中的目录和文件夹的区别一.概念与术语背景 1.目录(Directory) 2.文件夹(Folder) 二.技术实现差异 1.存储内容 2.权 ...
2012R2双网卡路由的设定
目前T440服务器, os只能起步2012R2.intelWin联盟是实实在在的.在该os上,DB支持SQL2008. 你要安装SQL2005也可以.到网上查找攻略.那也是死去活来.还好.2008兼容 ...

论文解读：Aging with GRACE: Lifelong Model Editing with Discrete Key-Value Adapters

方法

实验

问题

论文解读：Aging with GRACE: Lifelong Model Editing with Discrete Key-Value Adapters的更多相关文章

随机推荐

热门专题