论文信息

论文标题：Adversarial and Domain-Aware BERT for Cross-Domain Sentiment Analysis
论文作者：
论文来源：2020 ACL
论文地址：download
论文代码：download
视屏讲解：click

1 介绍

2 问题定义

　　在跨域情绪分析任务中，给出了两个域 $D_{s}$ 和 $D_{t}$，它们分别表示源域和目标域。在源域中，$D_{s}^{l}=\left\{x_{s}^{i}, y_{s}^{i}\right\}_{i=1}^{N_{s}^{l}}$ 是 $N_{s}^{l}$ 标记的源域例子，其中 $x_{s}^{i}$ 表示一个句子，$y_{s}^{i}$ 是对应的标签。在源域中也有 $N_{s}^{u}$ 个未标记的数据 $D_{s}^{u}=\left\{x_{s}^{i}\right\}_{i=1+N_{s}^{l}}^{N_{s}^{l}+N_{s}^{u}}$。在目标域中，有一组未标记的数据 $D_{t}=\left\{x_{t}^{i}\right\}_{i=1}^{N_{t}}$，其中 $N_{t}$ 为未标记数据的数量。跨域情绪分析要求我们学习一个基于标记源域数据训练的鲁棒分类器来预测目标域中未标记句子的标签。

2 方法

2.1 BERT Post-training

2.1.1 域区分任务

　　本文用域区分任务（DDT）来替换 NSP 任务：50% 的时间句子 A 和句子 B 都是从目标域评论中随机抽取的，我们将其标记为 TargetDomain。50% 的时间句子 A 和句子 B 来自目标域和另一个域，其标签为MixDomain。

　　　　Input = [CLS] The mouse is smooth and great [SEP] The screen is plain [SEP]

　　　　Label = TargetDomain

　　　　Input = [CLS] This book is boring [SEP] The system of the laptop is stable [SEP]

　　　　Label = MixDomain

　　我们在合并表示上添加一个输出层，并使正确标签的可能性最大化。领域区分预训练使BERT能够提取出不同领域的特定特征，增强了下游的对抗性训练，有利于跨域情绪分析。

2.1.2 目标域 MLM

　　为了注入目标领域的知识，本文利用掩蔽语言模型（MLM），它需要预测句子中随机掩蔽的单词。在跨域情绪分析中，在目标域中没有标记数据，只有大量的未标记数据来进行 MLM 训练 BERT。具体来说，本文用 [MASK] 随机替换 15% 的 Token，并进行 mask token 的预测。

　　Note：来自其他域的句子将是带来域偏差的噪声。因此，当域区分任务标签是 MixDomain 时，只掩码目标域句子中的 Token。

2.2 对抗训练

　　BERT Post-training 注入目标领域的知识，并为 BERT 带来了对领域的意识。基于 BERT Post-training，现在可以利用对抗训练放弃提炼的域特定特征来导出域不变特征。具体来说，设计了一个情绪分类器和一个域鉴别器来处理特殊分类嵌入 [CLS] 的隐藏状态 $h_{[CLS]}$。

2.2.1 情绪分类器

　　分类器：

　　　　$y_{s}=\operatorname{softmax}\left(W_{s} h_{[C L S]}+b_{s}\right)$

　　分类交叉熵损失：

　　　　$L_{s e n}=-\frac{1}{N_{s}^{l}} \sum_{i=1}^{N_{s}^{l}} \sum_{j=1}^{K} \hat{y}_{s}^{i}(j) \log y_{s}^{i}(j)$

2.2.2 域鉴别器

　　标准的 DANN：

　　　　$d=\operatorname{softmax}\left(W_{d} \hat{h}_{[C L S]}+b_{d}\right)$

　　　　$L_{d o m}=-\frac{1}{N_{s}+N_{t}} \sum_{i}^{N_{s}+N_{t}} \sum_{j}^{K} \hat{d}^{i}(j) \log d^{i}(j)$

　　　　$\begin{array}{c}Q_{\lambda}(x)=x, \\\frac{\partial Q_{\lambda}(x)}{\partial x}=-\lambda I .\end{array}$

2.3 训练目标

　　完整的训练目标：

　　　　$L_{\text {total }}=L_{\text {sen }}+L_{\text {dom }}$

3 实验结果

分类结果

A-distance

消融实验

论文解读（BERT-DAAT）《Adversarial and Domain-Aware BERT for Cross-Domain Sentiment Analysis》的更多相关文章

[cross domain] four approachs to cross domain in javascript
four approachs can cross domain in javascript 1.jsonp 2.document.domain(only in frame and they have ...
论文解读（CDCL）《Cross-domain Contrastive Learning for Unsupervised Domain Adaptation》
论文信息论文标题:Cross-domain Contrastive Learning for Unsupervised Domain Adaptation论文作者:Rui Wang, Zuxuan ...
论文解读（CDTrans）《CDTrans: Cross-domain Transformer for Unsupervised Domain Adaptation》
论文信息论文标题:CDTrans: Cross-domain Transformer for Unsupervised Domain Adaptation论文作者:Tongkun Xu, Weihu ...
论文解读（CAN）《Contrastive Adaptation Network for Unsupervised Domain Adaptation》
论文信息论文标题:Contrastive Adaptation Network for Unsupervised Domain Adaptation论文作者:Guoliang Kang, Lu Ji ...
论文解读（ToAlign）《ToAlign: Task-oriented Alignment for Unsupervised Domain Adaptation》
论文信息论文标题:ToAlign: Task-oriented Alignment for Unsupervised Domain Adaptation论文作者:Guoqiang Wei, Cuil ...
BERT论文解读
本文尽量贴合BERT的原论文,但考虑到要易于理解,所以并非逐句翻译,而是根据笔者的个人理解进行翻译,其中有一些论文没有解释清楚或者笔者未能深入理解的地方,都有放出原文,如有不当之处,请各位多多包含,并 ...
bert系列二：《BERT》论文解读
论文<BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding> 以下陆续介绍ber ...
CVPR2020论文解读：三维语义分割3D Semantic Segmentation
CVPR2020论文解读:三维语义分割3D Semantic Segmentation xMUDA: Cross-Modal Unsupervised Domain Adaptation for 3 ...
图像分类：CVPR2020论文解读
图像分类:CVPR2020论文解读 Towards Robust Image Classiﬁcation Using Sequential Attention Models 论文链接:https:// ...
人工智能论文解读精选 | PRGC：一种新的联合关系抽取模型
NLP论文解读原创•作者 | 小欣论文标题:PRGC: Potential Relation and Global Correspondence Based Joint Relational ...

随机推荐

Typora 隐藏侧边栏图片文件夹
前言在使用 Typora 的时候,我将图片的保存路径设置为了如下所示: 这样设置是为了更方便的管理笔记中的图片,但图片文件夹却也显示在了侧边栏中,随着笔记增多,我的侧边栏越来越乱... 难道要忍气吞 ...
(一)pyahocorasick和marisa_trie，字符串快速查找的python包，自然语言处理，命名实体识别可用的高效包
Pyahocorasick Pyahocorasick是一个基于AC自动机算法的字符串匹配工具.它可以用于快速查找多个短字符串在一个长字符串中的所有出现位置.Pyahocorasick可以在构建状态机 ...
[MAUI]模仿iOS多任务切换卡片滑动的交互实现
@ 目录原理创建布局创建分布函数创建动效创建绑定数据细节调整首张卡片的处理为卡片添加裁剪跳转到最后一张卡片项目地址看了上一篇博文的评论,大家对MAUI还是比较感兴趣的,非常感谢大 ...
2021-01-07：cdn加速是什么原理？
福哥答案2021-01-07:[答案来自此链接:](https://www.zhihu.com/question/438234873)CDN(Content Delivery Network):内容分 ...
vue全家桶进阶之路8：Axios的安装与HTTP请求实战
Axios是一个基于Promise的HTTP客户端,用于在浏览器和Node.js中发送HTTP请求.它可以使用在Vue中发送请求以及与后端API进行交互. 在Vue中使用Axios可以通过以下步骤: ...
Django 与 Vue 语法冲突问题完美解决方法
Django 与 Vue 语法冲突问题完美解决方法当我们在 django web 框架中,使用 vue 的时候,会遇到语法冲突. 因为 vue 使用 {{}}, 而 django 也使用 {{}}, ...
“中国法研杯”司法人工智能挑战赛：基于UTC的多标签/层次分类小样本文本应用，Macro F1提升13%+
"中国法研杯"司法人工智能挑战赛:基于UTC的多标签/层次分类小样本文本应用,Macro F1提升13%+ 相关文章推荐: 本项目主要完成基于UTC的多标签应用,更多部署细节请参考 ...
js 关于 replace 取值、替换第几个匹配项
〇.前言在日常开发中,经常遇到针对字符串的替换.截取,知识点比较碎容易混淆,特此总结一下,仅供参考. 一.替换第一个匹配项字符串替换 let strtest = "0123测试repla ...
2023.5.25 Linux系统Bash初识
1.Linux系统终端概述2.Linux系统Bash管理2.1.Bash特性:命令补全2.2.Bash特性:命令快捷键2.3.Bash特性:命令别名2.4.Bash特性:命令流程2.5.Bash特性: ...
快速上手kettle（四）壶中可以倒出些啥？
目录前言一 .kettle 这壶里能倒出啥? 二 .Access输出 2.1 Access输出设置 2.2 启动转换,查看输出三 .Excel输出 3.1 选择excel扩展名 3.2 1 将表 ...

论文解读（BERT-DAAT）《Adversarial and Domain-Aware BERT for Cross-Domain Sentiment Analysis》