Joint Extraction of Entities and Relations论文解析
1. 前言
实体和关系的联合抽取问题作为信息抽取的关键任务,其实现方法可以简单分为两类:
- 一类是串联抽取方法。传统的串联抽取就是首先进行实体抽取,然后进行关系识别。这种分开的方法比较容易实现,而且各个模块灵活度比较高。但是这种方法中,实体识别的结果会影响到关系识别的结果,所以容易产生误差累积。
- 另一类是联合抽取方法:使用一个模型同时实现实体抽取和关系抽取,能更好的整合实体及其关系之间的信息。但现有的联合抽取方法也存在诸多问题,比如:大部分的联合抽取模型需要人工参与构建特征。为了减少人工抽取特征工作而提出基于神经网络的end-to-end模型,因在模型实现过程中分开抽取实体及其关系而导致信息冗余等问题。
本文解析的论文《Joint Extraction of Entities and Relations
Based on a Novel Tagging Scheme》中提出了一个新的模型框架来解决此类问题,并在公开数据集 NYT 上取得了很好的效果。
2. 算法模型
这篇论文提出将一种新的标注方法来解决联合抽取任务,将联合抽取问题转化为标注问题,这样就可以避免复杂的特征工程。由于LSTM在end-to-end的命名实体识别模型当中有比较好的表现,而且LSTM本身能够学习长期依赖关系,有利于解决序列建模任务。所以本文基于新的标注方法,研究了基于LSTM的end-to-end模型来解决联合抽取实体和关系的任务。除此之外还在解码的过程中增加了偏置损失函数,增强了相关实体之间的联系,让模型更加适合特殊标签。
2.1 标注方法
上图所示,模型的输入一句非结构化的文本,输出为一个预定关系类型的三元组。
为了实现该任务,作者首先提出了一种新的标注模式,将信息抽取任务转化为序列标注任务。
如上图所示,这种标注模式将文本中的词分为两类,
- 第一类代表与抽取结果无关的词,用标签“O”来表示;
- 第二类代表与抽取结果相关的词,这一类词的标签由三部分组成:当前词在entity中的位置-关系类型-entity在关系中的角色。
- 作者使用“BIES”(Begin,Inside,End,Single)标注,来表示当前词在 entity中的位置。
- 关系类型则是从预先设定的关系类型集中获得的。
- entity在关系中的角色信息,用“1”,“2”来表示。其中“1”表示,当前词属于三元组(Entity1,RelationType,Entity2)的 Entity1,同理“2”表示当前词属于Entity2。
最后根据标注结果将同种关系类型的两个相邻顺序实体组合为一个三元组。例如:通过标注标签可知,“United”与“States”组合形成了实体“United States”,实体“United States”与实体“Trump”组合成了三元组 {United States, Country-President, Trump}。如果一个句子中包含两个或者更多相同关系类型的三元组,我们基于最近原则将两个实体组合为三元组。本篇论文只考虑一个实体只属于一个三元组的情况。
2.2 End-to-End模型
当输入为文本语句的时候,为了自动实现对文本词序列的标注工作,作者提出了一个端到端的模型来实现了该工作。模型结构如下图
- 词嵌入层将每个词的 one-hot 表示向量转化为低维稠密的词嵌入向量(维度为 300);
- Bi-LSTM 编码层(层数为 300)用于获得词的编码信息;
- LSTM 解码层(层数为 600)用于产生标签序列。其中加入偏移损失来增强实体标签的关联性。
3. 实验结果及分析
本实验采用NYT数据,实验的训练集采用远程监督方法标注,而测试集为人工标注。训练数据包括353000个三元组,而测试数据包括3880个三元组,关系集的大小为24。本实验采用精确度、召回率和F1值进行评估。该算法与传统方法的不同之处在于,抽取三元组时不需要知道实体的类型信息,所以在评估过程中不需要考虑实体类型。当三元组的关系类型、以及对应的两个头部偏移实体都正确时,这个三元组被认为是正确的。实验结果如下:
前三行是串联抽取的结果,中间4-6行是联合抽取的结果,最后三行是基于基于本文所提出的新的标注方法的end-to-end模型实现的联合抽取的实验结果。可以发现联合抽取的方法优于串联抽取的方法,而end-to-end的联合抽取方法又优于联合抽取方法。而三种end-to-end模型中,编码过程都采用双向LSTM,而解码过程则分别用CRF、LSTM以及LSTM+Bias,可以发现LSTM的解码方式优于CRF,出现这一结果的原因是CRF 旨在最大化整个标签序列的联合概率,LSTM 能够学习序列元素之间的长距离依赖关系,由于关联标签之间可能彼此具有较长距离,所以基于 LSTM 的解码方式比 CRF 稍好。而增加了偏置权重以增强特殊标签的作用,并削弱无效标签的影响的LSTM+Bias解码方法可以获得比常见端对端模型更好地效果。
4. 总结
这篇论文提出一个新的标注方法,并且研究了利用end-to-end模型来联合抽取实体和关系,实验结果证明该方法非常有效。但是面对重叠关系,依旧存在缺陷。后续将研究在输出层用多分类代替softmax函数来解决重叠关系的问题。
Joint Extraction of Entities and Relations论文解析的更多相关文章
- 面部表情视频中进行远程心率测量:ICCV2019论文解析
面部表情视频中进行远程心率测量:ICCV2019论文解析 Remote Heart Rate Measurement from Highly Compressed Facial Videos: an ...
- [Network Architecture]Mask R-CNN论文解析(转)
前言 最近有一个idea需要去验证,比较忙,看完Mask R-CNN论文了,最近会去研究Mask R-CNN的代码,论文解析转载网上的两篇博客 技术挖掘者 remanented 文章1 论文题目:Ma ...
- LTMU论文解析
LTMU 第零部分:前景提要 一般来说,单目标跟踪任务可以从以下三个角度解读: A matching/correspondence problem.把其视为前后两帧物体匹配的任务(而不考虑在跟踪过程中 ...
- CVPR2020论文解析:实例分割算法
CVPR2020论文解析:实例分割算法 BlendMask: Top-Down Meets Bottom-Up for Instance Segmentation 论文链接:https://arxiv ...
- 人脸真伪验证与识别:ICCV2019论文解析
人脸真伪验证与识别:ICCV2019论文解析 Face Forensics++: Learning to Detect Manipulated Facial Images 论文链接: http://o ...
- 人体姿态和形状估计的视频推理:CVPR2020论文解析
人体姿态和形状估计的视频推理:CVPR2020论文解析 VIBE: Video Inference for Human Body Pose and Shape Estimation 论文链接:http ...
- 视频教学动作修饰语:CVPR2020论文解析
视频教学动作修饰语:CVPR2020论文解析 Action Modifiers: Learning from Adverbs in Instructional Videos 论文链接:https://a ...
- 分层条件关系网络在视频问答VideoQA中的应用:CVPR2020论文解析
分层条件关系网络在视频问答VideoQA中的应用:CVPR2020论文解析 Hierarchical Conditional Relation Networks for Video Question ...
- 慢镜头变焦:视频超分辨率:CVPR2020论文解析
慢镜头变焦:视频超分辨率:CVPR2020论文解析 Zooming Slow-Mo: Fast and Accurate One-Stage Space-Time Video Super-Resol ...
随机推荐
- 如何设置IIS程序池的回收时间,才能最大程度的减少对用户的影响?
作为.Net开发人员,其实对IIS的应用程序池知之甚少,在工作中我也有几次遇到过网站无故打不开的情况,找了半天原因也找不到是怎么造成的,有一次我给网站找了一个程序程序池后发现就能正常访问了,这也让我对 ...
- C# WinForm开发系列 - 文章索引
该系列主要整理收集在使用C#开发WinForm应用文章及相关代码, 平时看到大家主要使用C#来开发Asp.Net应用,这方面的文章也特别多,而关于WinForm的文章相对少很多,而自己对WinForm ...
- Xcode 各版本简介
1.Xcode 验证 在终端输入 spctl 命令,并带上安装的 Xcode 的路径 $ spctl --assess --verbose /Applications/Xcode.app 之后会看到类 ...
- oracle 12c jdbc连接pdb报错的问题
有同学发来消息说,oracle数据库使用jdbc连接会后报ora-12505错误. 下意识地回复说查看jdbc连接串中的数据库sid/服务名是否写错了. 对方反馈说没错.然后让他以下面的方式连接是可以 ...
- .NET Core 2.0 Cookie中间件 权限验证
:在ConfigureServices添加Cookie中间件,使用自定义Scheme services.AddAuthentication(options=> { options.Default ...
- markdown中的锚点处理
markdown markdown是一个相对简单的DSL,定义了简单的标签来描述html文档格式. 比如: #一级标题 来生成html <h1>一级标题<h1> ##二级标题 ...
- 启动和停止kafka 及kafka manager
启动kafka: sh /app/pet_kafka_xxxx_cluster/bin/kafka-server-start.sh -daemon /app/pet_kafka_xxxx_cluste ...
- Android Studio开发-高效插件强烈推荐
Android Studio开发-高效插件强烈推荐 现在Android的开发者基本上都使用Android Studio进行开发(如果你还在使用eclipse那也行,毕竟你乐意怎么样都行).使用好And ...
- notepad++添加插件管理器
notepad++ 是一个很不错的文本编辑器,添加一些插件可以更好地使用. 首先需要使用插件管理器,最新版本的github地址是:https://github.com/bruderstein/nppp ...
- 使用layui 和 jquery 问题小结
问题 1 在使用 layui 2.2.5 之前,可以引入最新版的 jquery ,使用更好的性能.也可以使用layui 的jquery内部版本.如果引入要在引入layui.js 之前引入 2 使用 s ...