TransE论文剩余部分

4.3链接预測

表3：链接预測结果。不同方法的性能。

整体结果 表3显示了全部数据集全部方法的比較。

与预期结果一致，经过过滤设置的结果具有较低的平均排名和较高的hits@10，相信在链接预測方面对各种方法有一个清晰地性能评估。然而，raw和filtered的趋势是一样的。

我们的方法TransE在全部度量上面通常非常大程度上优于全部进行比較的方法。而且取得了一些绝对好的性能比如WN上89%的hits@10（超过40k的实体）和在FB1M上的34%的hits@10（超过1M的实体）。TransE和这些第二好的方法之间的不同之处是非常重要的。

我们相信TransE良好的性能是由于对数据恰当的建模，但也是由于模型相对简单。

这意味着它可以用随机梯度有效的优化。

第3节我们已经说明SE比我们的模型更具表达性。然而，它的复杂性可能使它学习起来十分困难，导致性能非常差。

在FB15k上，在训练集的一个有50k的元组的子集上SE取得了165的平均排名和35.5%的hits@10，TransE则分别取得了127和42.7%。这表明其实TransE欠拟合的程度更小，这可能能解释它比較好的性能。SME（双线性）和LFM有相同的训练问题：我们从来都没有成功的把它们训练的足够好来开发出它们全部的功能。

通过我们的评价设置--基于实体排名，LFM较差的结果也可以解释。由于LFM最初是为了预測关系提出来的。在FB15k上。RESCAL可以取得十分好的hits@10，可是平均排名方面比較差，尤其在WN上，即使我们用非常大的隐藏维度（2000
on Wordnet）。

翻译的影响是巨大的。当比較TransE和非结构的方法（也就是缺少翻译的TransE）。非结构化的平均排名相对较好，可是hits@10非常差。

非结构化的方法简单的把全部出现的实体聚类，不依赖所涉及的关系，因此仅仅靠猜想来推断实体相关。在FB1M上，TransE和非结构化方法的平均排名差点儿一样。可是TransE的预測排在前10位的数目是非结构化方法的10倍之多。

表4：关系聚类的具体结果。我们比較了在FB15k上以过滤数据为评价比較TransE和參考方法的hits@10。

具体结果 表4展示了在FB15k上根据关系的几种类别的分类结果，并依此对几种方法进行预測。我们根据头和尾的基数參数把关系分为4类：1-1，1-多。多-1，多-多。假设一个头部至多相应一个尾部，那么它们的关系是1-1。假设一个头部相应多个尾部。那么它们的关系是1-多。假设非常多头部相应同一个尾部，那么它们的关系是多-1。假设多个头部相应多个尾部，那么它们是多-多关系。

通过以下的处理我们把关系分成这四类，给定一个序对（l，t）（相同地。序对（h。l），对每一个关系l。计算头部h（相同地。尾部t）出如今FB15k数据集上的平均数。假设这个平均数小于1.5就被标记为1-多等等。比如。每一个尾部平均有1.2个实体而且每一个头部平均有3.2个尾部的关系被分类为1-多。我们得到在FB15k上有26.2%的1-1关系，22.7%的1-多关系，28.3%的多-1关系和22.8%的多-多关系。

表4中的具体结果考虑了一个更精确的评估而且了解了这些方法的行为。首先，它出现了期望的结果。它可以非常easy的预測实体一方仅仅有一个相应关系的元组的实体（也就是预測在关系1-多下预測头部，在多-1关系下预測尾部），也就是有多个实体指向它的时候。

这些是有非常好指向的例子。SME（双线性）被证明在处理这种例子时时非常精确的，由于这些例子是它们训练最多的例子。

非结构化的方法在1-1关系上显示了良好的性能：这表明这种关系的參数必须共享相同的隐藏类型。而非结构化的方法在嵌入空间上通过聚类把实体连接在一起可以发现这种隐藏类型。

可是这种策略在其他关系类型上是失败的。在嵌入空间添加翻译，通过其后的关系从一个实体聚类到还有一个实体聚类。对这些指向性非常好的例子这一点是非常惊人的。

表5：TransE在FB15k測试集上的例子预測。粗体是測试元组正确的尾部，斜体是训练集上其他正确的尾部。

举例说明 表5给出了TransE在FB15k測试集上的例子链接预測的结果。

这举例说明了我们模型的能力。给定一个头部和一个标签。排在最高位的尾部被描写叙述出来。

这些例子来自FB15k的測试集。即使排在最高位的不总是最好的答案，但这个预測也反映了一般的常识。

4.4用几个例子学习预測新关系

用FB15k。通过检查这些方法在学习新关系时的速度有多快来測试他们在泛化新的事实方面有多好。为了那个目的。我们随机选择40个关系而且切割成两个数据集：一个数据集（命名为FB15k-40rel）包括全部40个元组。还有一个数据集(FB15k-rest)包括剩余的数据。

我们确保它们包括全部的实体。FB15k-rest被切割成一个包括353,788个元组的训练集和一个包括53,266个元组的验证集。

FB15-rel分成40,000元组的训练集和45,159的測试集。

利用这些数据集，我们分析例如以下实验：（1）利用FB15k-rest的训练集和验证集训练和选择最好的模型，（2）随后在FB15k-40rel的训练集上训练而且仅仅学习和新的40个关系相关的參数。（3）在FB15k-40rel的測试集（仅仅包括（1）期间没有见过的关系）上进行连接预測评估。在（2）阶段，对每一个关系我们用0,10,100和1000个例子反复这个过程。

watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQv/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center" alt="" />

图1：用几个例子学习心关系。比較试验数据是FB15k数据集，使用平均排名（左）和hits@10（右）作为评价标准。很多其他细节參见下文。

图1展示了非结构化方法，SE，SME（线性）。SME（双线性）和TransE的结果。

但不提供已知关系时，非结构化方法取得的性能最好，由于它并不使用这些信息去预測。

可是，当提供关系的例子时这种性能并没有得到提升。

TransE是学习最快的方法：仅仅有一个新关系的10个样子时。它的hits@10仍然有18%，而且随着提供例子的添加这个数据单调递增。

我们相信TransE模型的简单性使它可以有较好的泛化能力。而不必改动不论什么已经训练好的嵌入。

5总结和展望

我们提出了一种新的学习知识库嵌入的方法。主要是最小化模型的參数，主要表示层次关系。通过与两个不同且规模非常大的知识库上和其他方法比較。我们的模型效果非常好，借此我们把它应用到了大规模知识库数据块上。虽然还不清晰用我们的方法是否可以充分地对全部的关系类型建模，可是通过关系分类评价与其他方法相比在全部的设置条件下它似乎有非常好的性能。

后面会进一步分析这个模型，而且把它应用到很多其他的任务中。特别是应用到如文献[8]提到的学习词表示。结合知识库和文本[2]是还有一个重要的方向，我们的方法对此可能是实用的。

因此，近期我们把TransE插入到一个框架中从文本[16]中进行关系抽取。

TransE论文剩余部分的更多相关文章

ARVE: Augmented Reality Applications in Vehicle to Edge Networks
ARVE:车辆到边缘网中的增强现实应用本文为SIGCOMM 2018 Workshop (Mobile Edge Communications, MECOMM)论文. 笔者翻译了该论文.由于时间仓促 ...
BP-Wrapper：无锁竞争的缓存替换算法系统框架
BP-Wrapper:无锁竞争的替换算法系统框架最近看了一个golang的高性能缓存ristretto,该缓存可以很好地实现如下功能: Concurrent High cache-hit ratio ...
知识图谱顶会论文(SIGIR-2022) MorsE：归纳知识图嵌入的元知识迁移
MorsE:归纳知识图嵌入的元知识迁移论文题目: Meta-Knowledge Transfer for Inductive Knowledge Graph Embedding 论文地址: http ...
Science论文"Clustering by fast search and find of density peaks"学习笔记
"Clustering by fast search and find of density peaks"是今年6月份在<Science>期刊上发表的的一篇论文,论文中 ...
全球分布式数据库：Google Spanner（论文翻译）
本文由厦门大学计算机系教师林子雨翻译,翻译质量很高,本人只对极少数翻译得不太恰当的地方进行了修改. [摘要]:Spanner 是谷歌公司研发的.可扩展的.多版本.全球分布式.同步复制数据库.它是第一个 ...
分布式一致性算法：Raft 算法（论文翻译）
Raft 算法是可以用来替代 Paxos 算法的分布式一致性算法,而且 raft 算法比 Paxos 算法更易懂且更容易实现.本文对 raft 论文进行翻译,希望能有助于读者更方便地理解 raft 的 ...
论文笔记 Spatial contrasting for deep unsupervised learning
在我们设计无监督学习模型时,应尽量做到网络结构与有监督模型兼容有效利用有监督模型的基本模块,如dropout.relu等无监督学习的目标是为有监督模型提供初始化的参数,理想情况是"这些 ...
SSD: Single Shot MultiBoxDetector英文论文翻译
SSD英文论文翻译 SSD: Single Shot MultiBoxDetector 2017.12.08 摘要:我们提出了一种使用单个深层神经网络检测图像中对象的方法.我们的方法,名为SSD ...
论文笔记（8）：BING: Binarized Normed Gradients for Objectness Estimation at 300fps
译文: <基于二值化赋范梯度特征的一般对象估计> 摘要: 通过训练通用的对象估计方法来产生一组候选对象窗口,能够加速传统的滑动窗口对象检测方法.我们观察到一般对象都会有定义完好的封闭轮廓, ...

随机推荐

PHP实现事件机制实例分析
PHP实现事件机制实例分析内置了事件机制的语言不多,php也没有提供这种功能.事件(Event)说简单了就是一个Observer模式.实现起来非常easy.可是有所不同的是,事件的监听者谁都能够加, ...
Objective-C method及相关方法分析
## Objective-C method及相关方法分析转载请注名出处 [http://blog.csdn.net/uxyheaven](http://blog.csdn.net/uxyheaven ...
oculus rift 开发（一）
我使用的是oculus rift DK2,也就是开发人员版.在開始使用前.要确保几件事: 一.准备工作 1.pc配置.配置越好执行越流畅.反之会使帧率低.伴随的体验就是眩晕恶心,甚至无法执行. 官方推 ...
elasticsearch index 之 create index（二）
创建索引需要创建索引并且更新集群index matedata,这一过程在MetaDataCreateIndexService的createIndex方法中完成.这里会提交一个高优先级,AckedClu ...
慢慢人生路，学点Jakarta基础-深入剖析Java的接口和抽象类
在java面向对象编程的,抽象类和接口始终存在有疑问的地方,因为两者太多相似有太多不同,在刚开始学习的时候经常弄的不对,使用情景搞混,今天来总结之前学习Java中接口和抽象类的问题. 抽象类了解:只 ...
xshell --- 查看和关闭进程
netstat -apn | grep 80 kill -l PID 关闭进程
html元素的分类有哪些？
今天零度给大家讲一下基本的html元素分类: HTML元素的分类其实主要有两种元素构成——块级元素和内联元素. html元素的分类有块级元素和行内元素一.块级元素(block)的特点: 1.总是在新 ...
使用Java语言开发微信公众平台(六)——获取access_token
在前四期的文章中,我们分别学习了“环境搭建与开发接入”.“文本消息的接收与响应”.“被关注回复与关键词回复”.“图文消息的发送与响应”等环节.那么,从本篇博文开始,我们将进去更高级的 ...
spring mvc 接收ajax 复杂结构数据
1. 前段将要发送的信息转换成json字符串 2. spring mvc 使用 @RequestBody 来接收字符串,然后解析
洛谷 P2782 友好城市
P2782 友好城市题目描述有一条横贯东西的大河,河有笔直的南北两岸,岸上各有位置各不相同的N个城市.北岸的每个城市有且仅有一个友好城市在南岸,而且不同城市的友好城市不相同.每对友好城市都向政府申 ...

TransE论文剩余部分

TransE论文剩余部分的更多相关文章

随机推荐

热门专题