论文《Entity Linking with Effective Acronym Expansion, Instance Selection and Topic Modeling》
Entity Linking with Effective Acronym Expansion, Instance Selection and Topic Modeling
一.主要贡献
1. propose a supervised learning algorithm to expand more complicated acronyms
2. propose an instance selection strategy to effectively utilize the automatically generated annotation
3. effectively capturing the semantic information between document and KB entry by a topic model.
二.相关介绍
实体链接主要包括查找名称变体和消歧。
名称变体查找阶段
从上下文展开一个缩略词,可以有效地减少缩略词提到的歧义。例如,TSE在Wikipedia中引用33个条目,但其全名Tokyo Stock Exchange,这是明确的,我们可以直接链接到正确的条目,而不需要消除歧义。
本文采用字符串匹配的方式生成候选实体。
名称消歧阶段
通过在向量空间模型中对KB中的条目进行排序。
本文通过ranking SVM对每个候选实体打分,选出最高的分数的实体,再通过二分类器,决定这个分数最高的应不应该被链接。
三.Acronym Expansion
1. 首先,将模式A中找到的所有字符串添加到候选集合C中。接下来,我们找到“(A)”的模式,并提取“(A)”之前的最长连续令牌序列E,该序列不包含标点或不超过2个停止字。
Eg: John received an award from the Association for Computing Machinery (ACM).
E = the Association for Computing Machinery.
我们将E和它的所有子字符串(结尾和E一致)到C。
the Association for Computing Machinery, Association for Computing Machinery, for Computing Machinery, Computing Machinery and Machinery.
2. 在文档中搜索其首字母与首字母缩写词匹配的所有标记。
Eg: the Association for Computing Machinery has granted the….
对于ACM, E = Association for Computing Machinery has
同时把和开头一致的子字符串加入C.
Assoc… Machinery has, Assoc… Machinery, Assoc… Computing, Association
3. 交换缩略语字母和完全小写的展开
Eg: Communist Party of China (CCP)
四.Instance Selection Strategy
《Entity Linking Leveraging Automatically Generated Annotation》之前为实体链接生成大型训练实例。
基本思想: take a document with an unambiguous mention referring to an entity e1 in KB and replace it with its variation which may refer to e1, e2 or others。
the distribution of the auto-generated data is not consistent with the real data set
↓
提出一种instance selection strategy。
本文使用SVM分类器从自动生成的数据集中进行选择,实例到超平面的距离作为指标。


五.Incorporating Semantic Feature
以前的方法将提及的上下文视为bow、n-gram、名词短语或命名实体组成,并通过加权的文字术语向量的比较来度量上下文相似性.
缺点:缺乏语义信息和稀疏性问题。
↓
引入一个topic model,通过使用LDA实体链接,以发现文档和KB的基础主题。

六.Experiments

论文《Entity Linking with Effective Acronym Expansion, Instance Selection and Topic Modeling》的更多相关文章
- 论文《A Generative Entity-Mention Model for Linking Entities with Knowledge Base》
A Generative Entity-Mention Model for Linking Entities with Knowledge Base 一.主要方法 提出了一种生成概率模型,叫做en ...
- Entity Framework Model First下改变数据库脚本的生成方式
在Entity Framework Model First下, 一个非常常见的需求是改变数据库脚本的生成方式.这个应用场景是指,当用户在Designer上单击鼠标右键,然后选择Generate Dat ...
- Entity Framework的核心 – EDM(Entity Data Model) 一
http://blog.csdn.net/wangyongxia921/article/details/42061695 一.EnityFramework EnityFramework的全程是ADO. ...
- EF,ADO.NET Entity Data Model简要的笔记
1. 新建一个项目,添加一个ADO.NET Entity Data Model的文件,此文件会生成所有的数据对象模型,如果是用vs2012生的话,在.Designer.cs里会出现“// Defaul ...
- Create Entity Data Model
http://www.entityframeworktutorial.net/EntityFramework5/create-dbcontext-in-entity-framework5.aspx 官 ...
- 论文分享|《Universal Language Model Fine-tuning for Text Classificatio》
https://www.sohu.com/a/233269391_395209 本周我们要分享的论文是<Universal Language Model Fine-tuning for Text ...
- Entity Framework Tutorial Basics(5):Create Entity Data Model
Create Entity Data Model: Here, we are going to create an Entity Data Model (EDM) for SchoolDB datab ...
- ASP.NET-MVC中Entity和Model之间的关系
Entity 与 Model之间的关系图 ViewModel类是MVC中与浏览器交互的,Entity是后台与数据库交互的,这两者可以在MVC中的model类中转换 MVC基础框架 来自为知笔记(Wiz ...
- How to: Use the Entity Framework Model First in XAF 如何:在 XAF 中使用EF ModelFirst
This topic demonstrates how to use the Model First entity model and a DbContext entity container in ...
- 创建实体数据模型【Create Entity Data Model】(EF基础系列5)
现在我要来为上面一节末尾给出的数据库(SchoolDB)创建实体数据模型: SchoolDB数据库的脚本我已经写好了,如下: USE master GO IF EXISTS(SELECT * FROM ...
随机推荐
- .Net Core Web Api实践(三).net core+Redis+docker实现Session共享
前言:上篇文章介绍了.net core+Redis+IIS+nginx实现Session共享,本来打算直接说明后续填坑过程,但毕竟好多坑是用docker部署后出现的,原计划简单提一下.net core ...
- hdu - 4990
Read the program below carefully then answer the question. #pragma comment(linker, "/STACK:1 ...
- 【 Tomcat 】tomcat8.0 基本参数调优配置-----(1)
Tomcat 的缺省配置是不能稳定长期运行的,也就是不适合生产环境,它会死机,让你不断重新启动,甚至在午夜时分唤醒你.对于操作系统优化来说,是尽可能的增大可使用的内存容量.提高CPU 的频率,保证文件 ...
- moco响应中文乱码
moco版本为:moco-runner-standalone-0.11.1.jar 在一次使用moco框架的时候,浏览器查看响应时,发现返回来的中文是乱码. 按照网上的操作,在响应结果中加上heade ...
- 深入浅出| java中的clone方法
每天进步一丢丢,连接梦与想 我们还年轻,但这不是你浪费青春的理由 克隆和复制 clone,有人称之为克隆,有人称之为复制,其实都是同一个东西 本文称之为"克隆",毕竟人家方法名叫& ...
- (转)GET来的漏洞
转自呆子不开口在wooyun知识库的文章 0x00 前言 这篇文章主要讲目前互联网上get方法被不规范使用带来的一些安全漏洞.其中重点会讲get请求在账号登陆体系中被滥用的场景和攻击方式. 0x01 ...
- 编写python程序读入1到100之间的整数,然后计算每个数出现的次数,输入0表示结束输人,输入数据不包括0。如果数出现的大现如果大于1,输出时使用复数times
#-*- coding:UTF-8 -*- #环境:python3 print("Enter the numbers between 1 and 100:") enterList= ...
- 3分钟接入socket.io使用
WebSocket 简介 传统的客户端和服务器通信协议是HTTP:客户端发起请求,服务端进行响应,服务端从不主动勾搭客户端. 这种模式有个明显软肋,就是同步状态.而实际应用中有大量需要客户端和服务器实 ...
- Windows 64 位 mysql 5.7以上版本包解压中没有data目录和my-default.ini和my.ini文件以及服务无法启动的解决办法以及修改初始密码的方法
下载解压mysql文件之后,中间出现了一些问题,终于解决,希望能帮助到需要的朋友. mysql官网下载地址:https://dev.mysql.com/downloads/mysql/点击打开链接 以 ...
- 在 Ubuntu 上安装 K8S教程
在 Ubuntu 上安装 K8S教程 1,更新系统源 如果系统本身自带得镜像地址,服务器在国外,下载速度会很慢,可以打开 /etc/apt/sources.lis 替换为国内得镜像源. apt upg ...