[NLP] 语义网络与知识图谱入门(一)
语义网络与知识图谱入门(一)
RDF/XML
本体:一种形式化的对于共享概念体系明确而又详细的说明。就是指一种抽象的模型,可以用来描述对象类型、属性以及关系类型所构成的世界。
RDF/XML主要讲的就是如何用XML的方式来表示RDF的图。

椭圆表示节点,矩形表示文本,弧表示谓语。
节点描述
<rdf:Description rdf:about="A"></rdf:Description>
一个节点本身需要被rdf:Description来定义,通过rdf:about来说明资源uri。
前面rdf是空间名字,固有空间默认为rdf空间。
属性描述
如何描述A的属性d的值为D呢?
属性描述
<rdf:Description rdf:about="A">
<d>D</d>
</rdf:Description>
简写
<rdf:Description rdf:about="A" d="D"></rdf:Description>
路径描述
如何描述A到B的路径呢?
可以通过定义rdf:nodeId的方式指定唯一的nodeId,也可以通过rdf:parseType为Resouce来指定空节点。
属性描述,注意这里的B也是个节点,所以也需要Description
<rdf:Description rdf:about="A">
<a rdf:nodeId="abc"></a>
</rdf:Description>
<rdf:Description rdf:nodeId="abc">
<b>
<rdf:Description rdf:about="B" ></rdf:Description>
</b>
</rdf:Description>
不单独写空节点,即用resource
<rdf:Description rdf:about="A">
<a rdf:parseType="Resource">
<b>
<rdf:Description rdf:about="B" ></rdf:Description>
</b>
</a>
</rdf:Description>
文本表示
<?xml version="1.0"?>
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:ex="http://purl.org/dc/elements/1.1/">
<rdf:Description rdf:about="http://example.com">
<ex:prop rdf:parseType="Literal" xmlns:a="http://example.org/a#">
123
</ex:prop>
</rdf:Description>
</rdf:RDF>
xmlns即xml namespace,定义一个命令空间。
使用语法: xmlns:namespace-prefix="namespaceURI"。
这里定义一个名字为a的命令空间
可以看到解析后的结果为:
| Number | Subject | Predicate | Object |
|---|---|---|---|
| 1 | http://example.com](http://example.com/) | http://purl.org/dc/elements/1.1/prop) | "123"^^http://www.w3.org/1999/02/22-rdf-syntax-ns#XMLLiteral |
解析网址:https://www.w3.org/RDF/Validator/rdfval
通过解析可以看出来将prop指向的内容解析成了文本类型,即通过指定rdf:parseType="Literal"来实现。谓词rdf:parseType="Literal",指明节点的内容是普通文本,解释器不需要对其进行解释。
数据类型
可以使用rdf:datatype指定文本的数据类型
<rdf:RDF>
<rdf:Description rdf:about="http://example.com">
<a rdf:datatype="http://www.w3.org/2001/XMLSchema#int">
123
</a>
</rdf:Description>
</rdf:RDF>
同样的,也有string,date,decimal等数据类型可以在上面的datatype中指定。
RDF Schema (RDFS)
RDFS的全称为RDF Schema,RDF Schema 中的类与面向对象编程语言中的类非常相似。这就使得资源能够作为类的实例和类的子类来被定义。
<rdf:RDF
xmlns:rdf= "http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"
xml:base= "http://www.animals.fake/animals#">
<rdf:Description rdf:ID="animal">
<rdf:type
rdf:resource="http://www.w3.org/2000/01/rdf-schema#Class"/>
</rdf:Description>
<rdf:Description rdf:ID="horse">
<rdf:type
rdf:resource="http://www.w3.org/2000/01/rdf-schema#Class"/>
<rdfs:subClassOf rdf:resource="#animal"/>
</rdf:Description>
</rdf:RDF>
rdf:type
用来表示主语是谓语的一个实例,主语是一个资源,谓语是一个类 ,上面例子中说明animal是class的实例,horse也是class的实例。
rdfs:subClassOf
用来表示主语是谓语的子类,主语和谓语都是一个类 。上面例子中表明horse是animal的子类。
rdfs:subPropertyOf
用来表示主语是谓语的子属性,主语和谓语都是属性
rdfs:domain
用来表示属性的定义域
rdfs:range
用来表示值域
另外,一切所有皆资源(resource):所有类(class)都是资源,所有属性(property)都是资源,所有literal都是资源。
容器
Open Lists
open lists为课题添加新元素的容器。
rdf:Seq表示一个规定为有序的值的列表(比如一个字母顺序的排序),可以包含重复值。
rdf:Bag表示一个规定为无序的值的列表,可以包含重复值。
rdf:Alt表示一个可替换的值的列表(用户仅可选择这些值的其中之一)。
<rdf:RDF>
<rdf:Description rdf:about="http://a.com">
<a>
<rdf:Alt>
<rdf:li>CD</rdf:li>
<rdf:li>Record</rdf:li>
<rdf:li>Tape</rdf:li>
</rdf:Alt>
</a>
</rdf:Description>
</rdf:RDF>
rdf:li,解释器在解释时,将自动生成编号。
Closed Lists
closed lists为不可以添加元素的容器,其成为collections。通过rdf:parseType="collections"可以将宾语视为closed lists。
<rdf:RDF
xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:cd="http://recshop.fake/cd#">
<rdf:Description
rdf:about="http://recshop.fake/cd/Beatles">
<cd:artist rdf:parseType="Collection">
<rdf:Description rdf:about="http://recshop.fake/cd/Beatles/George"/>
<rdf:Description rdf:about="http://recshop.fake/cd/Beatles/John"/>
<rdf:Description rdf:about="http://recshop.fake/cd/Beatles/Paul"/>
<rdf:Description rdf:about="http://recshop.fake/cd/Beatles/Ringo"/>
</cd:artist>
</rdf:Description>
</rdf:RDF>
Turtle语法
turtle用三元组表示,每个句子后面一个.表示句子结束。
前缀
@prefix book: <http://aa.com> .
@prefix ex: <http://axx.com> .
通过@prefix来指定前缀,这样就可以在后面用这个前缀了。
book:uri ex:a "aaa".
[NLP] 语义网络与知识图谱入门(一)的更多相关文章
- [NLP] 语义网络与知识图谱入门(二)
语义网络与知识图谱入门(二) OWL 本体声明 owl用owl:Ontology来声明一个本体.rdf:about属性为本体提供一个名称或引用.根据标准,当rdf:about属性的值为"&q ...
- Atitit 知识图谱解决方案:提供完整知识体系架构的搜索与知识结果overview
Atitit 知识图谱解决方案:提供完整知识体系架构的搜索与知识结果overview 知识图谱的表示和在搜索中的展1 提升Google搜索效果3 1.找到最想要的信息.3 2.提供最全面的摘要.4 ...
- 知识图谱辅助金融领域NLP任务
从人工智能学科诞生之初起,自然语言处理(NLP)就是人工智能核心的研究问题之一.NLP的重要性是毋庸置疑的,它能够实现以自然语言交流为特征的高级人机交互,使机器能“阅读”所有以文字形式记录的人类知识, ...
- 知识图谱与机器学习 | KG入门 -- Part1-b 图深度学习
介绍 我们正在定义一种新的机器学习方法,专注于一种新的范式 -- Data Fabric. 在上一篇文章中,我们对机器学习给出了新的定义: 机器学习是一种自动发现Data Fabric中隐藏的&quo ...
- 知识图谱与机器学习|KG入门 -- Part2 建立知识图谱
介绍 在本系列前面两篇文章中我一直在讨论Data Fabric,并给出了一些关于Data Fabric中的机器学习和深度学习的概念.并给出了我对Data Fabric的定义: Data Fabric是 ...
- 知识图谱与机器学习 | KG入门 -- Part1 Data Fabric
介绍 如果你在网上搜索机器学习,你会找到大约20500万个结果.确实是这样,但是要找到适合每个用例的描述或定义并不容易,然而会有一些非常棒的描述或定义.在这里,我将提出机器学习的另一种定义,重点介绍一 ...
- Task1:知识图谱介绍(1天)
一.知识图谱简介 "知识图谱本质上是语义网络(Semantic Network)的知识库".但这有点抽象,所以换个角度,从实际应用的角度出发其实可以简单地把知识图谱理解成多关系图( ...
- 哈工大知识图谱(Knowledge Graph)课程概述
一.什么是知识图谱 知识(Knowledge)可以理解为 精炼的数据,知识图谱(Knowledge Graph)即是对知识的图形化表示,本质上是一种大规模语义网络 (semantic network) ...
- 知识图谱实体对齐1:基于平移(translation)的方法
1 导引 在知识图谱领域,最重要的任务之一就是实体对齐 [1](entity alignment, EA).实体对齐旨在从不同的知识图谱中识别出表示同一个现实对象的实体.如下图所示,知识图谱\(\ma ...
随机推荐
- json串到java对象
json串到java对象 前端传入参数json字符串,格式如下: {"语文":"88","数学":"78"," ...
- 测试Random类nextInt()方法连续两次结果一样的概率
public static void main(String[] args) { int count = 0; int a = 0; Random r = new Random(); while (t ...
- linux内核配置与编译
配置内核:配置硬件和软件需的部分. make config:基于文本模式的交互式配置.(一问一答) make menuconfig:基于文本模式菜单性配置.(直观简单高效) <*>会产生b ...
- CentOS 7 安装 gcc 4.1.2
CentOS 7 安装 gcc 4.1.2 0. 参考 在centOS7.2上编译gcc4.1.2 1. 安装了编译所需 yum groupinstall "Development Tool ...
- IO模型(epoll)--详解-01
写在前面 从事服务端开发,少不了要接触网络编程.epoll作为linux下高性能网络服务器的必备技术至关重要,nginx.redis.skynet和大部分游戏服务器都使用到这一多路复用技术. 本文会从 ...
- git中working tree, index, commit
这三个名字可以简单理解为文件在本地仓库存在的三种不同的位置. 如下,是做commit提交两段提交过程,工作区(working tree),暂存区(index)和 branch(commit). wor ...
- R 语言中的多元线性回归
示例 sessionInfo() # 查询版本及系统和库等信息 # 工作目录设置 getwd() path <- "E:/RSpace" setwd(path) rm(lis ...
- Android 腾讯bugly Tinker 热修复
Bugly热更新是腾讯推出的热更新框架,热更新是指无需到应用市场重新下载安装app,只需要在app内下载补丁包即可实现app的更新,主要用于app的bug修复或者少量改动. 大家在使用app(特别是游 ...
- C# 扩展、常用方法
项目基本做完了,抽空整理下里面用到的扩展方法,以及复用度很高的代码,省的以后到处去找. 一.C#扩展方法——Distinct去重 二.C#扩展方法——获得枚举Description 三.C#扩展方法— ...
- C# 数据测试
查询 100w条数据 39列 把100w条数据转换为匿名对象 加入到集合 所用的时间是 32 s 39列 600万条数据