OWL本体语言和Protege本体编辑器
OWL本体语言和Protege本体编辑器
演讲稿原作者:Wala Abdulaziz
译者:Wu Di (pimgeek)
转载、编辑:Tan Liwei
原文发布日期:2013年6月5号
原文链接:https://prezi.com/ggozsbzy2xn-/owl-protege/
什么是本体(Ontology)?
在计算机科学和信息科学中,本体的作用是表达知识.在本体中,知识可以被正式地表达为一系列的领域相关概念,以及这些概念之间的相互关系.
本体可以被用来为一个知识领域建立模型,并且支持对这个模型中的实体进行推理.
我们为什么需要本体?

- 利用本体,可以在不同的人或应用程序之间共享一组有结构的信息,并达成理解上的共识.(补充:消除歧义、去重)
- 允许我们重复使用领域知识:当我们已经拥有了关于某个知识领域的本体时,我们可以把同一个本体应用于不同的应用程序中,这就可以避免重新发明轮子.
- 可以把知识领域内的(内行人不言自明的)前提假设明确地表达出来.
- 把领域知识与操作性知识区分开.
- 利用概念之间的已适当建立的关系分析领域知识.
本体工程的流程
- 确定知识领域.
- 列举出这个领域里会用到的术语.
- 定义一些可以表达领域内概念的类(class).
- 定义每个类的属性,以便将他们链接起来.
- 定义约束条件, 以便限制类和属性.
- 从类出发创建一些实例
Web 本体语言(OWL)
- 一种用来定义Web本体的语言.
- 一个OWL的本体可以包含关于类,属性及其实例的描述.
- 当给定了一个这样的本体时,OWL的形式化语义允许我们由本体自动推导出一些符合逻辑的结论.
什么是Protégé?

- Protege 是一个图形界面的本体开发工具,它支持丰富的知识模型
- Protege 是开源的,并且可以免费获取
OWL 本体的组成单元
- 个体代表知识领域中我们感兴趣的那些具体对象.
- 个体有时候也被称作实例.
- 个体也可以被称作"属于某个类的实例".
(2) 属性
(3) 类
- OWL的类可以被理解为包含若干个体的集合
- 类需要被形式化地描述出来,这些描述精确界定了究竟个体能否成为某个类的成员的"准入标准"
- 不同的类可以被组织为体现父类子类关系的树形大纲结构
披萨饼范例本体

当前活动的本体

类

- 披萨饼本体中有很多类
- 子类: 在OWL 中表示隐含关系
- 不相交的类: 把一组类区分开来(如果A类与B类不相交,那么属于A类的个体不可能同时属于B类)
- 我们让以下四个类不相交
IceCream
Pizaa
PizzaBase
PizzaTopping
对象属性是一对个体之间的关系,它从某一个体出发,链接到另一个体.
数据属性:
数据属性是个体与某个数据取值之间的关系.
标注属性:
标注属性被用来为类,个体,对象属性/数据属性等添加信息(元信息,或者所谓的关于数据的数据). 译者注: 标注属性本身也可添加标注属性.
对象属性

对象属性
- hasCountryOfOrigin (拥有发源地国家)
- hasIngredient: (拥有组成要素)
haseBase (拥有面饼)
hasTopping (拥有覆盖食材) - hasSpiciness (拥有辛辣口味)
- isIngerdientOf:
isBaseOf
isToppingOf
对象属性的特性
函数型特性
函数型特性(Functional Properties):
如果一个对象属性是函数型的, 那么借助这个属性,某个体a只能连接到唯一的个体b
函数型特性也被称作单值特性
hasBase property.
(一个披萨只能拥有一个面饼)
反向函数型特性(Inverse Functional Properties):
如果一个对象属性具有反向函数型特性,那么这意味着它的反向属性具有函数型特性.
例如:
(1) isIngredientOf (多对一)
(2) hasIngredient (一对多)
如果一个对象属性P是传递型的,那么如果个体a通过属性P关联到b,且b又通过属性P关联到c,那么我们就可以推得:a一定可以通过属性P直接关联到c.
对称型特性(Symmetric Properties):
如果属性P是对称的, 并且个体a 通过属性P与个体b 发生关联,那么我们可以推得b 也一定通过属性P与a 发生关联.
非对称型特性(Asymmetric properties):
如果属性P是非对称的, 并且个体a 通过属性P与个体b 发生关联,那么我们可以推得b 不可能通过属性P与a 发生关联.
对象属性把来自定义域的个体链接到来自值域的个体.(但这种规定并不被用来限制个体).当一对个体 a 和 b 可以被这个对象属性关联时,即使它们并没有被明确地分配给任何类,我们也能推出 a 一定属于定义域所对应的类,而 b 则一定属于值域所对应的类.
推理机(Reasoner)
推理机是Protege 的重要功能之一. 我们不仅可以用推理机判定一个类的定义是否一致,还能利用充分必要条件发现一些隐含的信息.

一致性检查
检查一个(译者注:按规则形成的)类是否不可能包含任何个体.
自动分类
给定一个包含了很多类的树形结构,分类器能够把其中的一些类自动归集到对应的分支上去.(译者注:分类器是推理机的一部分,不仅可以对类做自动归集,还可以对个体做自动归集.)
分类器
当推理得出的类呈现红色时,这表示这些类是不一致的.(如下图:)

在本体理论中,不一致表示这样的类不可能拥有任何个体.
说明:
如果我们取消CheeseToppping 与 VegetableTopping之间的互不相交关系,然后再次开动分类器,那么CheeseyVegetableTopping这个类就不再是不一致的了.
OWL可视化(OWLViz)
- OWLViz 插件可以被用来在我们已定义好的类结构中四处游走和查看
- 检查类的一致性,并且用树的形状展示逻辑意义.
- 在包含很多类,而且部分类的父类也很多的大型本体库中,这个插件很有用.
OWLViz 提供了:
- 以声明方式形成的类的层级关系
- 以推理方式形成的类的层级关系
以声明方式形成的类:

以推理方式形成的类

不一致的类

(上图中)存在不一致性的类,在图中以红色高亮显示.
有困惑吗?
参考资料
(1) Ontology (information science): http://en.wikipedia.org/wiki/Ontology_(information_science)
(2) Natalya F. Noy, Deborah L. McGuinness, Ontology Development 101: A Guide to Creating Your First Ontology, Stanford, Available from:
http://www.ksl.stanford.edu/people/dlm/papers/ontology-tutorial-noy-mcguinness.pdf
(3) What is protégé?: http://protege.stanford.edu/overview/index.html
(4) W3C,(2004)OWL Web Ontology Language Guide: http://www.w3.org/TR/owl-guide/
(5) Protégé Glossary:
http://protegewiki.stanford.edu/wiki/Pr4_UG_mi_Glossary#FaCT.2B.2B
(6) Matthew Horridge, (2011) A Practical Guide To Building OWL Ontologies
Using Protege 4 and CO-ODE Tools [online] Manchester, Available from:
http://owl.cs.manchester.ac.uk/tutorials/protegeowltutorial/resources/ProtegeOWLTutorialP4_v1_1.pdf
OWL本体语言和Protege本体编辑器的更多相关文章
- CHENGDU1-Python编程语言和PEP8规范
CHENGDU1-Python编程语言和PEP8规范 PEP8规范6条? 答:PEP8规范说白了就是一种规范,可以遵守,也可以不遵守,遵守PEP8可以让代码的可读性更高. 代码编排:---缩进,4个空 ...
- C语言和C++中动态申请内存
在C语言和C++的动态内存的使用方法是不同的,在C语言中要使用动态内存要包含一个头文件即 #include<malloc.h> 或者是#include<stdlib.h> ...
- C语言和C++篇
C语言和C++篇 基本上所有主流的编程语言都有String的标准库,因为字符串操作是我们每个程序员几乎每天都要遇到的.想想我们至今的代码,到底生成和使用了多少String!标题上所罗列的语言,可以看成 ...
- c语言和java的区别
今晚读了一下c程序设计语言,这是一本经典书籍,发现C语言和java有很多是相同的,毕竟java是由c语言进化来的. 我大概从我自己的思考来谈谈不同点 1.c语言是面向过程,主要单位是函数,变量和函数的 ...
- 从C,C++,JAVA和C#看String库的发展(一)----C语言和C++篇
转自: http://www.cnblogs.com/wenjiang/p/3266305.html 基本上所有主流的编程语言都有String的标准库,因为字符串操作是我们每个程序员几乎每天都要遇到的 ...
- 大数据工具比较:R 语言和 Spark 谁更胜一筹?
本文有两重目的,一是在性能方面快速对比下R语言和Spark,二是想向大家介绍下Spark的机器学习库 背景介绍 由于R语言本身是单线程的,所以可能从性能方面对比Spark和R并不是很明智的做法.即使这 ...
- Go语言和ASP.NET的一般处理程序在处理WEB请求时的速度比较
Go语言和ASP.NET的一般处理程序在处理WEB请求时的速度比较 1.首先写一个Go语言的简单WEB程序,就返回一个HelloWord! package main import ( f " ...
- c语言和java以及安卓和苹果
苹果手机是本地,没有中间环节,速度快,基于Linux系统 安卓是通过虚拟机,影响速度 就像c语言和java c适用于架构小的地方,因为直接编译运行 而java用于架构比较大的地方,启动慢,启动之后效率 ...
- C语言和sh脚本的杂交代码
在网上看到了一个把 C语言和bash杂并起来的例子,这个示子如下所示.在下面这个例子中,我们把脚本用#if 0这个预编译给起来,这样就不会让其编译到C语言中了. #if 0 echo "He ...
随机推荐
- Django---进阶1
目录 静态文件配置 request对象方法初识 pycharm链接数据库(MySQL) django链接数据库(MySQL) Django ORM 字段的增删改查 数据的增删改查 今日作业 静态文件配 ...
- CTFHub_技能树_远程代码执行
RCE远程代码执行 命令分割符: linux: %0a .%0d .; .& .| .&&.|| 分隔符 描述 ; 如果每个命令都被一个分号(:)所分隔,那么命令会连续地执行下 ...
- 数据可视化之powerBI技巧(四)使用Power BI制作帕累托图
各种复杂现象的背后,其实都是受关键的少数因素和普通的大多数因素所影响,把主要精力放在关键的少数因素上,就能达到事半功倍的效果. 这就是大家常说的二八原则,也称为帕累托原则,最早是由意大利经济学家 V. ...
- Python基础最难知识点:正则表达式(使用步骤)
前言 本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. 正则表达式,简称regex,是文本模式的描述方法.你可以在google上搜 ...
- bzoj1661[Usaco2006 Nov]Big Square 巨大正方形*
bzoj1661[Usaco2006 Nov]Big Square 巨大正方形 题意: n*n的图中有一些J点,一些B点和一些空白点,问在空白点添加一个J点所能得到的有4个J点组成最大正方形面积.n≤ ...
- Ethical Hacking - GAINING ACCESS(13)
CLIENT SIDE ATTACKS Backdoor delivery method2 - backdooring exe downloads Backdoor any exe the targe ...
- Python Ethical Hacking - VULNERABILITY SCANNER(2)
VULNERABILITY_SCANNER How to discover a vulnerability in a web application? 1. Go into every possibl ...
- 【Python学习笔记四】获取html内容之后,如何提取信息:使用正则表达式筛选
在能够获取到网页内容之后,发现内容很多,那么下一步要做信息的筛选,就和之前的筛选图片那样 而在python中可以通过正则表达式去筛选自己想要的数据 1.首先分析页面内容信息,确定正则表达式.例如想获取 ...
- 搭建sonarqube分析golang代码
准备postgres 为什么不使用Mysql呢,因为从7.9就不支持了 docker启动postgres docker run -d \ --name sonar-postgres \ -e POST ...
- java基础知识--环境变量配置
说到java,大家应该都了解:J2SE基础.J2ME嵌入式.J2EE延伸的内容,而我们平时接触和所谈大部分都是J2EE企业级应用开发. 作为开发者,使用java之前,必须安装java开发环境,配置ja ...