每个JanusGraph都有一个schema,该schema由edge labels, property keys和vertex labels组成。JanusGraph的schema可以显式或隐式创建,推荐用户采用显式定义的方式。JanusGraph的schema是可以在使用过程中修改的,而且不会导致服务宕机,也不会拖慢查询速度。
 
注意:通关系型数据库不同,图数据的schema是定义一张图,而非定义一个vertex的。在Mysql中,我们通常将建立一张表定义为创建一个schema,而在JanusGraph中,一个Graph用于一个schema。
组成结构如下:
 
JanusGraph Schema
            | 
            |-----------Vertex Lables
            |
            |-----------Property Keys
            |
            |-----------Edge Labels
 
Schema Type如edge label, vertex label及property key在元素首次创建时被赋予元素,且不能修改。

Definging Edge Labels

每个连接了两个vertex的edge都有一个label,用于表示关系的语义。例如一个edge label:friend表明了两个vertex有朋友关系。
 
要定义edge lable,调用makeEdgeLabel(String)方法,该方法返回一个builder,可以通过该builder设置edge的多样性(multiplicity),多样性属性定义了具有该label的edge的多样性约束,也即在一个vertex间的最大edge的个数。JanusGraph支持如下多样性。

Edge Label Multiplicity(边的标签多样性)

  • MULTI
在一对vertex间可以有任意多个同样label的edge。
 
  • SIMPLE
在一对vertex间最多只能有一个同样label的edge。
 
  • MANY2ONE
图中任意一个Vertex最多有一个出度(outgoing)edge,和不限个数的入度(incoming)edge,注意:这些对edge的限制对同一个label生效。例如:
 
                          Label: mother
    (大儿子)---------------------------------->|
    (二儿子)---------------------------------->|------------------------>(母亲)
    (小儿子)---------------------------------->|
 
  • ONE2MANY
图中任意一个Vertex最多有一个入度(incoming)edge,和不限个数的出度(outgoing)edge,注意:这些对edge的限制对同一个label生效。例如:
 
                            Label:winnerof
                                                          |-------------------------->(game1)
    (person)--------------------------->|-------------------------->(game2)
                                                          |-------------------------->(game3)
 
  • ONE2ONE
某verex中具有同样Label的edge,只能有最多一个incoming edge和最多一个outgoing edge。
 
默认的多样性设置为MULTI,设置方法如下所示:
mgmt = graph.openManagement()
follow = mgmt.makeEdgeLabel('follow').multiplicity(MULTI).make()
mother = mgmt.makeEdgeLabel('mother').multiplicity(MANY2ONE).make()
mgmt.commit()

Defining Property Keys

vertex和edge上的property是键值对,如name="Danie",中name就是键,value则是Danie,Property Key是Graph Schema中的一部分,并且也用约束value的值类型。

Property Key Data Type

使用dataType定义某个property key的数据类型,JanusGraph强制具有相同Key的value都有相同的数据类型来保证加入到图中的数据是有效的。
 
可以将某个property key的数据类型定义为Object.class来使该value存储任何值(可序列化的),但是还是推荐使用具有具体类型的值类型。设置的类的名称必须是一个确切的类而且不能是接口或抽闲类。JanusGraph提供了class 相等性,所有设置为子类型也是不可以的。
 
JanusGraph提供如下的数据类型:
 
 

Property Key Cardinality(属性key基数)

使用cardinality(Cardinality)来定义Vertex上某个指定key的value的基数。
  • SINGLE
每个KEY只允许一个VALUE
  • LIST
以LIST形式保存VALUE,也即可以有重复值。
  • SET
以SET形式保存VALUE,不能有重复值。
 
默认的cardinality是SINGLE,因此试图向默认property中写入多个值是不可以的。
mgmt = graph.openManagement()
//创建了一个名字为birthDate的属性,并设置值类型为LONG,且只能保存一个值
birthDate = mgmt.makePropertyKey('birthDate').dataType(Long.class).cardinality(Cardinality.SINGLE).make()
//创建了一个名字为name的属性,并设置值类型为String,且可以保存不能重复的多个值
name = mgmt.makePropertyKey('name').dataType(String.class).cardinality(Cardinality.SET).make()
//创建了一个名字为sensorReading的属性,并设置值类型为Double,且可以保存可以重复的多个值
sensorReading = mgmt.makePropertyKey('sensorReading').dataType(Double.class).cardinality(Cardinality.LIST).make()
mgmt.commit()

Relation Types

Edge Labels和property keys结合起来被称为relation types,relation type的在图中必须唯一,也意味着property key和edge label不能有相同的名字。在JanusGraph中有查询relation type的API。
mgmt = graph.openManagement()
if(mgmt.containsRelationType('name'))
name = mgmt.getPropertyKey('name')
mgmt.getRelationTypes(EdgeLabel.class)
mgmt.commit()

Defining Vertex Labels

类似于edge,vertex也有label,但与edge不同的是,edge label是可选的,可用于区分不同类型的vertex,如user vertex和product vertex。
 
虽然vertex label无论在概念还是数据模型层面都是可选的,但JanusGraph为所有的vertex都指定了一个label,addVertex()方法创建的vertex都使用了janusGraph的默认vertex label。vertex label在graph中必须是唯一的。
 
下面是创建代码:
mgmt = graph.openManagement()
person = mgmt.makeVertexLabel('person').make()
mgmt.commit()
// Create a labeled vertex
person = graph.addVertex(label,'person')
// Create an unlabeled vertex
v = graph.addVertex()
graph.tx().commit()

Automatic Schema Maker(自动创建schmea)

如果edge label, property key和vertex label没有被显式创建,则会在第一次使用时通过默认DefaultSchemaMaker创建。
 
默认的,隐式创建的edge label的multiplicity被设置为MULTI;隐式创建的property key设置为SINGLE,value数据类型为Object.class。用户可以通过实现和注册自己的DefaultSchemaMaker来自定义。
 
强烈建议用户显式创建,并配置系统为不支持隐式创建。
schema.default=none

Changing Schema Elements

edge label,property key和vertex label的定义一旦提交到graph就不能修改了,但是schema元素的名字是可以修改的。通过JanusGraphManagement.changeName(JanusGraphSchemaElement, String)。
mgmt = graph.openManagement()
place = mgmt.getPropertyKey('place')
mgmt.changeName(place,'location')
mgmt.commit()
需要注意的是,更新schema element的名称可能不会立即可见,需要等待JanusGraph同步数据或后端数据同步完成。在更名可能导致冲突的情况下,可能要重启实例。如果需要更名,可以先将原来元素改名为新的不存在的元素名称,然后创建新的schema 元素,但不会影响已经创建的数据,需要通过批处理修改数据。
 
 

JanusGraph的schema及数据建模的更多相关文章

  1. 《Entity Framework 6 Recipes》翻译系列 (3) -----第二章 实体数据建模基础之创建一个简单的模型

    第二章 实体数据建模基础 很有可能,你才开始探索实体框架,你可能会问“我们怎么开始?”,如果你真是这样的话,那么本章就是一个很好的开始.如果不是,你已经建模,并在实体分裂和继承方面感觉良好,那么你可以 ...

  2. NoSQL 数据建模技术(转)

    本文转载自:http://coolshell.cn/articles/7270.html ================================================ 全文译自墙外 ...

  3. NoSQL数据建模技术

    原文来自“NoSQL Data Modeling Techniques”,由酷壳网陈皓编译<NoSQL数据建模技术>.这篇文章看完之后,你可能会对NoSQL的数据结构会有些感觉.我的感觉是 ...

  4. Azure CosmosDB (13) CosmosDB数据建模

    <Windows Azure Platform 系列文章目录> 我们在使用NoSQL的时候,如Azure Cosmos DB,可以非常快速的查询非结构化,或半结构化的数据.我们需要花一些时 ...

  5. Cassandra数据建模

    1.  概述 Apache Cassandra将数据存储在表中,每个表都由行和列组成.CQL(Cassandra查询语言)用于查询存储在表中的数据.Apache Cassandra数据模型基于查询并针 ...

  6. TDengine的数据建模?库、表、超级表是什么?怎么用?

    ​欢迎来到物联网的数据世界 在典型的物联网场景中,一般有多种不同类型的采集设备,采集多种不同的物理量,同一种采集设备类型,往往有多个设备分布在不同的地点,系统需对各种采集的数据汇总,进行计算和分析对于 ...

  7. 《驾驭Core Data》 第三章 数据建模

    本文由海水的味道编译整理,请勿转载,请勿用于商业用途.    当前版本号:0.1.2 第三章数据建模 Core Data栈配置好之后,接下来的工作就是设计对象图,在Core Data框架中,对象图被表 ...

  8. 【mysql的设计与优化专题(1)】ER图,数据建模与数据字典

    需求分析是做项目中的极为重要的一环,而作为整个项目中的'血液'--数据,更是重中之重.viso,workbench,phpmyadmin等软件可以帮我们更好的处理数据分析问题. ER图 E-R方法是& ...

  9. EF数据建模(一)

    大中型软件开发过程中常会使用ORM技术,ORM全称是“对象-关系映射Object-Relation-Mappping”.是将数据库中的数据对象的形式表现出来,并将通过面向对象的方式将这些对象组织起来, ...

随机推荐

  1. ACM-ICPC北京赛区(2017)网络赛1【模拟+枚举+数组操作】

    题目1 : Visiting Peking University 时间限制:1000ms 单点时限:1000ms 内存限制:256MB 描述 Ming is going to travel for n ...

  2. MySql笔记之数据表

    数据表:行称为记录  列称为字段 用来存储数据 一.数据类型 数据类型是指列.存储过程参数.表达式和局部变量的数据特征,它决定了数据的存储格式,代表了不同的信息类型. 在我们存储不同类型的数据时,为了 ...

  3. Android学习--广播机制

    广播机制简介 Android的广播可以分为两种类型的,标准广播和有序的广播: 标准广播:  是一种完全异步执行的广播,在广播发出去之后,所有的广播接收器几乎是同一时接收到这条广播. 有序广播:  是一 ...

  4. scrapy生成csv文件空行、csv文件打开乱码(解决方案)

    一.scrapy生成csv文件会有多余的空行 当使用scrapy crawl testspider -o test.csv后,生成的默认csv文件每一行之间是有空行的,解决的方法是修改scrapy的源 ...

  5. python aiohttp sancio 框架性能测试

    开头先啰嗦两句: 由于本人有开发一个博客的打算,所以近期开始选型python的web框架重头学习,选了两款非常火的 aio web框架 aiohttp 和 sancio 进行性能测试以及开发喜好的调研 ...

  6. Problem R: 求斐波那契数列的前n项值

    #include<stdio.h> int main() { int n; while(scanf("%d",&n)!=EOF){ int x1,x2,i,x; ...

  7. Scala实战高手****第12课:Scala函数式编程进阶(匿名函数、高阶函数、函数类型推断、Currying)与Spark源码鉴赏

    /** * 函数式编程进阶: * 1.函数和变量一样作为Scala语言的一等公民,函数可以直接赋值给变量 * 2.函数更常用的方式是匿名函数,定义的时候只需要说明输入参数的类型和函数体即可,不需要名称 ...

  8. 【转载】Mini6410启动过程

    这段时间在尝试使用uBoot来替代友善的Superboot,让板子支持从SD卡启动,所以就仔细研究了一下友善提供的内核和它的启动参数,发现 友善真的蛮聪明,把电脑的启动方式借鉴到它们自己的开发板上了. ...

  9. iOS开发笔记_4自定义TabBar

    新博客:http://www.liuchendi.com 好多APP都使用的是自定义的TabBar,那这个功能应该如何实现呢?首先应该解决的问题就是,加载NavigationController的时候 ...

  10. scrapy-splash抓取动态数据例子十六

    一.介绍 本例子用scrapy-splash爬取梅花网(http://www.meihua.info/a/list/today)的资讯信息,输入给定关键字抓取微信资讯信息. 给定关键字:数字:融合:电 ...