5. 图的转换操作

图的转换操作主要有以下的方法：

(1) Graph.mapVertices()：对图的顶点进行转换，返回一张新图；

(2) Graph.mapEdges()：对图的边进行转换，返回一张新图。

代码：

    // 转换操作

    println("*************************************************************")

    println("转换操作")

    println("*************************************************************")

    println("顶点的转换操作,顶点age+10:")

    graph.mapVertices{case(id,(name,age)) => (id,(name,age+10))}.vertices.collect.foreach(v => println(s"${v._2._1} is${v._2._2}"))

    println("边的转换操作,边的属性*2:")

    graph.mapEdges(e => e.attr*2).edges.collect.foreach(e => println(s"${e.srcId} to ${e.dstId} att ${e.attr}"))

运行结果：

*************************************************************

转换操作

*************************************************************

顶点的转换操作,顶点age+1:

4 is(Peter,33)

6 is(Kate,24)

2 is(Henry,28)

1 is(Alice,39)

3 is(Charlie,56)

5 is(Mike,36)

边的转换操作,边的属性*3:

2 to 1 att 15

2 to 4 att 6

3 to 2 att 21

3 to 6 att 9

4 to 1 att 3

5 to 2 att 9

5 to 3 att 24

5 to 6 att 24

6. 图的结构操作

图的结构操作主要有：

(1) Graph.subgraph()：求图的子图，从图中选出一些顶点，这些顶点以及相应的边就构成了一张子图。

代码：

    println("*************************************************************")

    println("结构操作")

    println("*************************************************************")

    println("顶点年纪>25的子图:")

    val subGraph = graph.subgraph(vpred = (id,vd) => vd._2 >= 25)

    println("子图所有顶点:")

    subGraph.vertices.collect.foreach(v => println(s"${v._2._1} is ${v._2._2}"))

    println

    println("子图所有边:")

    subGraph.edges.collect.foreach(e => println(s"${e.srcId} to ${e.dstId} att ${e.attr}"))

从图中选出年龄大于等于25岁的顶点。运行结果：

*************************************************************

结构操作

*************************************************************

顶点年纪>25的子图:

子图所有顶点:

Peter is 32

Henry is 27

Alice is 38

Charlie is 55

Mike is 35

子图所有边:

2 to 1 att 5

2 to 4 att 2

3 to 2 att 7

4 to 1 att 1

5 to 2 att 3

5 to 3 att 8

7. 图的连接操作

图的连接操作主要有以下方法：

(1) Graph.joinVertices(Graph)：对于两个图中都存在的顶点进行转换；

(2) Graph.outerJoinVertices(Graph)：和(1)类似，区别在于一个顶点只在前一个图中有，后一个图里面没有，就将这个顶点的属性设为Null。

代码：

    // 连接操作

    println("*************************************************************")

    println("连接操作")

    println("*************************************************************")

    case class User(name:String, age:Int, inDeg:Int, outDeg:Int)

    // 创建一个新图,顶点VD的数据类型为User,并从graph做类型转换

    val initialUserGraph:Graph[User, Int] = graph.mapVertices{case(id,(name,age)) => User(name,age,0,0)}

    // initialUserGraph与inDegrees,outDegrees(RDD)进行连接,并修改initialUserGraph中inDeg值,outDeg值

    val userGraph = initialUserGraph.outerJoinVertices(initialUserGraph.inDegrees){

      case(id, u, inDegOpt) => User(u.name, u.age, inDegOpt.getOrElse(0), u.outDeg)}.outerJoinVertices(initialUserGraph.outDegrees){

      case(id, u, outDegOpt) => User(u.name, u.age, u.inDeg, outDegOpt.getOrElse(0))

    }

    println("连接图的属性:")

    userGraph.vertices.collect.foreach(v => println(s"${v._2.name} inDeg:${v._2.inDeg} outDeg:${v._2.outDeg}"))

    println("出度和入度相同的人员:")

    userGraph.vertices.filter{

      case(id, v) => v.inDeg==v.outDeg

    }.collect.foreach{

      case(id, property) => println(property.name)

    }

    println

其实是一个图分别和自己的入度图、出度图进行连接操作，以便把顶点的出度和入度写入顶点的属性。

运行结果：

*************************************************************

连接操作

*************************************************************

连接图的属性:

Peter inDeg:1 outDeg:1

Kate inDeg:2 outDeg:0

Henry inDeg:2 outDeg:2

Alice inDeg:2 outDeg:0

Charlie inDeg:1 outDeg:2

Mike inDeg:0 outDeg:3

出度和入度相同的人员:

Peter

Henry

Spark GraphX实例(2)的更多相关文章

Spark GraphX实例(1)
Spark GraphX是一个分布式的图处理框架.社交网络中,用户与用户之间会存在错综复杂的联系,如微信.QQ.微博的用户之间的好友.关注等关系,构成了一张巨大的图,单机无法处理,只能使用分布式图处理 ...
Spark GraphX实例(3)
7. 图的聚合操作图的聚合操作主要的方法有: (1) Graph.mapReduceTriplets():该方法有一个mapFunc和一个reduceFunc,mapFunc对图中的每一个EdgeT ...
大数据技术之_19_Spark学习_05_Spark GraphX 应用解析 + Spark GraphX 概述、解析 + 计算模式 + Pregel API + 图算法参考代码 + PageRank 实例
第1章 Spark GraphX 概述1.1 什么是 Spark GraphX1.2 弹性分布式属性图1.3 运行图计算程序第2章 Spark GraphX 解析2.1 存储模式2.1.1 图存储模式 ...
Spark GraphX图处理编程实例
所构建的图如下: Scala程序代码如下: import org.apache.spark._ import org.apache.spark.graphx._ // To make some of ...
1. Spark GraphX概述
1.1 什么是Spark GraphX Spark GraphX是一个分布式图处理框架,它是基于Spark平台提供对图计算和图挖掘简洁易用的而丰富的接口,极大的方便了对分布式图处理的需求.那么什么是图 ...
转载：Spark GraphX详解
1.GraphX介绍 1.1 GraphX应用背景 Spark GraphX是一个分布式图处理框架,它是基于Spark平台提供对图计算和图挖掘简洁易用的而丰富的接口,极大的方便了对分布式图处理的需求. ...
Spark GraphX从入门到实战
第1章 Spark GraphX 概述 1.1 什么是 Spark GraphX Spark GraphX 是一个分布式图处理框架,它是基于 Spark 平台提供对图计算和图挖掘简洁易用的而丰 ...
Spark + GraphX + Pregel
Spark+GraphX图 Q:什么是图?图的应用场景 A:图是由顶点集合(vertex)及顶点间的关系集合(边edge)组成的一种网状数据结构,表示为二元组:Gragh=(V,E),V\E分别是顶点 ...
Spark—GraphX编程指南
Spark系列面试题 Spark面试题(一) Spark面试题(二) Spark面试题(三) Spark面试题(四) Spark面试题(五)--数据倾斜调优 Spark面试题(六)--Spark资源调 ...

随机推荐

Asp.Net构架(Http请求处理流程)、(Http Handler 介绍)、(HttpModule 介绍)
Asp.Net构架(Http请求处理流程) Http请求处理流程概述对于普通访问者来说,这就像每天太阳东边升起西边落下一样是理所当然的:对于很多程序员来说,认为这个与己无关,不过是系统管理员或者网管 ...
hdu 1072 有炸弹的迷宫 (DFS)
题意:在n×m的地图上,0表示墙,1表示空地,2表示人,3表示目的地,4表示有定时炸弹重启器.定时炸弹的时间是6,人走一步所需要的时间是1.每次可以上.下.左.右移动一格.当人走到4时如果炸弹的时间不 ...
（第6篇）大数据发展背后的强力推手——HBase分布式存储系统
摘要: 今天我们介绍可在廉价PC Server上搭建起大规模结构化存储集群的分布式存储系统——HBase. 博主福利给大家赠送一套hadoop视频课程授课老师是百度 hadoop 核心架构师内容 ...
webpack 使用环境变量
要在开发和生产构建之间,消除 webpack.config.js 的差异.你可能需要环境变量. 可以使用 Node.js 模块的标准方式:在运行 webpack 时设置环境变量,并且使用 Node.j ...
BZOJP1899ZJOI2004
老早的一道水题题意: 上午的训练结束了,THU ACM小组集体去吃午餐,他们一行N人来到了著名的十食堂.这里有两个打饭的窗口,每个窗口同一时刻只能给一个人打饭.由于每个人的口味(以及胃口)不同,所以 ...
HTML页面滚动时获取离页面顶部的距离2种实现方法
获取离滚动页面的顶部距离有两种方法一是DOM:而是jquery,具体的实现如下,感兴趣的朋友可以尝试操作下方法一:DOM 复制代码代码如下: <script> window.o ...
【noip模拟赛8】魔术棋子
描述在一个M*N的魔术棋盘中,每个格子中均有一个整数,当棋子走进这个格子中,则此棋子上的数会被乘以此格子中的数.一个棋子从左上角走到右下角,只能向右或向下行动,请问此棋子走到右下角后,模(mod)K ...
AndroidStudio 之 Inter x86 Emulator Accelerator(Haxm installer) - not compatible with windows
python的random模块（生成验证码）
python的random模块(生成验证码) random模块常用方法 random.random() #生成0到1之间的随机数,没有参数,float类型 random.randint(1, 3) # ...
springboot springcloud 父项目pom工程创建pom文件
<project xmlns="http://maven.apache.org/POM/4.0.0" xmlns:xsi="http://www.w3.org/20 ...

Spark GraphX实例(2)

5. 图的转换操作

6. 图的结构操作

7. 图的连接操作

Spark GraphX实例(2)的更多相关文章

随机推荐

热门专题