Spark的Rpct模块的学习

Spark的Rpc模块是1.x重构出来可，以前的代码中大量使用了akka的类，为了把akka从项目的依赖中移除，所有添加了该模块。先看下该模块的几个主要的类

使用EA把该模块所有的类都添加进来了

要看懂该模块还是要先了解akka, akka有Actor和ActorRef两个类，一个用于接收消息，一个用于发送消息。正好对应该模块的RpcEndpoint和RpcEndpointRef两个类。

下面大致介绍下这几个类，附带一些scala的特性

1：RpcAddress

该类是一个case class, 用来表示主机名和端口号， case class也可以添加方法，以前还以为不可以呢

它的伴生对象用于从URI,String等构造一个RpcAddress对象

2：RpcTimeout

表示一个超时时间，话说该类的职责有点乱，竟然还有下面的一个方法

def awaitResult[T](awaitable:Awaitable[T]): T ={

try{

Await.result(awaitable, duration)

}catch addMessageIfTimeout

}

在规定时间内返回对象， Await是scala并发库中的一个对象，result在duration时间片内返回Awaitable的执行结果，ready表示duration时间片内Awaitable的状态变成complete,两个方法都是阻塞的，Awaitable相当java中的future，当然scala也有future类，正是继承该类。

它的伴生对象主要是配置文件中获取时间值然后生成该对象

3：RpcEnvFactory

该对象用于创建一个RpcEnv，在RpcEnv中可以看到如何使用该方法

private def getRpcEnvFactory(conf:SparkConf):RpcEnvFactory={

// Add more RpcEnv implementations here

val rpcEnvNames =Map("akka"->"org.apache.spark.rpc.akka.AkkaRpcEnvFactory")

val rpcEnvName = conf.get("spark.rpc","akka")

val rpcEnvFactoryClassName = rpcEnvNames.getOrElse(rpcEnvName.toLowerCase, rpcEnvName)

Utils.classForName(rpcEnvFactoryClassName).newInstance().asInstanceOf[RpcEnvFactory]

}

目前spark.rpc只有akka的实现,如果觉得akka的性能不好也可以自己实现一个Rpc框架。

4： RpcEnv

注解：这是一个RPC环境，所有的RpcEndpont需要注册到该对象中用于接收消息，注册时需要指定一个name, RpcEnv将会处理从RpcEndpontRef和远程节点发送过来的消息（接口里面看不到这块逻辑），然后发送给相应的Endpoint处理，对于接收到的异常使用RpcCallContext来处理。

看RpcEnv像akka中的ActorSystem对象，所有的actor和acotorred都属于它，同时有一个根地址，所有RpcEnv有注册RpcEndpoint的方法，也有一个address返回根地址的方法，RpcEnv有几个方法用于获取RpcEndpointRef , 这里说下Endpoint注册名会成为RpcEndpoint的地址,可以看uriof方法，还有停止和关闭的方法。

RpcEnv的deserialize不明白具体用法，RpcEndpiontRef只能使用RpcEnv解码，当包含有RpcEndpointRef的对象解码时，解码代码将会被方法包装

5：RpcEnvConfig

用于构建RpcEnv的配置对象，一个RpcEnv需要host,port,name,附带sparkconf,securitymananger

host,port,name构造结构入下 akka://host:port/name 大致如此

6：RpcEndpoint

进程间调用的一个端点，当一个消息到来时，方法调用顺序为 onStart, receive, onStop

它的生命周期为constructor -> onStart -> receive* -> onStop .当然还有一些其他方法，都是间触发方法

7：RpcEndpointRef

一个远程RpcEndpoint的引用，通过它可以给远程RpcEndpoint发送消息，可以是同步可以是异步，它映射一个地址，

Pasted from: http://www.cnblogs.com/gaoxing/p/4805943.html

From WizNote

Spark的Rpct模块的学习的更多相关文章

python模块的学习
# time 模块 import time print(time.time()) #当前的时间挫 #time.sleep(3) #休息3秒钟,这3秒cpu不工作的 print(time.gmtime( ...
requsets模块的学习
requests模块的学习使用之前 pip install requests 发起get,post,请求获取响应 response = requests.get(url,headers) # 发起g ...
retrying模块的学习
retrying模块的学习我们在写爬虫的过程中,经常遇到爬取失败的情况,这个时候我们一般会通过try块去进行重试,但是每次都写那么一堆try块,真的是太麻烦,所以今天就来说一个比较pythonic的 ...
AngularJs HTML DOM、AngularJS 事件以及模块的学习（5）
今天的基础就到了操作DOM,事件和模块的学习,其实我个人感觉学习起来AngularJS并没有想象中的那么的艰难,可能是因为这个太基础化吧,但是我们从初学开始就应该更加的自信一些,后来我可能会写一个小的 ...
Python学习---重点模块的学习【all】
time [时间模块] import time # print(help(time)) # time模块的帮助 print(time.time()) # 时间戳 print(time.cloc ...
StreamDM：基于Spark Streaming、支持在线学习的流式分析算法引擎
StreamDM:基于Spark Streaming.支持在线学习的流式分析算法引擎 streamDM:Data Mining for Spark Streaming,华为诺亚方舟实验室开源了业界第一 ...
Python模块——loguru日志模块简单学习
Python loguru模块简单学习首先安装模块:pip install logoru,然后引入模块: from loguru import logger 1.直接输出到console logge ...
Request模块入门学习
使用指令npm install --save request来安装模块,然后使用var request = require('request')完成引用. 对于GET请求,主要是获取目的url中数据. ...
Spark的Streaming和Spark的SQL简单入门学习
1.Spark Streaming是什么? a.Spark Streaming是什么? Spark Streaming类似于Apache Storm,用于流式数据的处理.根据其官方文档介绍,Spark ...

随机推荐

tomact启动报错org.apache.jasper.EmbeddedServletOptions.<init> The scratchDir you specified:xxx is unusable.
问题: 22-May-2018 18:00:15.891 严重 [localhost-startStop-1] org.apache.jasper.EmbeddedServletOptions.< ...
Java读取文件-BufferedReader/FileReader/InputStreamReader/FileInputStream的关系和区别
一.Java读取和存储文件数据流 Java读取文件,实际是将文件中的字节流转换成字符流输出到屏幕的过程这里面涉及到两个类:InputStreamReader和OutputStreamWriter ...
SpringBoot @Value读取properties文件的属性
SpringBoot在application.properties文件中,可以自定义属性. 在properties文件中如下示: #自定义属性 mail.fromMail.addr=lgr@163.c ...
Django2.1在根据models生成数据库表时报 __init__() missing 1 required positional argument: 'on_delete'
解决办法: a=models.ForeignKey('BookInfo',on_delete=models.CASCADE,) 即在外键值的后面加上 on_delete=models.CASCADE ...
pta l2-16（愿天下有情人都是失散多年的兄妹）
题目链接:https://pintia.cn/problem-sets/994805046380707840/problems/994805061769609216 题意:两个异性的人五服之内不得通婚 ...
Linux 向文件末尾追加命令
Linux 向文件末尾追加命令 //echo后边用单引号包围要添加的内容 echo 'add content'>>/home/data/test.sh 注意:>> 是追加 ec ...
CentOS Netstat命令
语法 netstat(选项) 选项 -a或--all:显示所有连线中的Socket: -A<网络类型>或--<网络类型>:列出该网络类型连线中的相关地址: -c或--conti ...
[剑指Offer]12-矩阵中的路径（回溯）
题目链接 https://www.nowcoder.com/practice/c61c6999eecb4b8f88a98f66b273a3cc?tpId=13&tqId=11218&t ...
Qt: 加入打印支持
写记事本打印功能所遇问题,记录以便于查阅. 在vs系统中开发Qt,加入打印支持,不似在QtCreator之pro文件中中加QT +=printsupport解决. 而要在vs(以vs2015为例)中, ...
Struts框架的数据封装二之模型驱动方式
Struts2中提供了两类数据封装的方式? * 第二种方式:模型驱动 > 使用模型驱动的方式,也可以把表单中的数据直接封装到一个JavaBean的对象中,并且表单的写法和之前的写法没有区别! & ...

Spark的Rpct模块的学习

Spark的Rpct模块的学习

Spark的Rpct模块的学习的更多相关文章

随机推荐

热门专题