【原】Spark Rpc通信源码分析

Spark 1.6+推出了以RPCEnv、RPCEndpoint、RPCEndpointRef为核心的新型架构下的RPC通信方式。其具体实现有Akka和Netty两种方式，Akka是基于Scala的Actor的分布式消息通信系统，Netty是由JBOSS提供的一个java开源框架。Netty提供异步的、事件驱动的网络应用程序框架和工具，用以快速开发高性能、高可靠性的网络服务器和客户端程序。

Rpc Environment（RpcEnv）是一个RpcEndpoints用于处理消息的环境，它管理着整个RpcEndpoints的声明周期：（1）根据name或uri注册endpoints（2）管理各种消息的处理（3）停止endpoints。RpcEnv必须通过工厂类RpcEnvFactory创建。

RpcEndpoint需要注册到RpcEnv，RpcEnv处理从RpcEndpointRef或远程节点发送过来的消息，然后把响应消息给RpcEndpoint。对于Rpc捕获到的异常消息，RpcEnv将会用RpcCallContext.sendFailure将失败消息发送给发送者，或者将没有发送者、‘NotSerializableException’等记录到日志中。同时，RpcEnv也提供了根据name或uri获取RpcEndpointRef的方法。

Rpc、RpcEndpoint、RpcEndpointRef三者关系

1.RpcEnv源码分析

1.根据RpcEndpoint返回RpcEndpointRef，具体实现在RpcEndpoint.self方法中，如果RpcEndpointRef不存在，将返回null

private[rpc] def endpointRef(endpoint: RpcEndpoint): RpcEndpointRef

2.根据RpcEndpoint的name注册到RpcEnv中并返回它的一个引用RpcEndpointRef

def setupEndpoint(name: String, endpoint: RpcEndpoint): RpcEndpointRef

3.获取RpcEndpointRef的方法

（1）通过url获取RpcEndpointRef

//通过url异步获取RpcEndpointRef

def asyncSetupEndpointRefByURI(uri: String): Future[RpcEndpointRef]

//通过url同步获取RpcEndpointRef，这是一个阻塞操作

def setupEndpointRefByURI(uri: String): RpcEndpointRef = {

defaultLookupTimeout.awaitResult(asyncSetupEndpointRefByURI(uri))}

（2）根据systemName、address、endpointName获取RpcEndpointRef，其实是将三者拼接为uri，根据uri获取

//异步获取

def asyncSetupEndpointRef(

systemName: String, address: RpcAddress, endpointName: String): Future[RpcEndpointRef] = {

asyncSetupEndpointRefByURI(uriOf(systemName, address, endpointName))}

//同步获取

def setupEndpointRef(

systemName: String, address: RpcAddress, endpointName: String): RpcEndpointRef = {

setupEndpointRefByURI(uriOf(systemName, address, endpointName))

}

4.根据RpcEndpointRef停止RpcEndpoint

def stop(endpoint: RpcEndpointRef): Unit

5.等待直到RpcEnv退出

def awaitTermination(): Unit

6.RpcEndpointRef需要RpcEnv来反序列化，所以当反序列化RpcEndpointRefs的任何object时，应该通过该方法来操作

def deserializeT: T

2.RpcEndpoint源码分析

RpcEndpoint定义了由消息触发的一些函数，onStart, receive and onStop的调用是顺序发生的。它的声明周期是constructor -> onStart -> receive* -> onStop。注意，receive能并发操作，如果你想要receive是线程安全的，请使用ThreadSafeRpcEndpoint，如果RpcEndpoint抛出错误，它的onError方法将会触发。它有51个实现子类，我们比较熟悉的是Master、Worker、ClientEndpoint等。

1.启动RpcEndpoint处理任何消息

def onStart(): Unit = {}

2.停止RpcEndpoint

def onStop(): Unit = {}

3.处理RpcEndpointRef.send或RpcCallContext.reply方法，如果收到不匹配的消息，将抛出SparkException

def receive: PartialFunction[Any, Unit] = {

case _ => throw new SparkException(self + " does not implement 'receive'")}

4.处理RpcEndpointRef.ask方法，如果不匹配消息，将抛出SparkException

def receiveAndReply(context: RpcCallContext): PartialFunction[Any, Unit] = {

case _ => context.sendFailure(new SparkException(self + " won't reply anything"))}

5.当处理消息发生异常时

def onError(cause: Throwable): Unit = {

throw cause}

6.当远程地址连接到当前的节点地址时触发

def onConnected(remoteAddress: RpcAddress): Unit = {

}

7.当远程地址连接断开时触发

def onDisconnected(remoteAddress: RpcAddress): Unit = {

}

8.当远程地址和当前节点的连接发生网络异常时触发

def onNetworkError(cause: Throwable, remoteAddress: RpcAddress): Unit = {

// By default, do nothing.

}

3.RpcEndpointRef源码分析

RpcEndpointRef是RpcEndpoint的一个远程引用，是线程安全的。它有两个实现子类：即AkkaRpcEndpointRef和NettyRpcEndpointRef。

1.发送单方面的异步消息

def send(message: Any): Unit

2.发送一个消息给RpcEndpoint.receiveAndReply并返回一个Future在指定的时间内接受响应，本方法值请求一次

def askT: ClassTag: Future[T]

3.发送消息给RpcEndpoint并在默认的超时内得到结果，否则抛出SparkException，注意，本方法是一个阻塞操作可能消耗时间，所以不要早消息循环中调用它

def askWithRetryT: ClassTag: T = askWithRetry(message, defaultAskTimeout)

最后，画图说明一下两者的消息传递的过程，RpcEndpointRef作为消息的主动者，RpcEndpoint作为消息的被动者

RpcEndpoint、RpcEndpointRef

【原】Spark Rpc通信源码分析的更多相关文章

Spark RPC框架源码分析（一）简述
Spark RPC系列: Spark RPC框架源码分析(一)运行时序 Spark RPC框架源码分析(二)运行时序 Spark RPC框架源码分析(三)运行时序一. Spark rpc框架概述 S ...
Spark RPC框架源码分析（二）RPC运行时序
前情提要: Spark RPC框架源码分析(一)简述一. Spark RPC概述上一篇我们已经说明了Spark RPC框架的一个简单例子,Spark RPC相关的两个编程模型,Actor模型和Re ...
Spark RPC框架源码分析（三）Spark心跳机制分析
一.Spark心跳概述前面两节中介绍了Spark RPC的基本知识,以及深入剖析了Spark RPC中一些源码的实现流程. 具体可以看这里: Spark RPC框架源码分析(二)运行时序 Spark ...
Thrift笔记(三)--Thrift框架通信源码分析
Thrift 客户端调用RPC的Demo public static void main(String[] args) throws Exception { TTransport transport ...
【原】Spark中Master源码分析（一）
Master作为集群的Manager,对于集群的健壮运行发挥着十分重要的作用.下面,我们一起了解一下Master是听从Client(Leader)的号召,如何管理好Worker的吧. 1.家当(静态属 ...
【原】Spark中Client源码分析（二）
继续前一篇的内容.前一篇内容为: Spark中Client源码分析(一)http://www.cnblogs.com/yourarebest/p/5313006.html DriverClient中的 ...
【原】Spark中Master源码分析（二）
继续上一篇的内容.上一篇的内容为: Spark中Master源码分析(一) http://www.cnblogs.com/yourarebest/p/5312965.html 4.receive方法, ...
【原】 Spark中Worker源码分析（二）
继续前一篇的内容.前一篇内容为: Spark中Worker源码分析(一)http://www.cnblogs.com/yourarebest/p/5300202.html 4.receive方法, r ...
Spark Scheduler模块源码分析之TaskScheduler和SchedulerBackend
本文是Scheduler模块源码分析的第二篇,第一篇Spark Scheduler模块源码分析之DAGScheduler主要分析了DAGScheduler.本文接下来结合Spark-1.6.0的源码继 ...

随机推荐

TeeChart 的应用
TeeChart 是一个很棒的绘图控件,不过由于里面没有注释,网上相关的资料也很少,所以在应用的时候只能是一点点的试.为了防止以后用到的时候忘记,我就把自己用到的东西都记录下来,以便以后使用的时候查询 ...
windows 使用excel导出的问题
解决 window server2008 r2 没有注册Ofiice组件的方法 .NET下在用Microsoft.Office.Interop.Excel及word 操作Excel和Word时, ...
cin、cin.get()、cin.getline()、getline()、gets()等函数的用法
学C++的时候,这几个输入函数弄的有点迷糊:这里做个小结,为了自己复习,也希望对后来者能有所帮助,如果有差错的地方还请各位多多指教(本文所有程序均通过VC 6.0运行)转载请保留作者信息:1.cin1 ...
Java集合框架类图
Java集合框架的类图 http://blog.toruneko.net/28
An error occurred while collecting items to be installed session context was:(profile=DefaultProfile... 解决方案
遇到同样问题的小伙伴请:点击Eclipse上方工具栏中help --> Install new software... --> 看图点击进红框的位置在打开的窗口中,将窗口右侧的Avail ...
Twitter:蓄水池储水量问题
早上买了两个饼夹肉,我吃了一个,辣椒粉好多,现在一直在实验室喝水. 一.倒数第n位今年暑假去世纪佳缘面试,其中一题就是这个,只能遍历一遍链表求出倒数第n位. 答案是两个指针,第一个在头部设为A,第二 ...
[DP] The 0-1 knapsack problem
Give a dynamic-programming solution to the 0-1 knapsack problem that runs in O(nW) time, where n is ...
HDU 1160 FatMouse's Speed（DP）
点我看题目题意 :给你好多只老鼠的体重和速度,第 i 行代表着第 i 个位置上的老鼠,让你找出体重越大速度越慢的老鼠,先输出个数,再输出位置. 思路 :看题的时候竟然脑子抽风了,看了好久愣是没明白题 ...
服务器部署_nginx的host not found in upstream "tomcat_www.bojinne" 错误解决办法
今天修改了nginx.conf之后,nginx-t报错. 1. 网上多认为此错误需要修改/etc/hosts,添加该域名对应的ip 2. 我自己的解决方案是仔细核对 upstream 后面的字符和 ...
Altium designer入门篇-过孔不开窗
有没有觉得在设计PCB的时候,放的过孔开窗了,在焊接实际PCB板子的时候,会有各种锡尖,拖锡尾巴,严重的网络间短路.此经验简述了使用Altium designer软件,让过孔不开窗的设置办法.初学者可 ...

【原】Spark Rpc通信源码分析

【原】Spark Rpc通信源码分析的更多相关文章

随机推荐

热门专题