Spark分析之Master、Worker以及Application三者之间如何建立连接

Master.preStart(){

　　webUi.bind()

　　context.system.scheduler.schedule( millis, WORKER_TIMEOUT millis, self, CheckForWorkerTimeOut) //定时任务检测是否有DEAD WORKER需要移除

　　case CheckForWorkerTimeOut => {

　　　　timeOutDeadWorkers()

　　}

　　/** Check for, and remove, any timed-out workers */　　

　　def timeOutDeadWorkers() {

　　　　...

　　　　if (worker.lastHeartbeat < currentTime - ((REAPER_ITERATIONS + ) * WORKER_TIMEOUT)) {

　　　　　　workers -= worker

　　　　}

　　}

}

Worker.preStart(){

　　override def preStart() {

　　　　webUi = new WorkerWebUI(this, workDir, Some(webUiPort))

　　　　webUi.bind()

　　　　registerWithMaster()  //注册该Worker到Master

　　}

　　def tryRegisterAllMasters() {

　　　　for (masterUrl <- masterUrls) {

　　　　　　logInfo("Connecting to master " + masterUrl + "...")

　　　　　　val actor = context.actorSelection(Master.toAkkaUrl(masterUrl))

　　　　　　actor ! RegisterWorker(workerId, host, port, cores, memory, webUi.boundPort, publicAddress)

　　　　}

　　}

}

Master.scala

case RegisterWorker(){　　

　　persistenceEngine.addWorker(worker)

　　sender ! RegisteredWorker(masterUrl, masterWebUiUrl)  //向Worker发送Worker注册成功事件

　　schedule()  //调度部分后续章节分析  

}

Worker.scala

case RegisteredWorker(){

　　registered = true

　　context.system.scheduler.schedule( millis, HEARTBEAT_MILLIS millis, self, SendHeartbeat)  //Worker注册成功后，定时向Master发送心跳信息

}

case SendHeartbeat =>

　　masterLock.synchronized {

　　if (connected) { master ! Heartbeat(workerId) }

}

Master.scala

case Heartbeat(workerId) => {

　　idToWorker.get(workerId) match {

　　case Some(workerInfo) =>

　　　　workerInfo.lastHeartbeat = System.currentTimeMillis()  //更新该worker的上次发送心跳信息的时间

　　case None =>

　　　　logWarning("Got heartbeat from unregistered worker " + workerId)

　　}

}

=================如上步骤完成了Worker到Master的连接===============================================

SparkContext启动时：

SparkContext.createTaskScheduler()

　　==>new SparkDeploySchedulerBackend()

　　　　==>创建AppClient并启动

　　　　　　==>ClientActor.preStart():registerWithMaster(){actor ! RegisterApplication(appDescription)}  //向Master发起RegisterApplication事件

Master.scala

case RegisterApplication(description) {

　　val app = createApplication(description, sender)

　　registerApplication(app)

　　persistenceEngine.addApplication(app)

　　sender ! RegisteredApplication(app.id, masterUrl)  //向Worker发起RegisteredApplication事件表示该Application已经注册成功

　　schedule()  //调度部分后续章节分析

=======================如上步骤完成了Application到Master的连接===============================================

小结：

1、Master的主要功能：

　　1）Master Leader选举；

　　2）Master对Worker、Application等的管理(接收worker的注册并管理所有的worker，接收client提交的application，(FIFO)调度等待的application并向worker提交)；

2、Worker的主要功能：

　　1）通过RegisterWorker注册到Master；

　　2）定时发送心跳给Master；

3）根据master发送的application配置进程环境，并启动StandaloneExecutorBackend

3、运行spark-shell：

　　1）ClientActor通过RegisterApplication注册到Master；

　　2）Master收到RegisterApplication后，通过scheduler方法进行调度，如有满足要求的Worker，则发送LaunchExecutor给相应的Worker；

Spark分析之Master、Worker以及Application三者之间如何建立连接的更多相关文章

Spark分析之Master
override def preStart() { logInfo("Starting Spark master at " + masterUrl) webUi.bind() // ...
java执行spark查询hbase的jar包出现错误提示：ob aborted due to stage failure: Master removed our application: FAILED
执行java调用scala 打包后的jar时候出现异常 /14 23:57:08 WARN TaskSchedulerImpl: Initial job has not accepted any re ...
spark的standlone模式安装和application 提交
spark的standlone模式安装安装一个standlone模式的spark集群,这里是最基本的安装,并测试一下如何进行任务提交. require:提前安装好jdk 1.7.0_80 :scal ...
[大数据从入门到放弃系列教程]第一个spark分析程序
[大数据从入门到放弃系列教程]第一个spark分析程序原文链接:http://www.cnblogs.com/blog5277/p/8580007.html 原文作者:博客园--曲高终和寡 **** ...
【原创】大叔问题定位分享（10）提交spark任务偶尔报错 org.apache.spark.SparkException: A master URL must be set in your configuration
spark 2.1.1 一问题重现问题代码示例 object MethodPositionTest { val sparkConf = new SparkConf().setAppName(&qu ...
使用Spark分析拉勾网招聘信息(一):准备工作
本系列专属github地址:https://github.com/ios122/spark_lagou 前言我觉得如果动笔,就应该努力地把要说的东西表达清楚.今后一段时间,尝试下系列博客文章.简单说 ...
Storm概念学习系列之Worker、Task、Executor三者之间的关系
不多说,直接上干货! Worker.Task.Executor三者之间的关系 Storm集群中的一个物理节点启动一个或者多个Worker进程,集群的Topology都是通过这些Worker进程运行的. ...
Spark分析之BlockManager
BlockManager中存储block的流程: doPut()方法入参:blockId, data, level, tellMaster 1)为block创建BlockInfo并加锁使其不能被 ...
虚拟机开发板 PC机三者之间不能ping通的各种原因分析
这个问题事实上也相对照较简单.可是非常多网友都给我发消息说遇到不能ping,每一个人都得回答一次确实显得心有余而力不足.如今我对遇到这几种问题给出最完整的解决方式. (说实话基本上也仅仅要这几种可能 ...

随机推荐

html5、canval 对图片的压缩
let src = this.cropper.getCroppedCanvas().toDataURL('image/jpeg');let can = document.createElement(' ...
cobbler网络装机
cobbler网络装机原理分析 cobbler简介 Cobbler通过将设置和管理一个安装服务器所涉及的任务集中在一起,从而简化了系统配置.相当于Cobbler封装了DHCP.TFTP.XINTED ...
Linux shell —— 数组与关联数组
使用 declare -A(declare 的用法请使用 help 进行查看,help declare) 进行声明关联数组变量: $ declare -A fruits_price $ fruits_ ...
exit和return
函数名: exit() 所在头文件:stdlib.h(如果是”VC6.0“的话头文件为:windows.h) 功能: 关闭所有文件,终止正在执行的进程. exit(1)表示异常退出.这个1是返回给操 ...
CodeForces - 1093D：Beautiful Graph（二分图判定+方案数）
题意:给定无向图,让你给点加权(1,2,3),使得每条边是两端点点权和维奇数. 思路:一个连通块是个二分图,判定二分图可以dfs,并查集,2-sat染色. 这里用的并查集(还可以带权并查集优化一下,或 ...
poj-1112 (二分图染色+dp分组)
#include <iostream> #include <algorithm> #include <cstring> using namespace std; ; ...
虚拟机lamp环境下，Apache配置虚拟主机
1.在Apache配置文件中开启虚拟主机功能:即:Include etc//extra/httpd-vhosts.conf把前面的#去掉: 2.在extra目录下找到文件httpd-vhosts.co ...
prisma 服务器端订阅试用
graphql 协议是支持数据的实时订阅功能的(一般基于websocket 进行实现) prisma 支持客户端订阅以及服务器端订阅(类似webhook),可以方便将数据推送后端服务目的 pr ...
序列化效率比拼——谁是最后的赢家avaScriptSerializer方式、DataContract方式、Newtonsoft.Json
前言:作为开发人员,对象的序列化恐怕难以避免.楼主也是很早以前就接触过序列化,可是理解都不太深刻,对于用哪种方式去做序列化更是随波逐流——项目中原来用的什么方式照着用就好了.可是这么多年自己对于这东西 ...
python、java大作战，python测试dubbo接口
很多小伙伴都反映公司要求测dubbo(dubbo是一个java的分布式开源框架)接口,不会写java代码,怎么测,能不能用python来调dubbo接口.当然是可以的了,最近研究了一下,很简单,分享给 ...

Spark分析之Master、Worker以及Application三者之间如何建立连接

Spark分析之Master、Worker以及Application三者之间如何建立连接的更多相关文章

随机推荐

热门专题