Spark启动流程（Standalone）- master源码

Master源码

 package org.apache.spark.deploy.master

 //伴生类

 private[deploy] class Master(

                                 override val rpcEnv: RpcEnv,

                                 address: RpcAddress,

                                 webUiPort: Int,

                                 val securityMgr: SecurityManager,

                                 val conf: SparkConf)

     extends ThreadSafeRpcEndpoint with Logging with LeaderElectable

 {

 ...

 }

 //伴生对象

 private[deploy] object Master extends Logging{

     val SYSTEM_NAME = "sparkMaster"

     val ENDPOINT_NAME = "Master"

     // 启动 Master 的入口函数

     def main(argStrings: Array[String]) {

         Utils.initDaemon(log)

         val conf = new SparkConf

         // 构建用于参数解析的实例

         //--host hadoop201 --port 7077 --webui-port 8080

         val args = new MasterArguments(argStrings, conf)

         // 启动 RPC 通信环境和 MasterEndPoint(通信终端)

        //<<1>>

         val (rpcEnv, _, _): (RpcEnv, Int, Option[Int]) = startRpcEnvAndEndpoint(args.host, args.port, args.webUiPort, conf)

         rpcEnv.awaitTermination()

     }

    ...

 }

<< 1 >>、启动Mater返回一个三元组

     /**

       * Start the Master and return a three tuple of:

       * 启动 Master, 并返回一个三元组

       * (1) The Master RpcEnv

       * (2) The web UI bound port

       * (3) The REST server bound port, if any

       */

     def startRpcEnvAndEndpoint(

                                   host: String,

                                   port: Int,

                                   webUiPort: Int,

                                   conf: SparkConf): (RpcEnv, Int, Option[Int]) = {

         val securityMgr = new SecurityManager(conf)

         // 创建 Master 端的 RpcEnv 环境, 并启动 RpcEnv

         // 参数: sparkMaster hadoop201 7077 conf securityMgr

         // 返回值  的实际类型是: NettyRpcEnv

         //<< 1.1 >>

         val rpcEnv: RpcEnv = RpcEnv.create(SYSTEM_NAME, host, port, conf, securityMgr)

         // 创建 Master对象, 该对象就是一个 RpcEndpoint, 在 RpcEnv 中注册这个 RpcEndpoint

         // 返回该 RpcEndpoint 的引用, 使用该引用来接收信息和发送信息

         //<< 1.2 >>

         val masterEndpoint: RpcEndpointRef = rpcEnv.setupEndpoint(ENDPOINT_NAME,

             new Master(rpcEnv, rpcEnv.address, webUiPort, securityMgr, conf))

         // 向 Master 的通信终端发法请求，获取 BoundPortsResponse 对象

         // BoundPortsResponse 是一个样例类包含三个属性: rpcEndpointPort webUIPort restPort

         val portsResponse: BoundPortsResponse = masterEndpoint.askWithRetry[BoundPortsResponse](BoundPortsRequest)

         (rpcEnv, portsResponse.webUIPort, portsResponse.restPort)

     }

<< 1.1 >> RpcEnv的创建

 def create(

               name: String,

               bindAddress: String,

               advertiseAddress: String,

               port: Int,

               conf: SparkConf,

               securityManager: SecurityManager,

               clientMode: Boolean): RpcEnv = {

     // 保存 RpcEnv 的配置信息

     val config = RpcEnvConfig(conf, name, bindAddress, advertiseAddress, port, securityManager,

         clientMode)

     // 创建 NettyRpcEvn

     //<< 1.1.1 >>

     new NettyRpcEnvFactory().create(config)

 }

真正的创建是调用NettyRpcEnvFactory 的 create 方法创建

创建NettyRpcEnv的时候，会创建消息分发器，收件箱和存储远程地址与发件箱的Map

RpcEnv.scala

<< 1.1.1 >> NettyRpcEnvFactory （ NettyRpcEnv .scala）

 private[rpc] class NettyRpcEnvFactory extends RpcEnvFactory with Logging {

     /*

     创建 NettyRpcEnv, 并且启动为后台程序

      */

     def create(config: RpcEnvConfig): RpcEnv = {

         val sparkConf: SparkConf = config.conf

         // Use JavaSerializerInstance in multiple threads is safe. However, if we plan to support

         // KryoSerializer in future, we have to use ThreadLocal to store SerializerInstance

         // 用于 Rpc传输对象时的序列化

         val javaSerializerInstance: JavaSerializerInstance = new JavaSerializer(sparkConf)

             .newInstance()

             .asInstanceOf[JavaSerializerInstance]

         // 实例化 NettyRpcEnv

         val nettyEnv = new NettyRpcEnv(

             sparkConf,

             javaSerializerInstance,

             config.advertiseAddress,

             config.securityManager)

         if (!config.clientMode) {

             // 定义 NettyRpcEnv 的启动函数

             val startNettyRpcEnv: Int => (NettyRpcEnv, Int) = { actualPort =>

                 nettyEnv.startServer(config.bindAddress, actualPort)

                 (nettyEnv, nettyEnv.address.port)

             }

             try {

                 // 启动 NettyRpcEnv

                 Utils.startServiceOnPort(config.port, startNettyRpcEnv, sparkConf, config.name)._1

             } catch {

                 case NonFatal(e) =>

                     nettyEnv.shutdown()

                     throw e

             }

         }

         nettyEnv

     }

 }

<< 1.2 >> Master伴生类(Master 端的 RpcEndpoint 启动)

Master是一个RpcEndpoint.

他的生命周期方法是: constructor -> onStart -> receive* -> onStop

onStart 主要代码片段

  // 创建 WebUI 服务器

  webUi = new MasterWebUI(this, webUiPort)

 // 按照固定的频率去启动线程来检查 Worker 是否超时. 其实就是给自己发信息: CheckForWorkerTimeOut

 // 默认是每分钟检查一次.

  checkForWorkerTimeOutTask = forwardMessageThread.scheduleAtFixedRate(new Runnable {

     override def run(): Unit = Utils.tryLogNonFatalError {

 // 在 receive 方法中对 CheckForWorkerTimeOut 进行处理

        //<< 1.2.1 >>

         self.send(CheckForWorkerTimeOut)

     }

 }, 0, WORKER_TIMEOUT_MS, TimeUnit.MILLISECONDS)

 private val WORKER_TIMEOUT_MS = conf.getLong("spark.worker.timeout", 60) * 1000

<< 1.2.1 >> 检查并移除超时的worker

    /** Check for, and remove, any timed-out workers */

     private def timeOutDeadWorkers() {

         // Copy the workers into an array so we don't modify the hashset while iterating through it

         val currentTime = System.currentTimeMillis()

         //  把超时的 Worker 从 workers 中移除

 //过滤出来要移除的worker：（上次心跳时间 小于 当前时间 减去 超时时间 ）即为超时

         val toRemove = workers.filter(_.lastHeartbeat < currentTime - WORKER_TIMEOUT_MS).toArray

         for (worker <- toRemove) {

             // 如果 worker 的状态不是 DEAD

             if (worker.state != WorkerState.DEAD) {

                 logWarning("Removing %s because we got no heartbeat in %d seconds".format(

                     worker.id, WORKER_TIMEOUT_MS / 1000))

                 removeWorker(worker) //

             } else {

                 if (worker.lastHeartbeat < currentTime - ((REAPER_ITERATIONS + 1) * WORKER_TIMEOUT_MS)) {

                     workers -= worker // we've seen this DEAD worker in the UI, etc. for long enough; cull it

                 }

             }

         }

     }

Spark启动流程（Standalone）- master源码的更多相关文章

Phalcon的Mvc结构及启动流程（部分源码分析）
Phalcon本身有支持创建多种形式的Web应用项目以应对不同场景,包括迷你应用.单模块标准应用.以及较复杂的多模块应用创建项目 Phalcon环境配置安装后,可以通过命令行生成一个标准的Phalc ...
Phalcon Framework的Mvc结构及启动流程（部分源码分析）
创建项目 Phalcon环境配置安装后,可以通过命令行生成一个标准的Phalcon多模块应用 phalcon project eva --type modules入口文件为public/index.p ...
《深入理解Spark：核心思想与源码分析》——SparkContext的初始化（叔篇）——TaskScheduler的启动
<深入理解Spark:核心思想与源码分析>一书前言的内容请看链接<深入理解SPARK:核心思想与源码分析>一书正式出版上市 <深入理解Spark:核心思想与源码分析> ...
【原】Spark中Master源码分析（二）
继续上一篇的内容.上一篇的内容为: Spark中Master源码分析(一) http://www.cnblogs.com/yourarebest/p/5312965.html 4.receive方法, ...
《深入理解Spark：核心思想与源码分析》（第2章）
<深入理解Spark:核心思想与源码分析>一书前言的内容请看链接<深入理解SPARK:核心思想与源码分析>一书正式出版上市 <深入理解Spark:核心思想与源码分析> ...
《深入理解Spark：核心思想与源码分析》（前言及第1章）
自己牺牲了7个月的周末和下班空闲时间,通过研究Spark源码和原理,总结整理的<深入理解Spark:核心思想与源码分析>一书现在已经正式出版上市,目前亚马逊.京东.当当.天猫等网站均有销售 ...
Spark之SQL解析（源码阅读十）
如何能更好的运用与监控sparkSQL?或许我们改更深层次的了解它深层次的原理是什么.之前总结的已经写了传统数据库与Spark的sql解析之间的差别.那么我们下来直切主题~ 如今的Spark已经支持多 ...
《深入理解Spark：核心思想与源码分析》一书正式出版上市
自己牺牲了7个月的周末和下班空闲时间,通过研究Spark源码和原理,总结整理的<深入理解Spark:核心思想与源码分析>一书现在已经正式出版上市,目前亚马逊.京东.当当.天猫等网站均有销售 ...
《深入理解Spark：核心思想与源码分析》正式出版上市
自己牺牲了7个月的周末和下班空闲时间,通过研究Spark源码和原理,总结整理的<深入理解Spark:核心思想与源码分析>一书现在已经正式出版上市,目前亚马逊.京东.当当.天猫等网站均有销售 ...

随机推荐

HDU-4289-Control(最大流最小割,拆点)
链接: https://vjudge.net/problem/HDU-4289 题意: You, the head of Department of Security, recently receiv ...
【NOIP2016提高A组模拟9.17】小a的强迫症
题目分析题目要求第i种颜色的最后一个珠子要在第i+1种颜色的最后一个珠子之前, 那么我们从小到大枚举做到第i种,把第i种的最后一颗珠子取出,将剩下的\(num(i)-1\)个珠子插入已排好的前i- ...
react项目导出数据怎么做？
做项目遇到导出数据,搜索了一个插件,简直太好用,几行代码就可以搞定. 插件是react-csv, 了解详细介绍大家可以去https://www.npmjs.com/package/react-csv
springboot 集成apollo，根据不同环境加载配置
ModelSerializer 使用知识点_serializers.SerializerMethodField()使用场景总结
serializers.SerializerMethodField和钩子方法结合,可以实现对ModelSerializer类的一些字段进行二次加工,返回,如下:1.对以ModelSerializer的 ...
（45）FreeRTOS学习之二
一:架构概述 FreeRTOS是一个相对较小的应用程序.最小化的FreeRTOS内核仅包括3个(.c)文件和少数头文件,总共不到9000行代码,还包括了注释和空行.一个典型的编译后(二进制)代码映像小 ...
取值函数（getter）和存值函数（setter）
todo get和set关键字
配置 Hive On Tez
配置 Hive On Tez 标签(空格分隔): hive Tez 部署底层应用简单介绍介绍:tez 是基于hive 之上,可以将sql翻译解析成DAG计算的引擎.基于DAG 与mr 架构本身的优 ...
MVC的一个简单实例
基本思路: 一个Regist.jsp注册页面,用于收集用户信息,发送请求给控制器Servlet:控制器层Servlet封装模型层对象 jBean,并调用其方法regiser实现用户信息的保存:模型层J ...
ffmpeg保持原视频画面比例自动添加黑边
ffmpeg保持原视频画面比例自动添加黑边例如源是1280*528要转成640*480要保持画面比例实际上应该640*264 所以需要在上下都加黑边 ffmpeg -i d:/Media/e.f4 ...

Spark启动流程（Standalone）- master源码

Spark启动流程（Standalone）- master源码的更多相关文章

随机推荐

热门专题