今天抽空回顾了一下Spark相关的源码，本来想要了解一下Block的管理机制，但是看着看着就回到了SparkContext的创建与使用。正好之前没有正式的整理过这部分的内容，这次就顺带着回顾一下。

Spark作为目前最流行的大数据计算框架，已经发展了几个年头了。版本也从我刚接触的1.6升级到了2.2.1。由于目前工作使用的是2.2.0，所以这次的分析也就从2.2.0版本入手了。

涉及的内容主要有：

Standalone模式中的Master与Worker
client、driver、excutor的关系

下面就按照顺序依次介绍一下。

Master与Worker

在最开始编程的时候，很少会涉及分布式，因为数据量也不大。后来随着硬件的发展cpu的瓶颈，开始流行多线程编程，基于多线程来加快处理速度；再后来，衍生出了网格计算、CPU与GPU的异构并行计算以及当时流行的mapreduce分布式计算。但是mapreduce由于存储以及计算流程的限制，spark开始流行起来。Spark凭借内存计算、强大的DAG回溯能力，快速的占领并行计算的风口。

那么并行计算肯定是需要分布式集群的，常见的集群管理方式，有Master-Slave模式、P2P模式等等。

比如Mysql的主从复制，就是Master-Slave模式；Elasticsearch的分片管理就是P2P模式。在Spark中有不同的部署方式，但是计算的模式都是Master-Slave模式，只不过Slave换了名字叫做worker而已。集群的部署模式如下所示：

流程就是用户以client的身份向master提交任务，master去worker上面创建执行任务的载体（driver和excutor）。

client、driver、excutor的关系

Master和Worker是服务器的部署角色，程序从执行上，则分成了client、driver、excutor三种角色。按照模式的不同，client和driver可能是同一个。以2.2.0版本的standalone模式来说，他们三个是独立的角色。client用于提交程序，初始化一些环境变量；driver用于生成task并追踪管理task的运行；excutor负责最终task的执行。

源码探索

总的流程可以总结为下面的一张图：

通过查看源码，来看一下

1 SparkContext创建调度器

在创建SparkContext的时候会创建几个核心的模块：

DAGScheduler 面向job的调度器
TaskScheduler 不同的集群模式，有不同的实现方式，如standalone下的taskschedulerImpl
SchedulerBackend 不同的集群模式下，有不同的实现方式，如standalone下的StandaloneSchedulerBackend.负责向master发起注册

// 创建并启动调度器

val (sched, ts) = SparkContext.createTaskScheduler(this, master, deployMode)

_schedulerBackend = sched

_taskScheduler = ts

_dagScheduler = new DAGScheduler(this)

...

// 启动调度器

_taskScheduler.start()

在createTaskSchduler中，根据master的不同，选择不同的实现方式，主要是在backend的实现上有差异：

master match {

      case "local" =>

        ...

      case LOCAL_N_REGEX(threads) =>

        ...

      case LOCAL_N_FAILURES_REGEX(threads, maxFailures) =>

        ...

      case SPARK_REGEX(sparkUrl) =>

        // 创建调度器

        val scheduler = new TaskSchedulerImpl(sc)

        val masterUrls = sparkUrl.split(",").map("spark://" + _)

        // 创建backend

        val backend = new StandaloneSchedulerBackend(scheduler, sc, masterUrls)

        // 把backend注入到schduler中

        scheduler.initialize(backend)

        (backend, scheduler)

      case LOCAL_CLUSTER_REGEX(numSlaves, coresPerSlave, memoryPerSlave) =>

        ...

      case masterUrl =>

        ...

    }

我们这里只看一下standalone模式的创建，就是创建了TaskSchedulerImpl和StandaloneSchedulerBackend的对象，另外初始化了调度器，根据配置选择调度模式，默认是FIFO:

def initialize(backend: SchedulerBackend) {

    this.backend = backend

    schedulableBuilder = {

      schedulingMode match {

        case SchedulingMode.FIFO =>

          new FIFOSchedulableBuilder(rootPool)

        case SchedulingMode.FAIR =>

          new FairSchedulableBuilder(rootPool, conf)

        case _ =>

          throw new IllegalArgumentException(s"Unsupported $SCHEDULER_MODE_PROPERTY: " +

          s"$schedulingMode")

      }

    }

    schedulableBuilder.buildPools()

  }

2 TaskSchedulerImpl执行start方法

其实是执行了backend的start()方法

override def start() {

    backend.start()

    ...

  }

3 StandaloneSchedulerBackend执行start方法

这部分代码比较多，可以简化的看：

封装command对象
封装appDesc对象
创建StandaloneAppClient对象
执行start()方法

其中command中包含的那个类，就是excutor的实现类。

override def start() {

    //初始化参数

    ...

    val command = Command("org.apache.spark.executor.CoarseGrainedExecutorBackend",

      args, sc.executorEnvs, classPathEntries ++ testingClassPath, libraryPathEntries, javaOpts)

   ...

    val appDesc = ApplicationDescription(sc.appName, maxCores, sc.executorMemory, command,

      webUrl, sc.eventLogDir, sc.eventLogCodec, coresPerExecutor, initialExecutorLimit)

    // 注意前面创建了一大堆的配置对象，主要就是那个class等信息

	client = new StandaloneAppClient(sc.env.rpcEnv, masters, appDesc, this, conf)

    client.start()

    ...

  }

4 发起注册

核心的代码在StanaloneAppClient中，并在start()方法中启动了一个rpc的服务——ClientEndpoint

override def onStart(): Unit = {

  try {

    registerWithMaster(1)//发起注册

  } catch {

    ...

  }

}

registerWithMaster采用了异步发送请求连接master，只要有一个注册成功，其他的都会cancel。这里有时间可以做个小hello world玩玩看。

private def registerWithMaster(nthRetry: Int) {

  registerMasterFutures.set(tryRegisterAllMasters())

  registrationRetryTimer.set(registrationRetryThread.schedule(new Runnable {

    override def run(): Unit = {

      if (registered.get) {

        registerMasterFutures.get.foreach(_.cancel(true))

        registerMasterThreadPool.shutdownNow()

      } else if (nthRetry >= REGISTRATION_RETRIES) {

        markDead("All masters are unresponsive! Giving up.")

      } else {

        registerMasterFutures.get.foreach(_.cancel(true))

        registerWithMaster(nthRetry + 1)

      }

    }

  }, REGISTRATION_TIMEOUT_SECONDS, TimeUnit.SECONDS))

}

//发起注册

private def tryRegisterAllMasters(): Array[JFuture[_]] = {

  ...

  masterRef.send(RegisterApplication(appDescription, self))

  ...

}

5 Master接收到请求执行schedule方法

Master是一个常驻的进程，时刻监听别人发过来的消息。刚才client发送了一个RegisterApplication消息，忽略前面创建app的内容，直接执行了schedule方法:

case RegisterApplication(description, driver) =>

   // TODO Prevent repeated registrations from some driver

   if (state == RecoveryState.STANDBY) {

     // ignore, don't send response

   } else {

     ...

     schedule()

   }

6 Master发送launchDriver

发送lanunchDriver请求

private def schedule(): Unit = {

  ...

  for (driver <- waitingDrivers.toList) { // iterate over a copy of waitingDrivers

    ...

    while (numWorkersVisited < numWorkersAlive && !launched) {

      ...

      if (worker.memoryFree >= driver.desc.mem && worker.coresFree >= driver.desc.cores) {

        launchDriver(worker, driver)

        ...

      }

      ...

    }

  }

  startExecutorsOnWorkers()

}

//向worker发送launchDriver请求

private def launchDriver(worker: WorkerInfo, driver: DriverInfo) {

  ...

  worker.endpoint.send(LaunchDriver(driver.id, driver.desc))

  ...

}

7 Worker创建DriverRunner

case LaunchDriver(driverId, driverDesc) =>

      logInfo(s"Asked to launch driver $driverId")

      val driver = new DriverRunner(

        conf,

        driverId,

        workDir,

        sparkHome,

        driverDesc.copy(command = Worker.maybeUpdateSSLSettings(driverDesc.command, conf)),

        self,

        workerUri,

        securityMgr)

      drivers(driverId) = driver

      driver.start()

      coresUsed += driverDesc.cores

      memoryUsed += driverDesc.mem

8 Master发送launchExcutor

第6步中最后有一个startExecutorsOnWorkers方法。

private def startExecutorsOnWorkers(): Unit = {

...

  for (app <- waitingApps if app.coresLeft > 0) {

    ...

    for (pos <- 0 until usableWorkers.length if assignedCores(pos) > 0) {

      allocateWorkerResourceToExecutors(

        app, assignedCores(pos), coresPerExecutor, usableWorkers(pos))

    }

  }

}

private def allocateWorkerResourceToExecutors(

   app: ApplicationInfo,

   assignedCores: Int,

   coresPerExecutor: Option[Int],

   worker: WorkerInfo): Unit = {

 ...

 for (i <- 1 to numExecutors) {

   ...

   launchExecutor(worker, exec)

   ...

 }

}

private def launchExecutor(worker: WorkerInfo, exec: ExecutorDesc): Unit = {

  ...

  worker.endpoint.send(LaunchExecutor(masterUrl,

    exec.application.id, exec.id, exec.application.desc, exec.cores, exec.memory))

  ...

}

9 Worker创建ExcutorRunner

case LaunchExecutor(masterUrl, appId, execId, appDesc, cores_, memory_) =>

if (masterUrl != activeMasterUrl) {

  ...

} else {

  try {

    ...

    val manager = new ExecutorRunner(

      appId,

      execId,

      appDesc.copy(command = Worker.maybeUpdateSSLSettings(appDesc.command, conf)),

      cores_,

      memory_,

      self,

      workerId,

      host,

      webUi.boundPort,

      publicAddress,

      sparkHome,

      executorDir,

      workerUri,

      conf,

      appLocalDirs, ExecutorState.RUNNING)

    ...

  } catch {

...

  }

}

至此，Driver和Excutor就启动起来了.....

之后代码是怎么运行的，就且听下回分解把！

参考

SparkContext http://www.cnblogs.com/jcchoiling/p/6427406.html
spark worker解密：http://www.cnblogs.com/jcchoiling/p/6433196.html
2.2.0源码
《Spark内核机制及性能调优》· 王家林

Spark源码分析之 Driver和Excutor是怎么跑起来的?(2.2.0版本)的更多相关文章

spark 源码分析之十八 -- Spark存储体系剖析
本篇文章主要剖析BlockManager相关的类以及总结Spark底层存储体系. 总述先看 BlockManager相关类之间的关系如下: 我们从NettyRpcEnv 开始,做一下简单说明. Ne ...
spark源码分析以及优化
第一章.spark源码分析之RDD四种依赖关系一.RDD四种依赖关系 RDD四种依赖关系,分别是 ShuffleDependency.PrunDependency.RangeDependency和O ...
Spark源码分析（三）-TaskScheduler创建
原创文章,转载请注明: 转载自http://www.cnblogs.com/tovin/p/3879151.html 在SparkContext创建过程中会调用createTaskScheduler函 ...
【转】Spark源码分析之-deploy模块
原文地址:http://jerryshao.me/architecture/2013/04/30/Spark%E6%BA%90%E7%A0%81%E5%88%86%E6%9E%90%E4%B9%8B- ...
Spark源码分析：多种部署方式之间的区别与联系（转）
原文链接:Spark源码分析:多种部署方式之间的区别与联系(1) 从官方的文档我们可以知道,Spark的部署方式有很多种:local.Standalone.Mesos.YARN.....不同部署方式的 ...
Spark 源码分析 -- task实际执行过程
Spark源码分析 – SparkContext 中的例子, 只分析到sc.runJob 那么最终是怎么执行的? 通过DAGScheduler切分成Stage, 封装成taskset, 提交给Task ...
Spark源码分析 – BlockManager
参考, Spark源码分析之-Storage模块对于storage, 为何Spark需要storage模块?为了cache RDD Spark的特点就是可以将RDD cache在memory或dis ...
Spark源码分析 – SchedulerBackend
SchedulerBackend, 两个任务, 申请资源和task执行和管理对于SparkDeploySchedulerBackend, 基于actor模式, 主要就是启动和管理两个actor De ...
Spark源码分析 – Deploy
参考, Spark源码分析之-deploy模块 Client Client在SparkDeploySchedulerBackend被start的时候, 被创建, 代表一个application和s ...

随机推荐

TensorBoard 使用和问题解决
TensorBoard 使用和问题解决一.启动TensorBoard 1) python tensorflow/tensorboard/tensorboard.py --logdir=path/to ...
js二级事件模型的处理细节
一.纠正网络上的一个误传--“IE不支持事件捕获” 可以在浏览器中运行上面demo,在各主流浏览器中,鼠标移上都可以分别触发捕获与冒泡事件的监听函数,所以IE也是支持事件捕获的,连IE6都支持,只是在 ...
Java----list常用方法汇总
package ListTest; import java.util.ArrayList; import java.util.Iterator ; import java.util.List; /** ...
gtk+3.0的环境配置及基于gtk+3.0的python简单样例
/********************************************************************* * Author : Samson * Date ...
把握linux内核设计思想（十三）：内存管理之进程地址空间
[版权声明:尊重原创,转载请保留出处:blog.csdn.net/shallnet.文章仅供学习交流,请勿用于商业用途] 进程地址空间由进程可寻址的虚拟内存组成,Linux 的虚拟地址空间为0~4G字 ...
JAVA入门[7]-Mybatis generator(MBG)自动生成mybatis代码
一.新建测试项目新建Maven项目MybatisDemo2,修改pom.xml引入依赖.dependencies在上节基础上新增 <dependency> <groupId> ...
MyBatis_CURD
一.项目结构二.代码实现 package com.jmu.bean; public class Student { private Integer id; private String name; ...
AJAX扩展-POST传递参数并跳转页面
拓展的代码: 这段代码的原理是创建一个表单,所有args都创建一个隐藏的input,用post方法把这些参数传递过去注意form表单一定要加载到页面中,即下面代码中标红的部分,不然参数是无法被传递的 ...
jdk动态代理举例
JDK动态代理是基于接口的代理,下面举例说明代理类:proxy,代理动作必须要基于一个proxy实例来执行代理执行类:实现InvocationHandler,案例中是TestInvocationH ...
53、css补充
css其余问题补充一.默认的高度和宽度问题 1.父子都是块级元素 <!DOCTYPE html> <html> <head> <title>...&l ...

Spark源码分析 之 Driver和Excutor是怎么跑起来的?(2.2.0版本)