Spark分析之TaskScheduler

TaskScheduler概述：

TaskScheduler是一个可插拔任务调度接口，通过不同的SchedulerBackend进行任务的调度。主要功能如下：

1、一个TaskScheduler只为一个SparkContext服务，接收DAGScheduler提交过来的一组组的TaskSet；

2、TaskScheduler将task提交到集群中并执行，如果其中某个Task执行失败则重试之；TaskScheduler将TaskSet对应的执行结果返回才DAGScheduler；

3、TaskScheduler处理straggle任务（比如：100个任务运行，其中99个任务快，1个任务慢，需要在另外一个节点上开启一个相同的任务来运行，谁先完成取用谁）；

4、遇到shuffle输出丢失则汇报给DAGScheduler；

5、为每个TaskSet维护一个TaskSetManager追踪本地性(resourceOffer-->findTask)及错误信息；

TaskSet.scala

private[spark] class TaskSet(

    val tasks: Array[Task[_]],

    val stageId: Int, //该TaskSet对应哪个stage

    val attempt: Int,

    val priority: Int,

    val properties: Properties) {

    val id: String = stageId + "." + attempt

}

Task分析：

1、Task是Executor中的执行单元；不像MR中，这里并没有map/reduce任务；

2、Task处理数据常见的两个来源：外部存储以及shuffle数据；

3、Task可以运行在集群中的任意一个节点上（最差的情况就是集群节点之间数据的传输）；

4、Task可以使用缓存但是已经被置换出来的数据；

5、为了容错，会将shuffle输出写到磁盘或者内存中；

Spark中有两种Task：

1、ShuffleMapTASK：输出的数据作为后续操作的来源

　　A ShuffleMapTask divides the elements of an RDD into multiple buckets (based on a partitioner)；

2、ResultTask：输出的是结果

　　A task that sends back the output to the driver application.

源码执行流程：TaskSchedulerImpl.scala

override def submitTasks(taskSet: TaskSet) {

    val tasks = taskSet.tasks

    logInfo("Adding task set " + taskSet.id + " with " + tasks.length + " tasks")

    this.synchronized {

    val manager = new TaskSetManager(this, taskSet, maxTaskFailures) //每个taskset被封装成一个TaskSetManager

    activeTaskSets(taskSet.id) = manager

    schedulableBuilder.addTaskSetManager(manager, manager.taskSet.properties) //将tasksetmanager添加到调度器中，FIFO/Fair

    ......

    hasReceivedTask = true

    }

    backend.reviveOffers()   //请求资源执行task，backend是SchedulerBackend，向DriverActor发送ReviveOffers的请求

}

CoarseGrainedSchedulerBackend.scala

override def reviveOffers() {

    driverActor ! ReviveOffers

}

case ReviveOffers =>

    makeOffers()

def makeOffers() { //启动tasks

      launchTasks(scheduler.resourceOffers(

        executorHost.toArray.map {case (id, host) => new WorkerOffer(id, host, freeCores(id))}))

}

TaskSchedulerImpl.scala
//从FIFO或者Fair调度器哪里获得拍戏后的TaskSetManager

def resourceOffers(offers: Seq[WorkerOffer]): Seq[Seq[TaskDescription]] = synchronized {

    SparkEnv.set(sc.env)

    .....

    // Randomly shuffle offers to avoid always placing tasks on the same set of workers.

    val shuffledOffers = Random.shuffle(offers)

    // Build a list of tasks to assign to each worker.

    val tasks = shuffledOffers.map(o => new ArrayBuffer[TaskDescription](o.cores))

    val availableCpus = shuffledOffers.map(o => o.cores).toArray

    val sortedTaskSets = rootPool.getSortedTaskSetQueue

    // Take each TaskSet in our scheduling order, and then offer it each node in increasing order

    // of locality levels so that it gets a chance to launch local tasks on all of them.

    var launchedTask = false

    for (taskSet <- sortedTaskSets; maxLocality <- TaskLocality.values) {

      do {

        launchedTask = false

        for (i <- 0 until shuffledOffers.size) {

          val execId = shuffledOffers(i).executorId

          val host = shuffledOffers(i).host

          if (availableCpus(i) >= CPUS_PER_TASK) {

            for (task <- taskSet.resourceOffer(execId, host, maxLocality)) { //考虑locality等因素来确定task的信息

              ...

              launchedTask = true

            }

          }

        }

      } while (launchedTask)

    }

    if (tasks.size > 0) {

      hasLaunchedTask = true

    }

    return tasks

}

TaskSetManager.scala

// Respond to an offer of a single executor from the scheduler by finding a task

resourceOffer{

    findTask(execId, host, allowedLocality) match { //找到合适的可本地性的任务

        ......

    }

}

CoarseGrainedSchedulerBackend.scala

 // Launch tasks returned by a set of resource offers

def launchTasks(tasks: Seq[Seq[TaskDescription]]) {

      for (task <- tasks.flatten) {
　　　　　　val serializedTask = ser.serialize(task) //序列化每个task
　　　　　　if (serializedTask.limit >= akkaFrameSize - AkkaUtils.reservedSizeBytes) { //task序列化后的大小超过指定的大小就中断执行
       　　　　taskSet.abort(msg)
　　　　　　}else{
　　　　　　　　//向CoarseGrainedExecutorBackend发送启动任务的请    　　　　　　
             executorActor(task.executorId) ! LaunchTask(new SerializableBuffer(serializedTask)
　　
　　　　}

      }

}

CoarseGrainedExecutorBackend.scala

case LaunchTask(data) =>
　　 if(executor == null){}  //一个 CoarseGrainedExecutorBackend 进程有且仅有一个executor对象。

    val taskDesc = ser.deserialize[TaskDescription](data.value)   //执行之前需要反序列化，因为在提交任务时将任务做的序列化操作

    executor.launchTask(this, taskDesc.taskId, taskDesc.serializedTask)

}

Executor.scala

val threadPool = Utils.newDaemonCachedThreadPool("Executor task launch worker")

def launchTask(context: ExecutorBackend, taskId: Long, serializedTask: ByteBuffer) {

    val tr = new TaskRunner(context, taskId, serializedTask) //serializedTask：任务都是需要序列化的

    runningTasks.put(taskId, tr)

    threadPool.execute(tr)   //提交到executor执行

}

Spark分析之TaskScheduler的更多相关文章

使用Spark分析拉勾网招聘信息(一):准备工作
本系列专属github地址:https://github.com/ios122/spark_lagou 前言我觉得如果动笔,就应该努力地把要说的东西表达清楚.今后一段时间,尝试下系列博客文章.简单说 ...
[大数据从入门到放弃系列教程]第一个spark分析程序
[大数据从入门到放弃系列教程]第一个spark分析程序原文链接:http://www.cnblogs.com/blog5277/p/8580007.html 原文作者:博客园--曲高终和寡 **** ...
Spark Scheduler模块源码分析之TaskScheduler和SchedulerBackend
本文是Scheduler模块源码分析的第二篇,第一篇Spark Scheduler模块源码分析之DAGScheduler主要分析了DAGScheduler.本文接下来结合Spark-1.6.0的源码继 ...
Spark Core Runtime分析: DAGScheduler, TaskScheduler, SchedulerBackend
Spark Runtime里的主要层次分析,梳理Runtime组件和运行流程, DAGScheduler Job=多个stage,Stage=多个同种task, Task分为ShuffleMapTas ...
spark 源码分析之四 -- TaskScheduler的创建和启动过程
在 spark 源码分析之二 -- SparkContext 的初始化过程中,第 14 步和 16 步分别描述了 TaskScheduler的初始化和启动过程. 话分两头,先说 TaskSc ...
Spark分析之Job Scheduling Process
经过前面文章的SparkContext.DAGScheduler.TaskScheduler分析,再从总体上了解Spark Job的调度流程 1.SparkContext将job的RDD DAG图提交 ...
Spark分析之SparkContext启动过程分析
SparkContext作为整个Spark的入口,不管是spark.sparkstreaming.spark sql都需要首先创建一个SparkContext对象,然后基于这个SparkContext ...
Spark分析之DAGScheduler
DAGScheduler概述:是一个面向Stage层面的调度器: 主要入参有: dagScheduler.runJob(rdd, cleanedFunc, partitions, callSite, ...
使用Spark分析拉勾网招聘信息(四): 几个常用的脚本与图片分析结果
概述前一篇文章,已经介绍了BMR的基础用法,再结合Spark和Scala的文档,我想应该是可以开始你的数据分析之路的.这一篇文章,着重进行一些简单的思路上的引导和分析.如果你分析招聘数据时,卡在了某 ...

随机推荐

Git内网服务搭建全过程
看到一篇搭建git服务器的文章,主要是公司内网搭建的,讲得非常详细,比廖雪峰的要完整,必须赞! http://developer.51cto.com/art/201507/483448.htm
C# 构建S7服务器西门子的虚拟服务器测试通讯 HslCommunication应用
本文将使用一个gitHub开源的组件技术来实现S7服务器的功能,使用的是基于以太网的TCP/IP实现,不需要额外的组件 github地址:https://github.com/dathlin/HslC ...
小程序和ThinkPHP5结合实现登录状态（含代码）
本篇文章给大家带来的内容是关于小程序和ThinkPHP5结合实现登录状态(附代码),有一定的参考价值,有需要的朋友可以参考一下,希望对你有所帮助. 微信小程序中,一般会涉及三种登录方式: 1. 使用微 ...
android复制包需要修改的几个地方
1.要看什么情况,若是在同一个eclipse下,那么就需要修改包名.若不在的话,那就可以不用了. 2.这个app_name也是一样. 3.先说下情况,这是我修改好的.原本这个R的是引之前包的,必须要改 ...
Springboot整合pagehelper分页
一.在pom中添加依赖 <dependency> <groupId>com.github.pagehelper</groupId> <artifactId&g ...
HDU 2544：最短路
最短路 Time Limit: 5000/1000 MS (Java/Others) Memory Limit: 32768/32768 K (Java/Others)Total Submiss ...
NASSA’s Robot
NASSA的机器人降落到了火星,降落的地方可以用X-Y坐标表示.机器人最开始在(0, 0).由于传输问题,部分指令可能会混淆,现在给出确定的命令与未知命令,请帮忙确认机器人的X.Y坐标最小最大值分别是 ...
JAVA中神奇的双刃剑--Unsafe
前提参考资料: Java魔法类:sun.misc.Unsafe 在openjdk8下看Unsafe源码 Unsafe介绍在Oracle的Jdk8无法获取到sun.misc包的源码,想看此包的源码可 ...
PHP 设计模式系列 —— 资源库模式（Repository）
1.模式定义 Repository 是一个独立的层,介于领域层与数据映射层(数据访问层)之间.它的存在让领域层感觉不到数据访问层的存在,它提供一个类似集合的接口提供给领域层进行领域对象的访问.Repo ...
SQL Server 中关于EXCEPT和INTERSECT的用法
熟练使用SQL Server中的各种用法会给查询带来很多方便.今天就介绍一下EXCEPT和INTERSECT.注意此语法仅在SQL Server 2005及以上版本支持. EXCEPT是指在第一个集合 ...

Spark分析之TaskScheduler

Spark分析之TaskScheduler的更多相关文章

随机推荐

热门专题