Spark 源码分析 -- Task

Task是介于DAGScheduler和TaskScheduler中间的接口
在DAGScheduler, 需要把DAG中的每个stage的每个partitions封装成task
最终把taskset提交给TaskScheduler

/**

 * A task to execute on a worker node.

 */

private[spark] abstract class Task[T](val stageId: Int) extends Serializable {

  def run(attemptId: Long): T  //Task的核心函数

  def preferredLocations: Seq[TaskLocation] = Nil //Spark关注locality,可以选择该task运行的location

  var epoch: Long = -1   // Map output tracker epoch. Will be set by TaskScheduler.

  var metrics: Option[TaskMetrics] = None

}

TaskContext

用于记录TaskMetrics和在Task中用到的callback

比如对于HadoopRDD, task完成时需要close input stream

package org.apache.spark

class TaskContext(

  val stageId: Int,

  val splitId: Int,

  val attemptId: Long,

  val runningLocally: Boolean = false,

  val taskMetrics: TaskMetrics = TaskMetrics.empty() //TaskMetrics封装了task执行时一些指标和数据

) extends Serializable {

  @transient val onCompleteCallbacks = new ArrayBuffer[() => Unit]

  // Add a callback function to be executed on task completion. An example use

  // is for HadoopRDD to register a callback to close the input stream.

  def addOnCompleteCallback(f: () => Unit) {

    onCompleteCallbacks += f

  }

  def executeOnCompleteCallbacks() {

    onCompleteCallbacks.foreach{_()}

  }

}

ResultTask

对应于Result Stage直接产生结果

package org.apache.spark.scheduler

private[spark] class ResultTask[T, U](

    stageId: Int,

    var rdd: RDD[T],

    var func: (TaskContext, Iterator[T]) => U,

    var partition: Int,

    @transient locs: Seq[TaskLocation],

    var outputId: Int)

  extends Task[U](stageId) with Externalizable {

  override def run(attemptId: Long): U = {  // 对于resultTask, run就是返回执行的结果, 比如count值

    val context = new TaskContext(stageId, partition, attemptId, runningLocally = false)

    metrics = Some(context.taskMetrics)

    try {

      func(context, rdd.iterator(split, context)) // 直接就是对RDD的iterator调用func, 比如count函数

    } finally {

      context.executeOnCompleteCallbacks()

    }

  }

}

ShuffleMapTask

对应于ShuffleMap Stage, 产生的结果作为其他stage的输入

package org.apache.spark.scheduler

private[spark] class ShuffleMapTask(

    stageId: Int,

    var rdd: RDD[_],

    var dep: ShuffleDependency[_,_],

    var partition: Int,

    @transient private var locs: Seq[TaskLocation])

  extends Task[MapStatus](stageId)

  with Externalizable

  with Logging {

  override def run(attemptId: Long): MapStatus = {

    val numOutputSplits = dep.partitioner.numPartitions // 从ShuffleDependency的partitioner中获取到shuffle目标partition的个数

    val taskContext = new TaskContext(stageId, partition, attemptId, runningLocally = false)

    metrics = Some(taskContext.taskMetrics)

    val blockManager = SparkEnv.get.blockManager // shuffle需要借助blockManager来完成

    var shuffle: ShuffleBlocks = null

    var buckets: ShuffleWriterGroup = null

    try {

      // Obtain all the block writers for shuffle blocks.

      val ser = SparkEnv.get.serializerManager.get(dep.serializerClass)

      shuffle = blockManager.shuffleBlockManager.forShuffle(dep.shuffleId, numOutputSplits, ser) // 创建shuffleBlockManager, 参数是shuffleId和目标partitions数目

      buckets = shuffle.acquireWriters(partition) // 生成shuffle目标buckets(对应于partition)

      // Write the map output to its associated buckets.

      for (elem <- rdd.iterator(split, taskContext)) { // 从RDD中取出每个elem数据

        val pair = elem.asInstanceOf[Product2[Any, Any]]

        val bucketId = dep.partitioner.getPartition(pair._1) // 根据pair的key进行shuffle, 得到目标bucketid

        buckets.writers(bucketId).write(pair) // 将pair数据写入bucket

      }

      // Commit这些buckets到block, 其他的RDD会从通过shuffleid找到这些block, 并读取数据

      // Commit the writes. Get the size of each bucket block (total block size).

      var totalBytes = 0L

      val compressedSizes: Array[Byte] = buckets.writers.map { writer: BlockObjectWriter => // 计算所有buckets写入文件data的size总和(压缩值)

        writer.commit()

        writer.close()

        val size = writer.size()

        totalBytes += size

        MapOutputTracker.compressSize(size)

      }

      // Update shuffle metrics.

      val shuffleMetrics = new ShuffleWriteMetrics

      shuffleMetrics.shuffleBytesWritten = totalBytes

      metrics.get.shuffleWriteMetrics = Some(shuffleMetrics)

      return new MapStatus(blockManager.blockManagerId, compressedSizes) // 返回值为MapStatus, 包含blockManagerId和写入的data size, 会被注册到MapOutputTracker

    } catch { case e: Exception =>

      // If there is an exception from running the task, revert the partial writes

      // and throw the exception upstream to Spark.

      if (buckets != null) {

        buckets.writers.foreach(_.revertPartialWrites())

      }

      throw e

    } finally {

      // Release the writers back to the shuffle block manager.

      if (shuffle != null && buckets != null) {

        shuffle.releaseWriters(buckets)

      }

      // Execute the callbacks on task completion.

      taskContext.executeOnCompleteCallbacks()

    }

  }

TaskSet

用于封装一个stage的所有的tasks, 以提交给TaskScheduler

package org.apache.spark.scheduler

/**

 * A set of tasks submitted together to the low-level TaskScheduler, usually representing

 * missing partitions of a particular stage.

 */

private[spark] class TaskSet(

    val tasks: Array[Task[_]],

    val stageId: Int,

    val attempt: Int,

    val priority: Int,

    val properties: Properties) {

    val id: String = stageId + "." + attempt

  override def toString: String = "TaskSet " + id

}

Spark 源码分析 -- Task的更多相关文章

Spark 源码分析 -- task实际执行过程
Spark源码分析 – SparkContext 中的例子, 只分析到sc.runJob 那么最终是怎么执行的? 通过DAGScheduler切分成Stage, 封装成taskset, 提交给Task ...
Spark源码分析 – 汇总索引
http://jerryshao.me/categories.html#architecture-ref http://blog.csdn.net/pelick/article/details/172 ...
Spark源码分析 – DAGScheduler
DAGScheduler的架构其实非常简单, 1. eventQueue, 所有需要DAGScheduler处理的事情都需要往eventQueue中发送event 2. eventLoop Threa ...
Spark源码分析之八：Task运行（二）
在<Spark源码分析之七:Task运行(一)>一文中,我们详细叙述了Task运行的整体流程,最终Task被传输到Executor上,启动一个对应的TaskRunner线程,并且在线程池中 ...
Spark源码分析之七：Task运行（一）
在Task调度相关的两篇文章<Spark源码分析之五:Task调度(一)>与<Spark源码分析之六:Task调度(二)>中,我们大致了解了Task调度相关的主要逻辑,并且在T ...
Spark源码分析之六：Task调度（二）
话说在<Spark源码分析之五:Task调度(一)>一文中,我们对Task调度分析到了DriverEndpoint的makeOffers()方法.这个方法针对接收到的ReviveOffer ...
Spark源码分析之五：Task调度（一）
在前四篇博文中,我们分析了Job提交运行总流程的第一阶段Stage划分与提交,它又被细化为三个分阶段: 1.Job的调度模型与运行反馈: 2.Stage划分: 3.Stage提交:对应TaskSet的 ...
spark 源码分析之二十一 -- Task的执行流程
引言在上两篇文章 spark 源码分析之十九 -- DAG的生成和Stage的划分和 spark 源码分析之二十 -- Stage的提交中剖析了Spark的DAG的生成,Stage的划分以及St ...
spark 源码分析之二十二-- Task的内存管理
问题的提出本篇文章将回答如下问题: 1. spark任务在执行的时候,其内存是如何管理的? 2. 堆内内存的寻址是如何设计的?是如何避免由于JVM的GC的存在引起的内存地址变化的?其内部的内存缓存 ...

随机推荐

git 的一些笔记
git config git config存在三个地方 :1./.git/config 项目级别2.~/.gitconfig 用户级别3./etc/gitconfig 系统级别 git config ...
[转]T-SQL_面试题
[转]T-SQL_面试题 2015-05-19 1 创建表插入数据 Student(S#,Sname,Sage,Ssex) 学生表 Course(C#,Cname,T#) 课程表 SC(S#,C#,s ...
【转】oozie安装和自带示例的使用
oozie安装 [转]http://www.tuicool.com/articles/qUVNJn oozie自带示例的使用 [转]http://blog.csdn.net/zhu_xun/artic ...
js 静态方法静态变量实例方法实例变量
1.静态方法的定义 Js代码 var BaseClass = function() {}; // var BaseClass=new Function(); BaseClass.f1 = func ...
FreeRTOS官方翻译文档——第二章队列管理
2.1 概览基于 FreeRTOS 的应用程序由一组独立的任务构成——每个任务都是具有独立权限的小程序.这些独立的任务之间很可能会通过相互通信以提供有用的系统功能.FreeRTOS 中所有的通信与同步 ...
椭圆曲线密码体制(ECC)简介
一.椭圆曲线的基本概念简单的说椭圆曲线并不是椭圆,之所以称为椭圆曲线是因为他们是用三次方程来表示,并且该方程与计算椭圆周长的方程相似. 对密码学比较有意义的是基于素数域GF(p)和基于二进制域(GF ...
Spider Studio 社区信息
Spider Studio (采集工作站) 产品页面: http://www.gdtsearch.com/products.spiderstudio.htm QQ群: 45995410 - 有人驻场解 ...
oozie常见错误问题
1. Error: HTTP error code: 404 : Not Found 原因: 在环境变量中配置的OOZIE_URL有问题配置成了 export OOZIE_URL=http://dw ...
Linux下安装配置MediaWiKi全过程
0.libxml2的安装 *下载http://rpmfind.net/linux/rpm2html/search.php?query=libxml2 *执行以下Linux命令进行安装 a)gu ...
CI框架中类名不能以方法名相同
昨天晚上一个坑爹的问题折腾了我一晚上,首先我来说下我的代码,我建立了一个index的控制器然后呢在控制器里有一个index的方法.页面模板都有. if ( ! defined('BASEPATH' ...