Spark系列(十)TaskSchedule工作原理

会飞的纸盒 2024-10-13 21:05:24 原文

工作原理图

源码分析：

1、) 25 launchedTask = true 26 } 27 } catch { 28 case e: TaskNotSerializableException => 29 logError(s"Resource offer failed, task set ${taskSet.name} was not serializable") 30 // Do not offer resources for this task, but don't throw an error to allow other 31 // task sets to be submitted. 32 return launchedTask 33 } 34 } 35 } 36 return launchedTask 37 }

5、launchTasks

1	def launchTasks(tasks: Seq[Seq[TaskDescription]]) {
2	for (task <- tasks.flatten) {
3	// 将每个executor要执行的task信息进行序列化
4	val ser = SparkEnv.get.closureSerializer.newInstance()
5	val serializedTask = ser.serialize(task)
6	if (serializedTask.limit >= akkaFrameSize - AkkaUtils.reservedSizeBytes) {
7	val taskSetId = scheduler.taskIdToTaskSetId(task.taskId)
8	scheduler.activeTaskSets.get(taskSetId).foreach { taskSet =>
9	try {
10	var msg = "Serialized task %s:%d was %d bytes, which exceeds max allowed: " +
11	"spark.akka.frameSize (%d bytes) - reserved (%d bytes). Consider increasing " +
12	"spark.akka.frameSize or using broadcast variables for large values."
13	msg = msg.format(task.taskId, task.index, serializedTask.limit, akkaFrameSize,
14	AkkaUtils.reservedSizeBytes)
15	taskSet.abort(msg)
16	} catch {
17	case e: Exception => logError("Exception in error callback", e)
18	}
19	}
20	}
21	else {
22	val executorData = executorDataMap(task.executorId)
23	// 在对应的executor的资源中减去要使用的cpu资源
24	executorData.freeCores -= scheduler.CPUS_PER_TASK
25	// 向executor发送launchTask消息来启动task
26	executorData.executorActor ! LaunchTask(new SerializableBuffer(serializedTask))
27	}
28	}
29	}

说明：

1、resourceOffer方法功能:判断executor本地化级别的等待时间是否在一定范围内，如果在就认为task使用本地化级别可以在executor上启动。

2、TaskSetManager功能：对一个单独的TaskSet的任务进行调度，该类负责追踪每个task,如果task失败会负责重试,知道超过重试次数的限制，且会通过延迟调度为该TaskSet处理本地化调度机制，它主要接口是resourceOffer,在这个接口中，TaskSet会希望在一个节点上运行一个任务，并接受任务的状态改变消息，来知道它负责的task的状态改变了。

3、本地化级别种类：
PROCESS_LOCAL:进程本地化，rdd的partition和task在同一个executor中(最快)
NODE_LOCAL:rdd的partition和task,不在一个同一个executor中，但在同一个节点中
NO_PREF:没有本地化级别
RACK_LOCAL:机架本地化，至少rdd的partition和task在一个机架中
ANY:任意本地化级别

Spark系列(十)TaskSchedule工作原理的更多相关文章

Spark系列(八)Worker工作原理
工作原理图源代码分析包名:org.apache.spark.deploy.worker 启动driver入口点:registerWithMaster方法中的case LaunchDriver ...
Spark系列(九)DAGScheduler工作原理
以wordcount为示例进行深入分析 1 33 ) { 46 logInfo("Submitting " + tasks.size + " missi ...
line-height系列——定义和工作原理总结
一.line-height的定义和工作原理总结 line-height的属性值: normal 默认设置合理的行间距. number 设置数字,此数字会与当前的字体尺寸相乘来设置行间距li ...
【原】Learning Spark (Python版) 学习笔记(三)----工作原理、调优与Spark SQL
周末的任务是更新Learning Spark系列第三篇,以为自己写不完了,但为了改正拖延症,还是得完成给自己定的任务啊 = =.这三章主要讲Spark的运行过程(本地+集群),性能调优以及Spark ...
“Ceph浅析”系列之五——Ceph的工作原理及流程
本文将对Ceph的工作原理和若干关键工作流程进行扼要介绍.如前所述,由于Ceph的功能实现本质上依托于RADOS,因而,此处的介绍事实上也是针对RADOS进行.对于上层的部分,特别是RADOS GW和 ...
49、Spark Streaming基本工作原理
一.大数据实时计算介绍 1.概述 Spark Streaming,其实就是一种Spark提供的,对于大数据,进行实时计算的一种框架.它的底层,其实,也是基于我们之前讲解的Spark Core的. 基本 ...
4.Apache Spark的工作原理
Apache Spark的工作原理 1 Why Apache Spark 2 关于Apache Spark 3 如何安装Apache Spark 4 Apache Spark的工作原理 5 spark ...
JAVA之旅（二十五）——文件复制,字符流的缓冲区，BufferedWriter，BufferedReader，通过缓冲区复制文件，readLine工作原理，自定义readLine
JAVA之旅(二十五)--文件复制,字符流的缓冲区,BufferedWriter,BufferedReader,通过缓冲区复制文件,readLine工作原理,自定义readLine 我们继续IO上个篇 ...
RabbitMQ系列（二）深入了解RabbitMQ工作原理及简单使用
深入了解RabbitMQ工作原理及简单使用 RabbitMQ系列文章 RabbitMQ在Ubuntu上的环境搭建深入了解RabbitMQ工作原理及简单使用 RabbitMQ交换器Exchange介绍 ...

随机推荐

249. Group Shifted Strings
题目: Given a string, we can "shift" each of its letter to its successive letter, for exampl ...
Spring Data JPA教程, 第三部分: Custom Queries with Query Methods（翻译）
在本人的Spring Data JPA教程的第二部分描述了如何用Spring Data JPA创建一个简单的CRUD应用,本博文将描述如何在Spring Data JPA中使用query方法创建自定义 ...
cocos2dx 的基本框架
AppDelegate.h #ifndef _APP_DELEGATE_H_ #define _APP_DELEGATE_H_ #include "cocos2d.h" USING ...
删除 GPT 保护分区
问题: 将内置和/或外置硬盘连接到 Windows XP 32 位操作系统时,将无法访问硬盘,“磁盘管理”将会报告该硬盘包含 GPT 保护分区.在此状态下,将无法对硬盘进行重新分区和格式化. 原因: ...
MyBatis学习总结(5)——实现关联表查询
一对一关联提出需求根据班级id查询班级信息(带老师的信息) 创建表和数据创建一张教师表和班级表,假设一个老师负责教一个班,那么老师和班级之间的关系就是一对一的关系. create table t ...
信号量及PV原语
操作系统中进程互斥和同步的实现的一个最基本的方方是使用信号量和PV原语. 信号量S的物理意义:当S≥0的时候表示,某个资源可以使用的数量,当S<0的时候,其绝对值表示等待某个资源的进程数. 一般 ...
hdu 4864 Task (贪心技巧)
题目链接一道很有技巧的贪心题目. 题意:有n个机器,m个任务.每个机器至多能完成一个任务.对于每个机器,有一个最大运行时间xi和等级yi, 对于每个任务,也有一个运行时间xj和等级yj.只有当xi& ...
函数fsp_header_init
/**********************************************************************//** Initializes the space he ...
4010: [HNOI2015]菜肴制作
拓扑排序+堆. 转自popoqqq神犇. 反向建图跑拓扑排序然后逆序输出. 为什么不能正的来呢,因为不知道选当前菜要先制作哪种菜. 逆序过来跑拓扑的话,也能保证满足限制条件编号小的在前面. 题外话:我 ...
UVa 12169 (枚举+扩展欧几里得) Disgruntled Judge
题意: 给出四个数T, a, b, x1,按公式生成序列 xi = (a*xi-1 + b) % 10001 (2 ≤ i ≤ 2T) 给出T和奇数项xi,输出偶数项xi 分析: 最简单的办法就是直接 ...

Spark系列(十)TaskSchedule工作原理

Spark系列(十)TaskSchedule工作原理的更多相关文章

随机推荐

热门专题