Spark系列(八)Worker工作原理

工作原理图

源代码分析

包名：org.apache.spark.deploy.worker

启动driver入口点：registerWithMaster方法中的case LaunchDriver

1	) => DriverState.FINISHED
37	case _ => DriverState.FAILED
38	}
39	}
40
41	finalState = Some(state)
42	// 向Driver所属worker发送DriverStateChanged消息
43	worker ! DriverStateChanged(driverId, state, finalException)
44	}
45	}.start()
46	}

LaunchExecutor

管理LaunchExecutor的启动

1	case LaunchExecutor(masterUrl, appId, execId, appDesc, cores_, memory_) =>
2	if (masterUrl != activeMasterUrl) {
3	logWarning("Invalid Master (" + masterUrl + ") attempted to launch executor.")
4	} else {
5	try {
6	logInfo("Asked to launch executor %s/%d for %s".format(appId, execId, appDesc.name))
7
8	// Create the executor's working directory
9	// 创建executor本地工作目录
10	val executorDir = new File(workDir, appId + "/" + execId)
11	if (!executorDir.mkdirs()) {
12	throw new IOException("Failed to create directory " + executorDir)
13	}
14
15	// Create local dirs for the executor. These are passed to the executor via the
16	// SPARK_LOCAL_DIRS environment variable, and deleted by the Worker when the
17	// application finishes.
18	val appLocalDirs = appDirectories.get(appId).getOrElse {
19	Utils.getOrCreateLocalRootDirs(conf).map { dir =>
20	Utils.createDirectory(dir).getAbsolutePath()
21	}.toSeq
22	}
23	appDirectories(appId) = appLocalDirs
24	// 创建ExecutorRunner对象
25	val manager = new ExecutorRunner(
26	appId,
27	execId,
28	appDesc.copy(command = Worker.maybeUpdateSSLSettings(appDesc.command, conf)),
29	cores_,
30	memory_,
31	self,
32	workerId,
33	host,
34	webUi.boundPort,
35	publicAddress,
36	sparkHome,
37	executorDir,
38	akkaUrl,
39	conf,
40	appLocalDirs, ExecutorState.LOADING)
41	// executor加入本地缓存
42	executors(appId + "/" + execId) = manager
43	manager.start()
44	// 增加worker已使用core
45	coresUsed += cores_
46	// 增加worker已使用memory
47	memoryUsed += memory_
48	// 通知master发送ExecutorStateChanged消息
49	master ! ExecutorStateChanged(appId, execId, manager.state, None, None)
50	}
51	// 异常情况处理，通知master发送ExecutorStateChanged FAILED消息
52	catch {
53	case e: Exception => {
54	logError(s"Failed to launch executor $appId/$execId for ${appDesc.name}.", e)
55	if (executors.contains(appId + "/" + execId)) {
56	executors(appId + "/" + execId).kill()
57	executors -= appId + "/" + execId
58	}
59	master ! ExecutorStateChanged(appId, execId, ExecutorState.FAILED,
60	Some(e.toString), None)
61	}
62	}
63	}

总结

1、Worker、Driver、Application启动后都会向Master进行注册,并缓存到Master内存数据模型中
2、完成注册后发送LaunchExecutor、LaunchDriver到Worker
3、Worker收到消息后启动executor和driver进程，并调用Worker的ExecutorStateChanged和DriverStateChanged方法
4、发送ExecutorStateChanged和DriverStateChanged消息到Master的，根据各自的状态信息进行处理，最重要的是会调用schedule方法进行资源的重新调度

Spark系列(八)Worker工作原理的更多相关文章

Spark系列(十)TaskSchedule工作原理
工作原理图源码分析: 1.) 25 launchedTask = true 26 } 27 } catch { 28 ...
Spark系列(九)DAGScheduler工作原理
以wordcount为示例进行深入分析 1 33 ) { 46 logInfo("Submitting " + tasks.size + " missi ...
line-height系列——定义和工作原理总结
一.line-height的定义和工作原理总结 line-height的属性值: normal 默认设置合理的行间距. number 设置数字,此数字会与当前的字体尺寸相乘来设置行间距li ...
源码分析八( hashmap工作原理)
首先从一条简单的语句开始,创建了一个hashmap对象: Map<String,String> hashmap = new HashMap<String,String>(); ...
[Spark内核] 第32课：Spark Worker原理和源码剖析解密：Worker工作流程图、Worker启动Driver源码解密、Worker启动Executor源码解密等
本課主題 Spark Worker 原理 Worker 启动 Driver 源码鉴赏 Worker 启动 Executor 源码鉴赏 Worker 与 Master 的交互关系 [引言部份:你希望读者 ...
【原】Learning Spark (Python版) 学习笔记(三)----工作原理、调优与Spark SQL
周末的任务是更新Learning Spark系列第三篇,以为自己写不完了,但为了改正拖延症,还是得完成给自己定的任务啊 = =.这三章主要讲Spark的运行过程(本地+集群),性能调优以及Spark ...
How Javascript works (Javascript工作原理) (八) WebAssembly 对比 JavaScript 及其使用场景
个人总结: webworker有以下三种: Dedicated Workers 由主进程实例化并且只能与之进行通信 Shared Workers 可以被运行在同源的所有进程访问(不同的浏览的选项卡,内 ...
49、Spark Streaming基本工作原理
一.大数据实时计算介绍 1.概述 Spark Streaming,其实就是一种Spark提供的,对于大数据,进行实时计算的一种框架.它的底层,其实,也是基于我们之前讲解的Spark Core的. 基本 ...
46、Spark SQL工作原理剖析以及性能优化
一.工作原理剖析 1.图解二.性能优化 1.设置Shuffle过程中的并行度:spark.sql.shuffle.partitions(SQLContext.setConf()) 2.在Hive数据 ...

随机推荐

java：继承
一.继承: java只支持单继承,一个子类只能继承一个父类,使用继承是为了减少类的重复代码,且父类的构造函数不能被子类继承. 当两个类里面有相同的属性或方法,就应该考虑使用继承解决重复代码了. 继承的 ...
多线程+委托的安全访问（invoke）
1.声明方法 2.声明委托类型 3.创建委托对象 4.启动线程 5.在线程调用的方法里通过Control的Invoke方法执行委托 public Form1() { InitializeCompone ...
office开发心得——基于模板开发
这几天正在写一个小程序,但用到生成word表格和Excel表格.到网上查了一些资料,发现如果生成表格模板相对比较固定即可把其制作成模板,需要设置什么格式可以直接在模板中设置,而程序仅需替换相应的内容即 ...
使用phantomjs实现highcharts等报表通过邮件发送
使用phantomjs实现highcharts等报表通过邮件发送(本文仅提供完整解决方案和实现思路,完全照搬不去整理代码无法马上得到效果) 前不久项目组需要将测试相关的质量数据通过每日自动生成报表 ...
修改linux命令行提示符路径显示
命令显示行太长,影响观感,这样需要修改,具体方法: 1. 修改 ~/.bashrc,在最后一行添加: export PS1='[\u@\h\W]$' 其中\u是当前用户名,\h是当前主机名,\w显示当 ...
JS模块化编程
AMD:异步模块定义,适合客户端环境,不会阻塞运行.客户端受网络影响比较大. CommonJs:适用于服务器端规范,可以同步加载,只受硬盘读写的影响.
IOS基础框架
GameKit 为游戏提供网络功能:点对点互联和游戏中的语音交流 AddressBook 提供访问用户联系人信息的功能 AddressBookUI 提供一个用户界面,用于显示存储在地址簿中的联系人信息 ...
通知角标(2)只用一个TextView实现
可以只用一个TextView实现通知角标,TextView的setCompoundDrawables函数可以在TextView的上,下,左,右,4条边处分别指定一个图片.见图1: 这个图片如果在角上, ...
异常：Caused by: java.lang.NoClassDefFoundError: Could not initialize class net.sf.log4jdbc.Properties
参考文章: 使用Log4jdbc-log4j2监听MyBatis中运行的SQL和Connection 使用 log4jdbc格式化输出SQL,maven配置如下: <dependency> ...
moment 和ko 绑定msdate格式的日期值（静态text）
<!DOCTYPE html> <html lang="zh-cn"> <head> <meta charset="utf-8& ...

Spark系列(八)Worker工作原理

Spark系列(八)Worker工作原理的更多相关文章

随机推荐

热门专题