Executor.scala

一、Executor类

首先判断本地性，获取slaves的host name（不是IP或者host: port），匹配运行环境为集群或者本地。如果不是本地执行，需要启动一个handler来监控所有的executor进程，避免阻塞。然后，初始化Spark执行环境。向SparkEnv注册executor资源，即registerSource方法。第三步，装载类，序列化类到内存中。第四，启动worker的线程池。第五，收集所有的task任务。接下就可以分配资源给task了，即将task与executor结合。

1、launchTask()：新建一个TaskRunner，对应的有task的信息；然后调用runningTasks的put方法装载该TaskRunner，并在线程池中执行该task。

2、killTask()：杀死指定线程。

3、releaseWriter()：获取ShuffleId，与BlockManager进行交互。具体作用？需要了解spark.shuffle.consolidatFiles的意义。

4、stop()：报告停止信息，关闭线程池。

二、TaskRunner类

继承自Runnable类，是task信息的容器。

1、kill()：由Executor杀死指定线程。

2、run()：重载的方法。执行task的进程，更改task的状态。同时启动GC机制，task的相关信息需要反序列化出来。run方法中需要保证task的epoch值与master一致，在MapOutPutTracker中体现，保证该任务可以被master管理。等任务执行完毕，分析任务执行的时间，序列化时间等等。然后对执行结果进行序列化处理，获取存储的block的Id并将序列化数据存入block。最后是复杂的异常处理。

3、CreateClassLoader()：为task建立的用来加载用户指定的jars或者任何需要用到的classes。首先检查是否是加载用户自定义的类，是则新建childExecutorURLClassLoader，否则新建ExecutorURLClassLoader，最终返回MutableURLClassLoader类型。

4、addReplClassLoaderInfNeeded()：家在一个新的ClassLoader来加载另一个jar。

5、updateDependencies()：根据SparkContext所提供的新文件或者新jars，装载未被加载的依赖包，同时加载这些所依赖的包到ClassLoader中。

6、startDriverHeartbeater()：启动心跳机制，将taskRunner的信息发送给master。

Spark源码学习1.6——Executor.scala的更多相关文章

Spark源码学习1.2——TaskSchedulerImpl.scala
许久没有写博客了,没有太多时间,最近陆续将Spark源码的一些阅读笔记传上,接下来要修改Spark源码了. 这个类继承于TaskScheduler类,重载了TaskScheduler中的大部分方法,是 ...
Spark源码学习1.1——DAGScheduler.scala
本文以Spark1.1.0版本为基础. 经过前一段时间的学习,基本上能够对Spark的工作流程有一个了解,但是具体的细节还是需要阅读源码,而且后续的科研过程中也肯定要修改源码的,所以最近开始Spark ...
Spark源码学习1.8——ShuffleBlockManager.scala
shuffleBlockManager继承于Logging,参数为blockManager和shuffleManager.shuffle文件有三个特性:shuffleId,整个shuffle stag ...
Spark源码学习1.3——TaskSetManager.scala
TaskSetManager.scala TaskSet是指一系列被提交的task,一般是代表特定的stage中丢失的partition.TaskSetManager通过一个TaskScheduler ...
Spark源码学习1.7——Master.scala
master第一步是加载系统定义的环境变量,如worker的超时时间.系统保留的Application数目等:第二步,加载worker的信息,地址.id等:第三步,加载Application的信息, ...
Spark源码学习1.5——BlockManager.scala
一.BlockResult类该类用来表示返回的匹配的block及其相关的参数.共有三个参数: data:Iterator [Any]. readMethod: DataReadMethod.Valu ...
Spark源码学习1.4——MapOutputTracker.scala
相关类:MapOutputTrackerMessage,GetMapOutputStatuses extends MapPutputTrackerMessage,StopMapOutputTracke ...
Spark源码学习2
转自:http://www.cnblogs.com/hseagle/p/3673123.html 在源码阅读时,需要重点把握以下两大主线. 静态view 即 RDD, transformation a ...
Spark源码学习3
转自:http://www.cnblogs.com/hseagle/p/3673132.html 一.概要本篇主要阐述在TaskRunner中执行的task其业务逻辑是如何被调用到的,另外试图讲清楚 ...

随机推荐

Vim插件管理器Vundle使用
参考地址:http://www.linuxidc.com/Linux/2012-12/75684.htm Vundle(Vim bundle) 是一个vim的插件管理器. 其Github地址为: ht ...
Eclipse Building Workspace 解决办法
Eclipse 一直不停 building workspace... android开发论坛 juapk 完美解决总结一.产生这个问题的原因多种 1.自动升级 2.未正确关闭 3.maven下载l ...
android native crash 分析
工具: addr2line arm-linux-androideabi-addr2line -aCfe libart.so 0x63006d 当libart.so包含符号表的情况下,可以查询到他的地址 ...
JAVA字符串05之课程问题解决
(一)古罗马皇帝凯撒在打仗时曾经使用过以下方法加密军事情报:请编写一个程序,使用上述算法加密或解密用户输入的英文字串. 1.设计思想:首先选择是加密字符串还是解密字符串,两种算法相似.如果要加密字符串 ...
解决笔记本键盘打字母却跳出数字来，每次都要按一遍Fn+Num LK 的问题
方法一. 开始-运行,输入“Regedit"命令进入注册表 HKEY_USERS\.DEFAULT\Control Panel\Keyboard 将 InitialKeyboardIndic ...
ActionBar compat 如何禁用ActionBar的显示/隐藏动画
ActionBar compat 如何关闭ActionBar的显示隐藏动画 @Override public boolean onCreateOptionsMenu(Menu menu) { //消除 ...
Java EE : 三、图解Session（会话）
目录 Java EE : 一.图解Http协议 Java EE : 二.图解 Cookie(小甜饼) Java EE : 三.图解Session(会话) 概述一.Session由来二.Sessio ...
关于DYNPRO程序的系统迁移与版本不匹配问题之一
前段时间公司做的一个项目,这两天在将项目程序导入公司,出问题了,搞了半天才发现是系统版本问题,但是还是不知道怎么解决,纠结ING... DYNRPO程序在创建(或是首次运行)的时候会自动生成一个DYN ...
YY前端课程4
1. CSS和HTML一样,也是标记语言 2. CSS有三种样式:嵌入样式.内部样式(行内样式)和外部样式(外部样式表) 3. CSS的语法:选择器+{一个或多个样式} 4. 选择器是为了找到html ...
第一篇博客：Hello World
2016年10月10日,双十,好日子,决定开始写第一篇博客,标题想了会,就叫Hello World 吧,哈哈^_^. 首先感谢博客园的管理们能批准我的申请,记得在14年的时候申请过一次,竟然没申请通过 ...

Spark源码学习1.6——Executor.scala

Executor.scala

Spark源码学习1.6——Executor.scala的更多相关文章

随机推荐

热门专题