前言

下面的分析基于对spark2.1.0版本的分析，对于1.x的版本可以有区别。

内存配置

key	默认	解释
spark.memory.fraction	0.6	spark可以直接使用的内存大小系数
spark.memory.storageFraction	0.5	spark存储可以直接使用的内存大小系数
spark.memory.offHeap.enabled	false	是否开启spark使用jvm内存之外的内存
spark.memory.offHeap.size	0	jvm之外，spark可以用多少内存

内存划分策略

如图1，spark在内存上划分出4部分空间，分别为预留空间（默认300M），Spark执行空间（Execution），Spark存储空间（Storage）和用户使用空间。

下面用一个实际案例描述一下这4部分空间：

假设给executor分配1G，也就是1024MB，Spark会留出300MB，这300MB不能作为缓存或者rdd相关操作使用，可以理解成防止OOM的一种策略。当`spark.memory.fraction`为0.6时（默认），(1024 - 300) * 0.6 = 434MB，这434MB就是Spark用于rdd缓存或者rdd执行的内存大小，也就是Spark可以随意使用的max memory。剩下的资源是给用户留下的内存大小。而`spark.memory.storageFraction`则是声明了可以用于存储的大小，默认是0.5，也就是说Spark任务中，存储Storage和执行Execution各占50%内存空间也就是434*0.5=217MB。

图1

在实际内存申请过程中，Spark为Storage和Execution各自维护了一个内存资源池，用于控制和协调内存资源的使用，在钨丝计划的路线下，Spark支持onHeap和offHeap两种内存分配机制，但是分配流程是一致的。参考图2，在Execution的内存池资源充足的情况下，直接获取需要的Execution资源，而在不足情况下，允许Execution借用Storage的内存资源，首先判断Storage资源池剩余的资源是否满足要去，如果剩余也不足，那么尝试将已经存在的block（block是rdd缓存或者shuflle的存储单元）剔除，直到获取到充足的内存，如果资源依然不够Execution，那么该Execution会阻塞，知道获取到全部资源。而反过来需要获取Storage的内存资源，也是先检查Execution内存池是否有剩余，如果依旧不足，呢就去尝试将已经存在的block剔除，直到获取到充足的内存（和Execution调用的是一个函数evictBlocksToFreeSpace），最后获取不到足够的资源就直接返回失败。这相比Execution是有区别的，Storage不够可以spill，而Execution资源不够就必须阻塞等待。

图2

内存划分粒度

Spark对于内存的控制的最小粒度是Task，一个executor也就是一个JVM维护一个Execution内存池和Storage内存池，也就是说一个executor能同时执行多少个task除了收到cpu的影响，还受到竞争内存资源的影响，其实上面已经讲了很多了，下面再详细分析一下task如何竞争内存资源。

task获取Execution内存

task获取Execution的内存也是相对公平的控制，将内存控制在task平均使用内存和task平均使用内存一半之间。相关代码如下：

val maxMemoryPerTask = maxPoolSize / numActiveTasks
val minMemoryPerTask = poolSize / (2 * numActiveTasks)
// How much we can grant this task; keep its share within 0 <= X <= 1 /
numActiveTasks
val maxToGrant = math.min(numBytes, math.max(0, maxMemoryPerTask - curMem))
// Only give it as much memory as is free, which might be none if it reached 1
/ numTasks
val toGrant = math.min(maxToGrant, memoryFree)

当获取不到内存时，Spark会让请求的task等待，直到有其他task释放资源，然后该task再去抢占资源。

task获取Storage内存

storage内存的获取就相对复杂一点，因为这受到rdd的cache，persist相关操作的影响。因此和BlockManager和MemStore有关

如果申请的内存大于storage内存池剩余的内存，那么获取Execution内存池是否有剩余，如果有的话就释放Math.min(executionPool.memoryFree,
numBytes)。在申请内存之前，还做了一件事件，就是去blockManager尝试释放内存，如果缓存的所有内存实例中，某个blockId下的rdd的id是空，并且存储模式相同（都用jvm或者都不用jvm），那么就会将该blockId释放。如果空余资源小于申请的资源，那么就会申请失败。

代码相关类

MemoryManager

UnifiedMemoryManager

MemoryPool

StorageMemoryPool

ExecutionMemoryPool

MemoryStore

spark内存管理分析的更多相关文章

spark 源码分析之十五 -- Spark内存管理剖析
本篇文章主要剖析Spark的内存管理体系. 在上篇文章 spark 源码分析之十四 -- broadcast 是如何实现的?中对存储相关的内容没有做过多的剖析,下面计划先剖析Spark的内存机制,进而 ...
Spark内存管理机制
Spark内存管理机制 Spark 作为一个基于内存的分布式计算引擎,其内存管理模块在整个系统中扮演着非常重要的角色.理解 Spark 内存管理的基本原理,有助于更好地开发 Spark 应用程序和进行 ...
Apache Spark 内存管理详解（转载）
Spark 作为一个基于内存的分布式计算引擎,其内存管理模块在整个系统中扮演着非常重要的角色.理解 Spark 内存管理的基本原理,有助于更好地开发 Spark 应用程序和进行性能调优.本文旨在梳理出 ...
spark内存管理器--MemoryManager源码解析
MemoryManager内存管理器内存管理器可以说是spark内核中最重要的基础模块之一,shuffle时的排序,rdd缓存,展开内存,广播变量,Task运行结果的存储等等,凡是需要使用内存的地方 ...
spark内存管理详解
Spark 作为一个基于内存的分布式计算引擎,其内存管理模块在整个系统中扮演着非常重要的角色.理解 Spark 内存管理的基本原理,有助于更好地开发 Spark 应用程序和进行性能调优.本文旨在梳理出 ...
【Spark-core学习之八】 SparkShuffle & Spark内存管理
[Spark-core学习之八] SparkShuffle & Spark内存管理环境虚拟机:VMware 10 Linux版本:CentOS-6.5-x86_64 客户端:Xshell4 ...
Spark内存管理之钨丝计划
Spark内存管理之钨丝计划 1. 钨丝计划的产生的原因 2. 钨丝计划内幕详解一:“钨丝计划”产生的本质原因 1, Spark作为一个一体化多元化的(大)数据处理通用平台,性能一直是其根本性的追 ...
Spark（四十六）：Spark 内存管理之—OFF_HEAP
存储级别简介 Spark中RDD提供了多种存储级别,除去使用内存,磁盘等,还有一种是OFF_HEAP,称之为使用JVM堆外内存 https://github.com/apache/spark/blo ...
Spark 内存管理
Spark 内存管理 Spark 执行应用程序时, 会启动 Driver 和 Executor 两种 JVM 进程 Driver 负责创建 SparkContext 上下文, 提交任务, task的分 ...

随机推荐

MACOS配置VIM成简单IDE傻瓜式操作
零.参考文献: https://www.jianshu.com/p/f0513d18742a 一.安照我的配置:保存文件 " Configuration file for vim " ...
Android中textView自动识别电话号码,电子邮件,网址(自动加连接)
extends:http://blog.csdn.net/wx_962464/article/details/8471195 其实这个是很简单的,在android中已经为我们实现了,但是我估计很多人都 ...
js的delete和void关键字
delete关键字 delete关键字的作用: 删除对象的属性语法:delete 对象.属性可以删除没有使用var关键字声明的全局变量(直接定义在window上面的属性) delete关键字的 ...
java设计模式----外观模式(门面模式)
外观模式主要应用场景在于为复杂的子系统提供一个简单的接口,提高子系统的独立性. 创建DrawerOne类: package facade; public class DrawerOne { publi ...
OC开发_Storyboard——Core Data
一 .NSManagedObjectContext 1.我们要想操作Core Data,首先需要一个NSManagedObjectContext2.那我们如何获得Context呢:创建一个UIMana ...
opencv学习笔记——Scalar数据结构的理解
首先看一下Scalar的定义 typedef struct Scalar { ]; }Scalar; 可以看到,Scalar是一个由长度为4的数组作为元素构成的结构体,Scalar最多可以存储四个值, ...
解析导航栏的url
前段时间做ui自动化测试的时候,导航栏菜单始终有点问题,最后只好直接获取到url,然后直接使用driver.get(url)进入页面: 包括做压测的时候,比如我要找出所有报表菜单的url,这样不可能手 ...
python的tqdm模块
Tqdm 是一个快速,可扩展的Python进度条,可以在 Python 长循环中添加一个进度提示信息,用户只需要封装任意的迭代器 tqdm(iterator). 根据要求安装依赖即可. 可以很方便的在 ...
Intellij idea的Dependencies波浪线
昨天在家做项目不知道搞了什么出现了大量波浪线.搞了大半天解决了下面的问题. 1.pom.xml出现波浪线.看右边 maven project-->Profiles 勾选dev 2.上面已勾选还有 ...
php引用(&)详解及注意事项——引用返回function &a();&a()
http://www.cnblogs.com/xiaochaohuashengmi/archive/2011/09/10/2173092.html 函数的引用返回先看代码 <?php func ...

spark内存管理分析

前言