本课主题

Static MemoryManager 的源码鉴赏　　
Unified MemoryManager 的源码鉴赏

引言

从源码的角度了解 Spark 内存管理是怎么设计的，从而知道应该配置那个参数让程序运行更适合你的实际需要，我们为什么要把 Spark Memory 这块内存调大，原因很简单，理论上讲你调得愈来，你占用的空间愈大，程序运行时所产生的 IO 就会愈来愈少，理论可以参考第四章 : Spark 中 JVM 内存使用及配置内幕详情。这一章是对于理论的源码补充！希望这篇文章能为读者带出以下的启发：

了解 MemoryManger: Unified Memory Manager, Static Memory Manager 以及它们的核心功能与方法
了解 MemoryPool: StorageMemoryPool 和 ExecutionMemoryPool 以及它们的核心功能与方法

Spark 2.1.0 中两种内存管理的源码剖析

回顾上一章所讲的 Spark Shuffle 内存分配理论，我们知道 Spark Shuffle 的内存管理有两种：一种是联合内存管理器 (Spark Unified Memory)、一种是静态内存管理器 (Spark Static Memory)，首先这两个类都是继承著 MemoryManager，MemoryManager 是一个抽象类，它这样设计很容易理解呀，我们应用程序中使用接口就是为了包容未来的变化，因为现在只有两个内存管理器，将来可能会有好几种内存控制器。

MemoryManager 主要有几个功能：

记录用了多少 StorageMemory 和 ExecutionMemory
申请 Storage、Execution 和 Unroll Memory：acquireStorageMemory, acquireExectionMemory, acquireUnrollMemory
释放 Storage 和 Execution Memory

抽象类 MemoryManager

首先看看 MemoryManger ，它会强制管理储存(Storage)和执行(Execution)之间的内存使用，从 MemoryManager 申请可以把剩馀空间借给对方。所有 Task 的运行就是 ShuffleTask 的运行，ExecutionMemory是指 Shuffles，joins，sorts 和 aggregation 的操作；而 StorageMemory 是缓存和广播数据相关的，每一个 JVM 会产生一个 MemoryManager 来负责管理内存。MemoryManager 构造时，需要指定 onHeapStorageMemeory和 onHeapExecutionMemory 的参数。
[下图是 MemoryManager.scala 中抽象类 MemoryManager 接收的参数]
在 MemoryManager 对象构造的时候创建 StorageMemoryPool 和 ExecutionMemoryPool 对象，用来管理了 Storage 和 Execution 的内存分配。
[下图是 MemoryManager.scala 中 OnHeapStorageMemoryPool, OffHeapStorageMemoryPool, OnHeapExecutionMemoryPool, OffHeapExecutionMemoryPool 变量]

这里是 StorageMemory 用来记录 Storage 使用了多少内存
[下图是 StorageMemoryPool.scala 中 memoryUsed 方法]

这里是 ExecutionMemory 用来记录 Execution 使用了多少内存，它创建一些 HashMap 来存储每个 Task 的内存使用量，把 Map 中的所有 Value 加起来便用当前 ExecutionMemory 的总使用量。
[下图是 ExecutionMemoryPool.scala 中 memoryUsed 方法]
MemoryStore 也是被 BlockManager 管理的，以下是其中一个 MemoryStore 调用 acquireStorageMemory 方法的源代码，一个 Block 怎么实代化可以参考 [Spark内核] 第38课：BlockManager架构原理、运行流程图和源码解密[下图是 MemoryStore.scala 中 putBytes 方法]
现在 Spark 2.1 默认的 MemoryManager 是 UnifiedMemoryManager，你可以看到下里有一段条件判断的逻辑，如果 spark.memory.userLegacyMode 是 true 的话，MemeoryManager 便是 StaticMemoryManager，否则的话就是 Spark Unified Memory。
[下图是 SparkEnv.scala 中 memoryManager 变量]
在 MemoryManager 中有一个很关键的代码，如果你想使用 OffHeap 作为储存的话，你必需设置 spark.memory.offHeap.enabled 为 true，还有确定你的 offHeap 系统的空间必须大于 0。
[下图是 MemoryManager.scala 中 tungstenMemoryMode 变量]

Static MemoryManager 的源码鉴赏

默认空间的计算方式
[下图是 StaticMemoryManager.scala 中 getMaxStorageMemory 方法]

[下图是 StaticMemoryManager.scala 中 maxUnrollMemory 变量]
acquireStorageMemory
[下图是 StaticMemoryManager.scala 中 acquireStorageMemory 方法]
acquireExecutionMemory
[下图是 StaticMemoryManager.scala 中 acquireExecutionMemory 方法]
acquireUnrollMemory
[下图是 StaticMemoryManager.scala 中 acquireUnrollMemory 方法]

Unified MemoryManager 的源码鉴赏

UnifiedMemoryManager 构造时调用工厂方法 apply( )，默认是把 Storage空间的50％给 Execution
[下图是 UnifiedMemoryManager.scala 中 UnifiedMemoryManager 构造参数]

你可以很清楚的看见：默认的 Reserved System Memory 是 300M，然后默认的 HeapStorageRegionSize 是 MaxMemory x 50％，如果实现了 OffHeapExecutionMemoryPool 你觉得会不会有从 StorageMemory 获得储存这个概念? 实际上不需要找 Storage 借空间。如果是 ShuffleTask 计算比较复杂的情况，使用 Unified Memory Management 会取得更好的效率，但是如果说计算的业务逻辑需要更大的缓存空间，此时使用 StaticMemoryManagement 效果会更好。
[下图是 UnifiedMemoryManager.scala 中 UnifiedMemoryManager 伴生对象里的 RESERVED_SYSTEM_MEMORY_BYTES 参数和 apply 方法]

[下图是 UnifiedMemoryManager.scala 中 UnifiedMemoryManager 伴生对象里的 getMaxMemory 方法]
上一章讨论过在 Unified 机制下有两种方法 Execution 会向 Storage 借空间，现在配合源码来证明这个说法。Unified Memory Manager 有两个核心方法，第一个是 acquiredExecutionMemeory 和 acquireStorageMemory，当 ExecutionMemory 有剩馀空间时可以借给 StorageMemory，然后通过调用 StorageMemoryPool 的 acquireMemory 方法向 storageMemoryPool 申请空间。
[下图是 UnifiedMemoryManager.scala 中 acquireStorageMemory 方法]

[下图是 ExecutionMemoryPool.scala 中 acquireMemory 方法]
acquiredExecutionMemory 主要是为当前的执行任务去获得的执行空间，它首先会根据我们的 onHeap 和 offHeap 这两种不同的方式来进行配。
[下图是 UnifiedMemoryManager.scala 中 acquireExecutionMemory 方法]
在MemoryManager 构造的时候也分配一定的内存空间 poolSize
[下图是 MemoryManager.scala 中调用了 incremenPoolSize 方法]

[下图是 MemoryPool.scala 中 incremenPoolSize 方法]
调用 computeMaxExecutionPoolSize 方法向 ExecutionPool 申请资源。过程中会调用 maybeGrowExecutionPool来判断需要多少内存，包括计算内存空间的空闲资源与Storage曾经占用的空间。
[下图是 UnifiedMemoryManager.scala 中 computeMaxExecutionPoolSize 方法]

maybeGrowExecutionPool 方法会首先判断申请的内存申请资源是大于0，然后判断是剩馀空间和 Storage曾经占用的空间多，把需要的内存资源量提交给 StorageMemoryPool 的 freeSpaceToShrinkPool 方法。
[下图是 UnifiedMemoryManager.scala 中 maybeGrowExecutionPool 方法]

然后会判断是当前 FreeSpace 能不能满足 Execution 的需要，如果无法满足则调用 MemoryStore的evictVlocksToFreeSpace方法在 StorageMemoryPool 中挤掉一部份数据。
[下图是 StorageMemoryPool.scala 中 freeSpaceToShrinkPool 方法]
调用 ExecutionPool 的 acquireMemory 方法向 ExecutionPool 申请内存资源，每个 Task 理论上讲一般能使用的大小是从 poolSize /(2 x numActiveTasks) 到 maxPoolSize/numActiveTasks
[下图是 ExecutionMemoryPool.scala 中 acquireMemory 方法]

參考資料

资料来源来至 DT大数据梦工厂大数据商业案例以及性能调优
第31课：彻底解密Spark 2.1.X中Shuffle中内存管理源码解密：StaticMemory和UnifiedMemory

Spark源码图片取自于 Spark 2.1.0版本

[Spark性能调优] 源码补充 : Spark 2.1.X 中 Unified 和 Static MemoryManager的更多相关文章

[Spark性能调优] 第四章 : Spark Shuffle 中 JVM 内存使用及配置内幕详情
本课主题 JVM 內存使用架构剖析 Spark 1.6.x 和 Spark 2.x 的 JVM 剖析 Spark 1.6.x 以前 on Yarn 计算内存使用案例 Spark Unified Mem ...
[Spark性能调优] 第三章 : Spark 2.1.0 中 Sort-Based Shuffle 产生的内幕
本課主題 Sorted-Based Shuffle 的诞生和介绍 Shuffle 中六大令人费解的问题 Sorted-Based Shuffle 的排序和源码鉴赏 Shuffle 在运行时的内存管理 ...
spark性能调优（四） spark shuffle中JVM内存使用及配置内幕详情
转载:http://www.cnblogs.com/jcchoiling/p/6494652.html 引言 Spark 从1.6.x 开始对 JVM 的内存使用作出了一种全新的改变,Spark 1. ...
Spark性能调优之道——解决Spark数据倾斜（Data Skew）的N种姿势
原文:http://blog.csdn.net/tanglizhe1105/article/details/51050974 背景很多使用Spark的朋友很想知道rdd里的元素是怎么存储的,它们占用 ...
[Spark性能调优] 第一章：性能调优的本质、Spark资源使用原理和调优要点分析
本課主題大数据性能调优的本质 Spark 性能调优要点分析 Spark 资源使用原理流程 Spark 资源调优最佳实战 Spark 更高性能的算子引言我们谈大数据性能调优,到底在谈什么,它的本质 ...
Spark性能调优
Spark性能优化指南——基础篇 https://tech.meituan.com/spark-tuning-basic.html Spark性能优化指南——高级篇 https://tech.meit ...
性能调优的本质、Spark资源使用原理和调优要点分析
本课主题大数据性能调优的本质 Spark 性能调优要点分析 Spark 资源使用原理流程 Spark 资源调优最佳实战 Spark 更高性能的算子引言我们谈大数据性能调优,到底在谈什么,它的本质 ...
Spark性能调优之JVM调优
Spark性能调优之JVM调优通过一张图让你明白以下四个问题 1.JVM GC机制,堆内存的组成 2.Spark的调优为什么会和JVM的调 ...
Spark性能调优之代码方面的优化
Spark性能调优之代码方面的优化 1.避免创建重复的RDD 对性能没有问题,但会造成代码混乱 2.尽可能复用同一个RDD,减少产生RDD的个数 3.对多次使用的RDD进行持久化(ca ...

随机推荐

linux系统编程：进程间通信-fifo
进程间通信-fifo 进程间通信的还有一种方式是fifo. fifo是还有一种管道:有名管道.从名字能够看出.它也是队列. 使用fifo通信前,得先创建fifo $ mkfifo myfifo 随后仅 ...
《3》CentOS7.0+OpenStack+kvm云平台部署—配置Glance
感谢朋友支持本博客,欢迎共同探讨交流.因为能力和时间有限,错误之处在所难免,欢迎指正. 假设转载.请保留作者信息. 博客地址:http://blog.csdn.net/qq_21398167 原博文地 ...
WAS集群系列（2）：数据库连接低级错误——网络连接问题
环境项目点指标 WAS版本号 7.0 应用server操作系统 Windows 2008 应用server系统位数 64bit 数据库server操作系统 CentOS 5.6 数据库版本号 Or ...
18、Cocos2dx 3.0游戏开发找小三之cocos2d-x，请问你是怎么调度的咩
重开发人员的劳动成果,转载的时候请务必注明出处:http://blog.csdn.net/haomengzhu/article/details/30478251 Cocos2d 的一大特色就是提供了事 ...
BZOJ 1003 [ZJOI2006]物流运输trans SPFA+DP
题意:链接方法:SPFA+DP 解析:挺好的题目.因为数据范围较小所以用这样的方式能够搞,只是也是挺不好想的. 我们定义cost(i,j)表示从第i天走到第j天运用同一种方式的最小花费,然后因为数据 ...
FiddlerCoreAPI开发（二）截获HTTPS流量
上一篇文章简单简单分析了fiddlercore自带样例的代码,本篇文章进入主题,介绍如何使用fiddlercore截获HTTPS流量. 当时学习完样例代码后,我觉得结合注释来抓HTTPS的包应该也很简 ...
OpenTK教程-0序言
记得很久之前,我写过一个基于.NET的3D开发框架/工具比较.当时选定的技术是WPF.但是随着项目发展,需要处理的图形数量越来越多,基于WPF的处理起来性能有问题,最后还是使用了基于OpenTK的解决 ...
.net 裁剪图片（不压缩）
命名空间: using System.Drawing; using System.Drawing.Imaging; /// <summary> /// 生成图片缩略文件 /// </ ...
将php项目打包docker镜像
简介:有时候我们需要将php的项目打包成docker镜像,这里介绍下思路:我们php和apache结合一个镜像实现php项目的访问,mysql是一个单独的镜像步骤: 1.首先我们在本地测试好自己的 ...
Linux文件系统概述
Unix文件是以字节序列组成的信息载体(container),内核不解释文件的内容. Linux文件系统中的文件是数据的集合,文件系统不仅包含着文件中的数据而且还有系统的结构,所有Linux用户和程序 ...

[Spark性能调优] 源码补充 : Spark 2.1.X 中 Unified 和 Static MemoryManager