一：Tungsten中到底什么是Page？
1. 在Spark其实不存在Page这个类的。Page是一种数据结构(类似于Stack，List等)，从OS层面上讲，Page代表了一个内存块，在Page里面可以存放数据，在OS中会存放很多不同的Page，当要获得数据的时候首先要定位具体是哪个Page中的数据，找到该Page之后从Page中根据特定的规则(例如说数据的offset和length)取出数据。
到底什么是Spark中的Page呢？
在阅读源码的时候，细致研究MemoryBlock.Java，MemoryBlock代表了一个Page的对象。
2. 其中：Nullable：可以为空。为什么？Page代表了具体的内存区域以及内存里面具体的数据，Page中的数据可能是On-heap的数据，也可能是Off-heap中的数据。如果是On-heap则有对象，但是Off-heap的话就没有对象。所以用@Nullable，将对象设置为空。
其中offset：偏移量。MemoryBlock封装了Off-heap和On-heap。

public MemoryBlock(@Nullable Object obj, long offset, long length) {

  super(obj, offset);

  this.length = length;

}

3. On-heap和Off-heap寻址方式：
On-heap：先找到对象，然后再找索引。
Off-heap：根据地址找到索引。
4. Page可以定位到数据，然后又知道数据的偏移量OffSet之后怎么访问数据？这时候需要length，但是length并不知道，所以此时的长度设定为固定的，设置固定长度的length。
二：如何使用Page？
1. 在TaskMemoryManager中，通过封装Page来定位数据，定位的时候如果是On-heap的话，则先找到对象，然后对象中通过offset来具体定位地址，而如果是Off-heap的话，则直接定位。

逻辑地址：Pagenumber由13个bit组成，51bit组成Offset
如果是On-heap的方式：内存的分配是是由heapMemoryAllocator完成的。

@Override

public MemoryBlock allocate(long size) throws OutOfMemoryError {

  if (shouldPool(size)) {

    synchronized (this) {

      final LinkedList<WeakReference<MemoryBlock>> pool = bufferPoolsBySize.get(size);

      if (pool != null) {

        while (!pool.isEmpty()) {

          final WeakReference<MemoryBlock> blockReference = pool.pop();

          final MemoryBlock memory = blockReference.get();

          if (memory != null) {

            assert (memory.size() == size);

            return memory;

          }

        }

        bufferPoolsBySize.remove(size);

      }

    }

  }

//内存对齐，array里面都是地址，因为GC的时候对象的地址会发生变化，因此就需要

//为了获得对象的引用。也就是对象的地址。

  long[] array = new long[(int) ((size + 7) / 8)];

//array里面保存的都是地址，而LONG_ARRAY_OFFSET是偏移量，因此二者就可以定位到绝对地址，然后根据size就可以确定数据。

  return new MemoryBlock(array, Platform.LONG_ARRAY_OFFSET, size);

}

如果是Off-heap的方式：内存的分配是是由UnsafeMemoryAllocator完成的。

@Override

public MemoryBlock allocate(long size) throws OutOfMemoryError {

  long address = Platform.allocateMemory(size);

//对象的引用为null

//address是绝对地址

  return new MemoryBlock(null, address, size);

}

2.  一个关键的问题是如何确定数据呢？这个时候就需要涉及具体的算法。

针对Task是怎么管理内存的？
TaskMemoryManager基于Page的概念屏蔽掉了底层是On-heap或者是Off-heap的概念，使用逻辑地址做指针，通过逻辑地址来具体定位到我们的记录具体在Page中的位置，
逻辑地址的表示：long类型的64bit的一个数字来表示的。

-----------------------------------------------------------------------------------------------

前言

发现目前还没有这方面的文章，而自己也对这块比较好奇，所以就有了这篇内容。

分析方式基本是自下而上，也就是我们分析的线路会从最基础内存申请到上层的使用。我们假设你对sun.misc.Unsafe 的API有一些最基本的了解。

in-heap 和 off-heap (MemoryAllocator)

首先我们看看 Tungsten 的 MemoryAllocator

off-heap => org.apache.spark.unsafe.memory.UnsafeMemoryAllocator

in-heap => org.apache.spark.unsafe.memory.HeapMemoryAllocator

off-heap 获取内存很简单：

long address = Platform.allocateMemory(size);

这样就拿到内存的地址了。这是一个绝对地址，64bit 应该够大。注意，所有的内存都需要8byte对齐。

in-heap 则是维护了一个long类型数组：

 long[] array = new long[(int) (size / 8)];

然后会拿到 Platform.LONG_ARRAY_OFFSET 的地址，以及array对象的所处的相对地址，这样就能拿到一个绝对地址了，并且进行操作了。in-heap的对象有个特点，如果发生了GC,地址可能会变化，所以我们需要一直持有array的引用。

不管 off-heap,in-heap 最终其实都是地址的管理，所以我们抽象出了一个类来描述这个信息。

 org.apache.spark.unsafe.memory.MemoryBlock

一共有四个属性：

obj  如果是off-heap,则为null。否则则为一个array数组

offset 如果是off-heap 则为绝对偏移量，否则为  Platform.LONG_ARRAY_OFFSET

pageNumber 

length 申请的内存的长度，这个in/off-heap 是一致的。

内存管理器(MemoryManager)

实际的内存管理放在了两个层次：

org.apache.spark.unsafe.memory.ExecutorMemoryManager

org.apache.spark.unsafe.memory.TaskMemoryManager

我们先分析下他们的关系，TaskMemeoryManager是针对每个Task而言的，但是这些Task都是运行在一个JVM实例上，对应的是Executor,所以内存应该由ExecutorMemoryManager统一进行管理。但是每个task需要交互，所以就让TaskMemeoryManager来进行这种交互。这是他们的分工，设计的很漂亮。

ExecutorMemoryManager

我们先分析下ExecutorMemoryManager，该类根据你的配置，决定是使用什么样的MemoryAllocator，默认是in-heap。你当然也可以设置啦，通过：

 spark.unsafe.offHeap=true

来进行开启off-heap 模式。

另外，如果发现你是在使用in-heap模式，则ExecutorMemoryManage 会维护一个MemoryBlock的池子，对象池，大家应该很熟悉了。那为啥只有in-heap模式有池子呢？那是因为in-heap 需要申请long[] 数组，维护一个池子，就不用到heap里反复去做申请动作了。

该类有两个核心方法：

 MemoryBlock allocate(long size)

 void free(MemoryBlock memory)

看名字就知道含义了：申请内存和释放内存。内存的单元是MemoryBlock,逻辑上是Page的概念。

TaskMemeoryManager

这个会复杂些。然而，其实也没多复杂，好吧我又开始犯话唠了毛病了(O(∩_∩)O)。

为了统一对in-heap,off-heap进行建模，避免上层应用要自己区分自己处理的是in-heap还是off-heap内存块,所以这个时候就提出了一个Page的概念，并且使用逻辑地址来做指针，通过这个逻辑地址可以定位到特定一条记录在MemoryBlock的位置。

那么逻辑地址怎么表示呢？答案是用一个Long类型(64-bit)来表示。任何一条记录的位置都可以用一个Long来记录。

我们先来分析复杂的，in-heap模式：

[13-bit page num][54-bit offset]

这样就能可以表示8192个page。一个Page对应一个MemoryBlock。然后54-bit 可以表示Pb级别的，也就是说这个MemoryBlock可以是超级大的。

不过如果你还记得前文提到的in-heap模式里使用了一个long[]数组作为数据存储的，那么long的长度最大被限制为 Int的最大值，2^32 * 8，也就是32GB。然后所有的Page加起来，大约35个TB。足够大了其实。

当然这里是这里的限制，在上层里，比如shuffle，可能又会有其他的限制，导致能表示的内存会更小些。这个后续的文章我会进一步阐述。

申请一个Page的流程为：

申请到空闲的Page number号
进行实际的内存分配，得到一个MemoryBlock
将Page number 赋给MemoryBlock

另外这个类也提供了一个不使用Page管理的方法申请内存，然后通过 allocatedNonPageMemory 对象进行追踪。

得到MemoryBlock，就代表我们真的拿到了内存，现在我们还要做一件事情，就是把一个记录用一个long类型表示出来,TaskMemoryManager 提供了encodePageNumberAndOffset(MemoryBlock page, long offsetInPage) 方法进行编码，编码的方式就是其那面提到的：

  [13-bit page num][54-bit offset]

内部具体的就是一些位操作了。对应的还有各种decode方法。

你会好奇，只有offset,怎么知道一条记录的长度的？这个长度应该也要存储，才能还原回一条信息吧？

目前基本的做法是从offset开始，前四个字节来表示这条记录的长度，然后后面放具体的字节数组。为了解释这个问题，我从UnsafeShuffleExternalSorter类里扣了一段代码出来：

获得这条记录的逻辑地址，也就是一个64-bit的编码

final long recordAddress =  taskMemoryManager.encodePageNumberAndOffset(dataPage, dataPagePosition);

//dataPageBaseObject 其实就是数组对象的地址，然后以他为基准， 在dataPagePosition 处写入一个int类型数据，这个就是内容的长度。实际的内容就会放到这个位置之后

Platform.putInt(dataPageBaseObject, dataPagePosition, lengthInBytes);

//最后把数据要拷贝的实际的内存中，就需要多要4个字节了。所以这里要加回来

dataPagePosition += 4;

Platform.copyMemory(  recordBaseObject, recordBaseOffset, dataPageBaseObject, dataPagePosition, lengthInBytes);

上面分析的都是in-heap。那off-heap呢？
整个流程也是一致的。区别在于 off-heap拿到的是绝对地址，不是某个页的偏移量，为了统一处理，在进行编码的时候，我们要通过下面的公式重新算off-heap 在page中的相对位置：

   offsetInPage -= page.getBaseOffset();

这里，page.getBaseOffset()是page对应的内存块的起始位置，也就是MemoryBlock的offset变量。如果你还记得上面off-heap申请MemoryBlock的方式，这个就是一开始拿到的偏移量。

这样就拿到相对于MemoryBlock的相对地址了，处理起来就可以和in-heap一致了。

解析的时候，就是反过来就行了，重新得到实际的绝对地址，然后类似in-heap,往前四个字节写长度，后面写实际的内容。

总结

我们看到，Spark Tungsten中，内存管理机制其实还是比较简洁明了的。了解这个本身可能用处不是很大，对于实际上层的应用，权当做好玩吧。

Spark Tungsten in-heap / off-heap 内存管理机制--待整理的更多相关文章

memcached内存管理机制[未整理]
memcached默认采用的是Slab Allocator的机制分配管理内存的,在此之前,内存的分配是通过对所有的记录简单地进行malloc和free来进行的,但这种方式容易造成很多内存碎片,加重操作 ...
Spark内存管理机制
Spark内存管理机制 Spark 作为一个基于内存的分布式计算引擎,其内存管理模块在整个系统中扮演着非常重要的角色.理解 Spark 内存管理的基本原理,有助于更好地开发 Spark 应用程序和进行 ...
Spark 1.6以后的内存管理机制
Spark 内部管理机制 Spark的内存管理自从1.6开始改变.老的内存管理实现自自staticMemoryManager类,然而现在它被称之为"legacy". " ...
深入了解C#系列：谈谈C#中垃圾回收与内存管理机制
今天抽空来讨论一下.Net的垃圾回收与内存管理机制,也算是完成上个<WCF分布式开发必备知识>系列后的一次休息吧.以前被别人面试的时候问过我GC工作原理的问题,我现在面试新人的时候偶尔也会 ...
Java虚拟机内存管理机制
自动内存管理机制 Java虚拟机(JVM)在执行Java程序过程中会把它所管理的内存划分为若干个不同的数据区域.这些区域都有各自的用途,以及创建和销毁的时间,有的区域随着虚拟机进程的启动而存在,有的区 ...
C#中垃圾回收与内存管理机制
今天抽空来讨论一下.Net的垃圾回收与内存管理机制,也算是完成上个<WCF分布式开发必备知识>系列后的一次休息吧.以前被别人面试的时候问过我GC工作原理的问题,我现在面试新人的时候偶尔也会 ...
浅析java内存管理机制
内存管理是计算机编程中的一个重要问题,一般来说,内存管理主要包括内存分配和内存回收两个部分.不同的编程语言有不同的内存管理机制,本文在对比C++和Java语言内存管理机制的不同的基础上,浅析java中 ...
linux与C内存管理机制
转自知乎专栏:https://zhuanlan.zhihu.com/p/51855842?utm_source=wechat_session&utm_medium=social&utm ...
JVM自动内存管理机制——Java内存区域（下）
一.虚拟机参数配置在上一篇<Java自动内存管理机制——Java内存区域(上)>中介绍了有关的基础知识,这一篇主要是通过一些示例来了解有关虚拟机参数的配置. 1.Java堆参数设置 a) ...

随机推荐

navigationBar
1.navigationBar导航条可以看做是self.navigationController导航控制器的一个属性. 通过self.navigationController.navigationBa ...
sqlserver的疑难杂症解析
1.电脑修改ip后ssms通过ip访问失败通过计算机名可以访问成功,但通过修改后的ip访问却失败了! 解决方法:打开Sql Server Configuration Manager -> SQ ...
Flume之核心架构深入解析
我们一起来了解Source.Channel和Sink的全链路过程. 一.Flume架构分析这个图中核心的组件是: Source,ChannelProcessor,Channel,Sink.他们的关系 ...
BASE64Encoded() 方法报错说方法未定义
代码: String enParams = new BASE64Encoder().encode(strParams.getBytes()); 出错,显示方法未定义解决方法:项目右键——>pr ...
BZOJ4654/UOJ223 [Noi2016]国王饮水记
本文版权归ljh2000和博客园共有,欢迎转载,但须保留此声明,并给出原文链接,谢谢合作. 本文作者:ljh2000 作者博客:http://www.cnblogs.com/ljh2000-jump/ ...
语音03_TTS_C#示例代码
参考网址: (1)TTS-零基础入门-10分钟教你做一个语音功能 http://blog.csdn.net/u010176014/article/details/47326413 (2).TTS-零基 ...
(转) Nova是如何统计OpenStack资源
引言运维的同事常常遇到这么四个问题: Nova 如何统计 OpenStack 计算资源? 为什么 free_ram_mb, free_disk_gb 有时会是负数? 即使 free_ram_mb, ...
将Sql2008的数据库转到2005
今天碰到一个特别伤心的事情. 事情的起因是这样的,现在我负责评教系统的维护工作.由于中途服务器转迁,迁移之前数据库版本是2005,而现在的服务器版本是2008R2的.在这个过程并没有发生什么问题. 问 ...
Spring Boot入门——JPA
JPA最大的特点就是可以根据@Entity自动创建你数据库表,用户只需要声明持久层的接口,不需要实现该接口 1.JPA概念 JPA全称Java Persistence API,JPA通过JDK5.0注 ...
《Advanced Bash-scripting Guide》学习（五）：检查一个可执行文件是否存在
本文所选的例子来自于<Advanced Bash-scripting Gudie>一书,译者杨春敏黄毅 ABS书上的例子是这样的: #!/bin/bash echo hello;ech ...

Spark Tungsten in-heap / off-heap 内存管理机制--待整理

前言