leveldb源码分析之内存池Arena

转自：http://luodw.cc/2015/10/15/leveldb-04/

这篇博客主要讲解下leveldb内存池，内存池很多地方都有用到，像linux内核也有个内存池。内存池的存在主要就是减少malloc或者new调用的次数，较少内存分配所带来的系统开销。

Arena类采用vector来存储每次分配内存的指针，每一次分配的内存，我们称为一个块block。block默认大小为4096kb。我们可以先看下Arena的模型：

我们来看看源码：首先看下这个类的几个成员变量：

char* alloc_ptr_;//内存的偏移量指针，即指向未使用内存的首地址

size_t alloc_bytes_remaining_;//还剩下的内存数

std::vector<char*> blocks_;//存储每一次分配的内存指针

size_t blocks_memory_;//到目前为止分配的总内存。

构造函数和析构函数：

Arena::Arena() {

blocks_memory_ = 0;

alloc_ptr_ = NULL; // First allocation will allocate a block

alloc_bytes_remaining_ = 0;

}//构造函数初始化总总分配的内存为0，指针偏移量为NULL,剩余内存为0。

vector会调用默认构造函数初始化。

Arena::~Arena() {

for (size_t i = 0; i < blocks_.size(); i++) {

delete[] blocks_[i];

}

}//Arena析构时，只需要把所有的指针指向的内存都delete就可以了。

都说谷歌的C++编程风格是最优美的。leveldb里面的每个类的构造函数都直接初始化所有的属性，这样就不会导致使用为初始化的变量，而且代码很清晰，知道哪些属性被初始化为何值。

接下来分析下Arena内存分配的主要函数。

public:

char* Allocate(size_t bytes);

private:

char* AllocateFallback(size_t bytes);

char* AllocateNewBlock(size_t block_bytes);

Arena对外提供的接口是public里的函数，但是该函数会调用private里的两个函数.我分析内存分配策略。当要分配内存的时候：

如果需求的内存小于剩余的内存，那么直接在剩余的内存分配就可以了；
如果需求的内存大于剩余的内存，而且大于4096/4，则给这内存单独分配一块bytes（函数参数）大小的内存。
如果需求的内存大于剩余的内存，而且小于4096/4，则重新分配一个内存块，默认大小4096，用于存储数据。

针对第二点，按源码的注释是说避浪费太多的剩余空间。我的理解是，如果剩余的内存为1500kb，那么假设有一个内存需求是500kb，一个内存需求是1500kb,则第一个需求可以使用三次才导致进行一次重新内存分配，而第二个只能使用一次就要进行一次重新内存分配。所以leveldb第二条的用意主要还是减少内存分配的次数。

源码如下：

inline char* Arena::Allocate(size_t bytes) {

// The semantics of what to return are a bit messy if we allow

// 0-byte allocations, so we disallow them here (we don't need

// them for our internal use).

assert(bytes > 0);

if (bytes <= alloc_bytes_remaining_) {//需要的内存小于剩余的内存，直接分配，

//移动指针偏移量，减少剩余内存，返回刚分配内存的首位置

char* result = alloc_ptr_;//先保存指针偏移量，用于返回

alloc_ptr_ += bytes;//指针偏移量向上移动bytes个字节

alloc_bytes_remaining_ -= bytes;//剩余内存减少bytes个字节

return result;

}

return AllocateFallback(bytes);//当需求内存大于剩余内存时

}

char* Arena::AllocateFallback(size_t bytes) {

if (bytes > kBlockSize / 4) {//需求内存大于1024kb时

// Object is more than a quarter of our block size. Allocate it separately

// to avoid wasting too much space in leftover bytes.

char* result = AllocateNewBlock(bytes);

return result;

}

// We waste the remaining space in the current block.

alloc_ptr_ = AllocateNewBlock(kBlockSize);//需求内存大于剩余内存，且小于1024时。

alloc_bytes_remaining_ = kBlockSize;

char* result = alloc_ptr_;

alloc_ptr_ += bytes;

alloc_bytes_remaining_ -= bytes;

return result;

}

char* Arena::AllocateNewBlock(size_t block_bytes) {

char* result = new char[block_bytes];//分配内存

blocks_memory_ += block_bytes;//总的内存加上刚分配的内存

blocks_.push_back(result);//添加进内存指针数组

return result;

}

arena还提供了字节对齐内存分配，一般情况是8个字节对齐分配，即内存地址后三位必须为0.我们来看下源码，挺多学问的。

char* Arena::AllocateAligned(size_t bytes) {

//用于判断对齐的大小，我64位电脑sizeof(void*)=8，不大于8，所以对齐大小为8。

const int align = (sizeof(void*) > 8) ? sizeof(void*) : 8;

//用于判断align是否为2的次幂，内存对齐肯定是2的次幂。

assert((align & (align-1)) == 0);

//判断当前的模式，align-1后三位为1，其他都为0，所以指针与align-1做与运算，

//其实就是指针与align求余运算。例如如果地址值为9，9&7，则最后一位为1，9%8=1。

size_t current_mod = reinterpret_cast<uintptr_t>(alloc_ptr_) & (align-1);

//根据当前的模式，算出需要添加的字节数

size_t slop = (current_mod == 0 ? 0 : align - current_mod);

size_t needed = bytes + slop;//原来需求的字节大小，加上为了对齐补充的字节大小

char* result;

if (needed <= alloc_bytes_remaining_) {

result = alloc_ptr_ + slop;

alloc_ptr_ += needed;

alloc_bytes_remaining_ -= needed;

} else {

// AllocateFallback always returned aligned memory

result = AllocateFallback(bytes);

}

assert((reinterpret_cast<uintptr_t>(result) & (align-1)) == 0);

return result;

}

这里边有一个uintptr_t类型，定义在<stddef.h>头文件里，是无符号长整形类型，是typedef unsigned long int 类型，对应有符号类型为typedef long int intptr_t。这种类型是机器指针大小对应,如果32位系统，则uintptr_t也为32位，如果是64位系统，则这个值为64位。

Arena最后一个对外接口是返回这个内存池分配总的内存大小。

size_t MemoryUsage() const {

return blocks_memory_ + blocks_.capacity() * sizeof(char*);

}

Arena内存大小包括分配的内存空间大小和所有指针大小之和。

Arena在memtabla（也就是跳跃链表）使用较多，因为刚插入的内存数据都放在了memtable里。

至此Arena就分析结束了。

leveldb源码分析之内存池Arena的更多相关文章

STL源码分析之内存池
前言上一节只分析了第二级配置器是由多个链表来存放相同内存大小, 当没有空间的时候就向内存池索取就行了, 却没有具体分析内存池是怎么保存空间的, 是不是内存池真的有用不完的内存, 本节我们就具体来分析 ...
Leveldb源码分析--1
coming from http://blog.csdn.net/sparkliang/article/details/8567602 [前言:看了一点oceanbase,没有意志力继续坚持下去了,暂 ...
netty源码分析 - Recycler 对象池的设计
目录一.为什么需要对象池二.使用姿势 2.1 同线程创建回收对象 2.2 异线程创建回收对象三.数据结构 3.1 物理数据结构图 3.2 逻辑数据结构图(重要) 四.源码分析 4.2.同线程获取 ...
v76.01 鸿蒙内核源码分析(共享内存) | 进程间最快通讯方式 | 百篇博客分析OpenHarmony源码
百篇博客分析|本篇为:(共享内存篇) | 进程间最快通讯方式进程通讯相关篇为: v26.08 鸿蒙内核源码分析(自旋锁) | 当立贞节牌坊的好同志 v27.05 鸿蒙内核源码分析(互斥锁) | 同样 ...
Memcached源码分析之内存管理
先再说明一下,我本次分析的memcached版本是1.4.20,有些旧的版本关于内存管理的机制和数据结构与1.4.20有一定的差异(本文中会提到). 一)模型分析在开始解剖memcached关于内存管 ...
leveldb源码分析--SSTable之block
在SSTable中主要存储数据的地方是data block,block_builder就是这个专门进行block的组织的地方,我们来详细看看其中的内容,其主要有Add,Finish和CurrentSi ...
leveldb源码分析--WriteBatch
从[leveldb源码分析--插入删除流程]和WriteBatch其名我们就很轻易的知道,这个是leveldb内部的一个批量写的结构,在leveldb为了提高插入和删除的效率,在其插入过程中都采用了批 ...
leveldb源码分析--Key结构
[注]本文参考了sparkliang的专栏的Leveldb源码分析--3并进行了一定的重组和排版经过上一篇文章的分析我们队leveldb的插入流程有了一定的认识,而该文设计最多的又是Batch的概念 ...
LevelDB源码分析之：arena内存管理
一.原理 arena是LevelDB内部实现的内存池. 我们知道,对于一个高性能的服务器端程序来说,内存的使用非常重要.C++提供了new/delete来管理内存的申请和释放,但是对于小对象来说,直接 ...

随机推荐

轻松搭建CAS 5.x系列(6)-在CAS Server上增加OAuth2.0协议
概述说明 CAS Server默认搭建出来,客户端程序只能按照CAS自身的协议接入.CAS的强大在于,有官方的插件,可以支持其他的协议.本章节就让CAS Server怎么增加OAuth2.0的登录协议 ...
（八）装配Bean（2）
二.在Java类中进行显式的装配显式配置有两种: 1. 一种是在java(本文讲解) 2. 另一种是xml配置文件(第一章有讲) 案例一: 使用java显式装配+@autowired自动装配的方 ...
（六）Struts的简单异常处理
一.异常的分类 1.1 struts中的异常概念 Struts的声明式异常: 不处理异常,将异常交给struts框架来处理. 1.2 局部异常局部异常:异常定义在Action里,异常处理只在这个Ac ...
kong网关命令（一）
上次在虚拟机里安装kong网关后,因为版本(1.4)太高,目前Kong Dashboard无法支持, 后续发现Git上有个开源工具Kong admin ui,下载源码并部署到NGINX. 但是发现使用 ...
VS code C++代码没有自动提示
用了一段时间的VS code,发现一直都没有代码提示,奇了个怪?可能是插件有问题,于是重装C/C++,clang...等插件.结果......没用,
哲学家就餐问题 C语言实现
场景: 原版的故事里有五个哲学家(不过我们写的程序可以有N个哲学家),这些哲学家们只做两件事--思考和吃饭,他们思考的时候不需要任何共享资源,但是吃饭的时候就必须使用餐具,而餐桌上的餐具是有限的,原版 ...
库克谈新iPhone不支持5G的理由，学习一下如何高手怎么应答
库克谈新iPhone不支持5G的理由投递人 itwriter 发布于 2019-09-12 08:41 评论(14) 有1623人阅读原文链接 [收藏] « » 9 月 12 日消息,苹果公司 C ...
python3 多线程和多进程
一.线程和进程 1.操作系统中,线程是CPU调度和分派的基本单位,线程依存于程序中 2.操作系统中,进程是系统进行资源分配和调度的一个基本单位,一个程序至少有一个进程 3.一个进程由至少一个线程组成, ...
2018/7/31-zznuoj-问题 A: A + B 普拉斯【二维字符串+暴力模拟+考虑瑕疵的题意-0的特例】
问题 A: A + B 普拉斯在计算机中,数字是通过像01像素矩阵来显示的,最终的显示效果如下: 现在我们用01来构成这些数字当宝儿姐输入A + B 时(log10(A)<50,log10 ...
python获取本机的IP
转载:https://www.cnblogs.com/whu-2017/p/8986842.html 方法一: 通常使用socket.gethostbyname()方法即可获取本机IP地址,但有时候获 ...

leveldb源码分析之内存池Arena

leveldb源码分析之内存池Arena的更多相关文章

随机推荐

热门专题