LevelDb的基本结构如下:

由六大部分组成:

一、MemTable,用户写入和读取的直接对象,

二、Immutable MemTable,用户状态写入的对象写满的MemTable之后会转为ImmutableMemTable,之后会写sst文件,

三、LOG文件,是WAL机制的部分,用户在写入MemTable的时候会先写入LOG文件,用来进行灾备恢复

四、SST文件,在磁盘上的文件,基本是一种KV结构,进行state持久存储的地方,

五、Current文件,有多个manifest文件,current文件指明了最新的manifest文件是哪个,

六、Manifest文件,记载了所有的sst文件的level层级,以及响应的key的范围分布。

杂记如下:

leveldb Compaction 会在以下场景触发:

DB::Open时检查条件满足时,触发
DB::Write操作里的MakeRoomForWrite的条件满足时,触发
DB::Get操作时,在内存中没有命中且Seek文件超过阈值时,触发
DB::CompactRange时,触发

Compaction带来的问题
写放大
从上面的compaction可以得知,当一个key频繁更新时,每次compaction在该key上都会导致重叠,
因此会 发生一次该key的搬移,导致实际的磁盘写量大于用户调用的写量。

读放大
leveldb是以文件为单位读取的,当Get一个已经被compaction搬移到深层次的key时,会发生多次文件的 读取,
导致实际的磁盘读量大于用户Get的调用量。同时compaction时也会产生大量的读取操作。

level的文件大小的限制
level0 有4个文件 每个1M 是4M
level1 十倍之 10M
level2 十倍之 100M
level3 1000M
level4 10G
level5 100G
level6 无限制
每一层文件的大小限制 为了控制每一层的文件是数量 进而优化每次major compaction的参与文件的多少和大小 优化效率

minor compaction的优先级高于major compaction 当需要进行minor compaction的时候发现有major compaction 则暂停major compaction
以进行minor compaction 因为minor compaction会影响到数据的插入

minor compaction
从memTable到sstFile 需要选择Level 根据memTable中的key的范围 如果和上层level中的数据有overlap 则直接合并到上层 但是
一般会是L1或者L2 这个也有参数控制
如果是比较新的key 则直接都生成在level0里面

Major compaction
从level0到上层level之间的合并
1.选择一个L层的文件,选择L+1层的所有key重叠的文件,与L层的文件做多路归并排序,生成新的文件到L+1层,原始的文件被删除。
记录L层文件的endKey
2.下次合并的时候,在L层中选择上次记录的endKey的近邻的key的文件用来合并。
3.如果L层的文件,没有和L+1层的有overlap,则直接更改指针,不发生文件的读写
4.选择L0层的文件时,会首先确定一个key range,但是由于L0的key在文件之间会有重叠,则需要选择该范围之内的
所有L0层的文件参与合并。
5.积分计算 计算每一层的积分 如果积分小于1 则不发生合并 如果大于1 则选择最大的一个 进行合并

寻找输入文件
正常合并 轮询选择 记录上一次的最大key 下次选择此key之后的文件
seek失效合并 则输入文件即该失效文件

sstFile
data block 固定大小存储kv数据
meta block 存储kv对应的filter 即bloom filter 可能存在多个filter 目前就一个
metaindex block 指向meta block的索引 目前就一个filter 所以也就一行记录
index block 指向data block的索引 包含data block的偏移和大小以及包含的key的范围
footer 指向索引的索引 包含metaindex和index

读取的时候,根据metaFile定位到sstFile,读取footer定位到block,进而读取metaBlock判断是否存在,如果存在再读取dataBlock

cache
table cache 缓存文件指针 metablock index-block
block cache 缓存数据 datablock indexblock

snapshot
insert sequence number 对应每一次的插入 亦即对应到一个key上
做快照 就只是保存一下这个number
读快照的时候 就需要读取所有小于这个Number的数据即可

LevelDB速记的更多相关文章

  1. leveldb 性能、使用场景评估

    最近有个业务写远远大于读,读也集中在最近写入,这不很适合采用leveldb存储么,leveldb业界貌似ssdb用得挺广,花了两天时间就ssdb简单做下测试,以下总结. ssdb 是leveldb的r ...

  2. HTML5特性速记图

    今天推荐大家一张HTML5特性速记图,供大家平时查阅,也可以打印放在电脑旁帮助速记.速查.此图笔者收集于网络图片.

  3. Golang语法与代码格式速记【转】

    // Description: Golang语法与代码格式速记 // Author: cxy // Date: 2013-04-01 // Version: 0.3 // TODO 说明 // TOD ...

  4. leveldb源码分析--SSTable之Compaction

    对于compaction是leveldb中体量最大的一部分,也应该是最为复杂的部分,为了便于理解我们首先从一些基本的概念开始.下面是一些从doc/impl.html中翻译和整理的内容: Level 0 ...

  5. leveldb 学习。

    1)大概浏览了leveldb文档的介绍.本想逐步看代码,想想还是自己先实现一个看看如何改进. 2)完成了一个非常丑陋的初版,但是还是比初初版有进步. 3)key value的数据库,不允许有key重复 ...

  6. 解决: org.iq80.leveldb.DBException: IO error: C:\data\trie\000945.sst: Could not create random access file.

    以太坊MPT树的持久化层是采用了leveldb数据库,然而在抽取MPT树代码运行过程中,进行get和write操作时却发生了错误: Caused by: org.fusesource.leveldbj ...

  7. 用Qt Creator 对 leveldb 进行简单的读写

    #include <iostream> #include <string> #include <leveldb/db.h> #include <boost/l ...

  8. leveldb 学习笔记之VarInt

    在leveldb在查找比较时的key里面保存key长度用的是VarInt,何为VarInt呢,就是变长的整数,每7bit代表一个数,第8bit代表是否还有下一个字节, 1. 比如小于128(一个字节以 ...

  9. leveldb源码学习系列

    楼主从2014年7月份开始学习<>,由于书籍比较抽象,为了加深思考,同时开始了Google leveldb的源码学习,主要是想学习leveldb的设计思想和Google的C++编程规范.目 ...

随机推荐

  1. 安装Chrome插件

    重装系统后重装了Chrome浏览器,想着将自己的东西同步到Chrome上.但是登录谷歌账号要FQ,我又是靠setup插件FQ,但插件又要靠账号同步到本地.形成了死循环. 其实重装系统前我将插件提取了, ...

  2. Laravel 集合的处理

    其中的方法有: $arrs = collect($arr)->collapse()->collapse() //去除最外一层数组,不论最外层数组时否有值,都会去除掉 collect($ar ...

  3. IT类职位常用缩写 SA SD RD PG PM DBA MIS QA Sales

    身为IT民工的基本常识,IT类职位常用缩写 SA (System Analyst) 系统分析师 在软体开发团队中,属于中高阶的基层管理者与领导者.除了须具备优秀的文字.语言沟通能力之外,还要有良好的分 ...

  4. pynlpir + pandas 文本分析

    pynlpir是中科院发布的一个分词系统,pandas(Python Data Analysis Library) 是python中一个常用的用来进行数据分析和统计的库,利用这两个库能够对中文文本数据 ...

  5. 新手学习ARM,对片内ram、SDRAM、NOR FLASH和NAND FLASH启动这几个概念的理解

    片内的ram用来存储启动代码,在2440初始化sdram之前,代码就在片内ram中运行.片内ram装载的是norflash中的内容,即u-boot. uboot放在norflash里,nandflas ...

  6. mybatis报表,动态列与查询参数+行列转换

    这是报表原型,在这张报表中,使用了动态的列与动态查询参数,动态列与动态查询参数全部使用map将参数传入 map参数: //拼接查询时间 for (String month : monthList) { ...

  7. Django的命令操作,python

    忘记时候,查看命令用:python manage.py 1 建立项目的命令: django-admin.py startproject project_name 2 在项目的目录下建立app: dja ...

  8. PHP.40-TP框架商城应用实例-后台15-商品属性与库存量1-不同商品(唯一属性、可选属性),属性类型

    思路: 1.不同商品属于不同的类型,如:手机.服装.电脑等类型 2.不同的类型有不同的属性,其中分为唯一属性和可选属性,如服装:可选属性{尺寸:S,M,L……;颜色:白色,黑色……}唯一属性:材质 首 ...

  9. spring、spring-data-redis整合使用

    一.Redis是一个开源的使用ANSI C语言编写.支持网络.可基于内存亦可持久化的日志型.Key-Value数据库,并提供多种语言的API. 从2010年3月15日起,Redis的开发工作由VMwa ...

  10. 用起来超爽的Maven——入门篇

    你还在为怎样寻找.导入SSH相关依赖包纠结吗? 你还在为没有安装IDE开发工具不能编译.部署.运行项目而纠结吗? 你还在为公司项目目录结构怎样规范而纠结吗? 亲爱的纠结哥,只要你使用了Maven,一切 ...