LSM树存储模型
----《大规模分布式存储系统:原理解析与架构实战》读书笔记
之前研究了Bitcask存储模型,今天来看看LSM存储模型,两者尽管同属于基于键值的日志型存储模型。可是Bitcask使用哈希表建立索引,而LSM使用跳跃表建立索引。这一区别导致了两个存储系统的构造出现明显的分化。为此,我还先去捣腾了一番跳跃表的实现.今天算是进入了正题。
LSM的结构
LSM的基本思想是将改动的数据保存在内存,达到一定数量后在将改动的数据批量写入磁盘,在写入的过程中与之前已经存在的数据做合并。同B树存储模型一样,LSM存储模型也支持增、删、读、改以及顺序扫描操作。LSM模型利用批量写入攻克了随机写入的问题,尽管牺牲了部分读的性能,可是大大提高了写的性能。
MemTable
LSM本身由MemTable,Immutable MemTable,SSTable等多个部分组成,当中MemTable在内存,用于记录近期改动的数据,一般用跳跃表来组织。当MemTable达到一定大小后,将其冻结起来变成Immutable
MemTable,然后开辟一个新的MemTable用来记录新的记录。而Immutable MemTable则等待转存到磁盘。
Immutable MemTable
所谓Immutable MemTable,即是仅仅能读不能写的内存表。内存部分已经有了MemTable,为什么还要使用Immutable MemTable?个人觉得其原因是为了不堵塞写操作。由于转存的过程中必定要保证内存表的记录不变,否则假设新插入的记录夹在两条已经转存到磁盘的记录中间,处理上会非常麻烦,转存期间势必要锁住全表,这样一来就会堵塞写操作。所以不如将原有的MemTable变成仅仅读Immutable MemTable,在开辟一个新的MemTable用于写入,即简单,又不影响写操作。
SSTable
SSTable是本意是指有序的键值对集合( a set of sorted key-value pairs )。是一个简单实用的集合,正如它的名字一样,它存储的就是一系列的键值对。当文件较大的时候,还能够为其建立一个键-值的位置的索引,指明每一个键在SSTable文件里的偏移距离。这样能够加速在SSTable中的查询。(当然这一点是可选的,同一时候让我想去了Bitcask模型中hint文件,通过记录 键-值的位置 ,来加速索引构建)
使用MemTable和SSTable这两个组件,能够构建一个最简单的LSM存储模型。这个模型与Bitcask模型相比,不存在启动时间长的问题,可是这个模型的读性能很的差,由于一但在MemTable找不到对应的键,则须要在依据SSTable文件生成的时间,从近期到较早在SSTable中寻找,假设都不存在的话,则会遍历全然部的SSTable文件。
假设SSTable文件个数非常多或者没有建立SSTable的文件内索引的话,读性能则会大大下降。
除了在对SSTable内部建立索引外,还能够使用Bloom Fileter,提高Key不在SSTable的判定速度。相同,定期合并旧的SSTable文件,在降低存储的空间的同一时候,也能提高读取的速度。以下这幅图非常好的描写叙述了在LSM的大部分结构和操作
LevelDB怎样优化读性能
Leveldb是一个轻量级的,高速的以存储为目的的key-value存储引擎。其使用的正是LSM存储模型。我们能够看看LevelDB是怎样来优化读性能的。在LevelDB中,存在一种元信息文件MANIFEST,用于记录leveldb的元信息,比方DB使用的Comparator名,以及各SSTable文件的管理信息:如Level层数、文件名称、最小key和最大key等等。相比而言,元信息文件而SSTable文件的数目成正比,一般来说不会太多,是能够加载内存的,因此Level能够通过查询元信息,从而推断哪些文件里存在我们须要的Key相应的记录,降低SSTable文件读取次数。此外,LevelDB的合并操作Compaction是分层次进行的,每一层都有多个SSTable文件,每次合并后除了Level0和内存的MemTable,Immutable
MemTable中会有反复的键值外,LevelN(N>=1)的各层内部的SSTable文件不会再有反复的键值。同一时候,假设在Level N 层读到了数据,那么就不须要再往后读Level N+1,Level N+2等层的数据了.由于Level N层的数据总是比Level N+1等层的数据更“新奇”。
实现一个简单的LSM存储模型
依据上面讲述的原理,实现了一个简单的LSM模型(https://github.com/Winnerhust/Code-of-Book/blob/master/Large-Scale-Distributed-Storage-System/lsm_tree.py)。这个模型也内存表为一个跳跃表,SSTable就是简单的有序键值对集合,没有SSTable内部使用索引,没有使用Bloom过滤器。事实上能就是将我之前的Bitcask模型进行了简单的改造:
- 将原来的哈希表换成了跳跃表;
- 原来读取记录全然依赖哈希表,如今假设在跳跃表中没有的话,就去读取文件SSTable文件里的数据,依据文件编号从大到小进行,编号越大,表示数据越新;
- 去掉了载入数据的功能(LSM不须要);
简单起见,没有完毕对范围扫描的支持,只是内存表和SSTable都是有序的,因此这个也不是非常难。
欢迎光临我的站点----蝴蝶忽然的博客园----人既无名的专栏。
假设阅读本文过程中有不论什么问题,请联系作者,转载请注明出处!
LSM树存储模型的更多相关文章
- HBase LSM树存储引擎详解
1.前提 讲LSM树之前,需要提下三种基本的存储引擎,这样才能清楚LSM树的由来: 哈希存储引擎. B树存储引擎. LSM树(Log-Structured Merge Tree)存储引擎. 2. 哈希 ...
- Hash存储模型、B-Tree存储模型、LSM存储模型介绍
每一种数据存储系统,对应有一种存储模型,或者叫存储引擎.我们今天要介绍的是三种比较流行的存储模型,分别是: Hash存储模型 B-Tree存储模型 LSM存储模型 不同存储模型的应用情况 1.Hash ...
- 【转帖】LSM树 和 TSM存储引擎 简介
LSM树 和 TSM存储引擎 简介 2019-03-08 11:45:23 长烟慢慢 阅读数 461 收藏 更多 分类专栏: 时序数据库 版权声明:本文为博主原创文章,遵循CC 4.0 BY-S ...
- MongoDB索引存储BTree与LSM树(转载)
1.为什么 MongoDB 使用B-树,而不是B+树 MongoDB 是一种 nosql,也存储在磁盘上,被设计用在数据模型简单,性能要求高的场合.性能要求高,我们看B-树与B+树的区别: B+树内节 ...
- 面对key数量多和区间查询低效问题:Hash索引趴窝,LSM树申请出场
摘要:Hash索引有两个明显的限制:(1)当key的数量很多时,维护Hash索引会给内存带来很大的压力:(2)区间查询很低效.如何对这两个限制进行优化呢?这就轮到本文介绍的主角,LSM树,出场了. 我 ...
- 平衡二叉树、B树、B+树、B*树、LSM树简介
平衡二叉树是基于分治思想采用二分法的策略提高数据查找速度的二叉树结构.非叶子结点最多只能有两个子结点,且左边子结点点小于当前结点值,右边子结点大于当前结点树,并且为保证查询性能增增删结点时要保证左右两 ...
- LSM存储模型
LSM存储模型 数据库有3种基本的存储引擎: 哈希表,支持增.删.改以及随机读取操作,但不支持顺序扫描,对应的存储系统为key-value存储系统.对于key-value的插入以及查询,哈希表的复杂度 ...
- 关于时间序列数据库的思考——(1)运用hash文件(例如:RRD,Whisper) (2)运用LSM树来备份(例如:LevelDB,RocksDB,Cassandra) (3)运用B-树排序和k/v存储(例如:BoltDB,LMDB)
转自:http://0351slc.com/portal.php?mod=view&aid=12 近期网络上呈现了有关catena.benchmarking boltdb等时刻序列存储办法的介 ...
- 17-看图理解数据结构与算法系列(NoSQL存储-LSM树)
关于LSM树 LSM树,即日志结构合并树(Log-Structured Merge-Tree).其实它并不属于一个具体的数据结构,它更多是一种数据结构的设计思想.大多NoSQL数据库核心思想都是基于L ...
随机推荐
- JAVA card 应用程序开发(七) JAVA 卡数据(永久数据/)时间数据
JAVA 卡对象 JAVA CARD 存储器装置: a. ROM: 永久保存程序和数据,虚拟机,API等待:(Applets它也可以在这里放) b. RAM: 栈数据,暂时对象. ...
- Deploy Oracle 10.2.0.5 on Red Hat Enterprise Linux 6.4
一.Linux系统安装和配置 1.安装系统时选Desktop 2.设置eth0网卡为静态IP,加入子网掩码,网关,DNS.并配置自己主动启动 3.改动/etc/hosts.加入主机名和相应IP 4.禁 ...
- Swift1_关闭
// main.swift // swift1_关闭 // Created by beyond on 15/6/12. // Copyright (c) 2015年 beyond.com All ri ...
- C该结构变化 struct typedef
这几天看代码,看到若干类型的结构,例如下列结构声明: struct book{ string name; int price; int num; }; 此种结构定义结构变量的格式例如以下: ...
- hud 1312 Red and Black
题目: 链接:pid=1312">点击打开链接 题意: DFS搜索 算法: dfs 思路: 简单题 代码: #include<iostream> #include<c ...
- Java - 面向对象(object oriented)计划 详细解释
面向对象(object oriented)计划 详细解释 本文地址: http://blog.csdn.net/caroline_wendy/article/details/24058107 程序包括 ...
- Unity3D Resources TextAsset 正文
一些小的数据,您可以使用txt文字作为一种媒介,被收购.变速箱.更改.记忆力. 实例:User1.2.3.txt,放入 Resources/Data 文件下: 一,Unity3d Resources. ...
- [WebGL入门]四,渲染准备
注意:文章翻译http://wgld.org/,原作者杉本雅広(doxas),文章中假设有我的额外说明,我会加上[lufy:].另外.鄙人webgl研究还不够深入,一些专业词语,假设翻译有误,欢迎大家 ...
- XCL-Charts画一个图(CurveChart)
情节线图与往常不同的是,它是一个比较特殊线位置计算.所以我得到一个单独的类.相同.只需要输入数据源的基类, 加,控制要添加的.你可以画出你自己主动设置按照预期的效果. 代码: //图基类 chart ...
- Eclipse-----jrebel实现jetty热部署
步骤1:下载jrebel将文件解压缩到任意文件夹 步骤2:配置jetty watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvaGVrZXdhbmd6aQ==/f ...