1 概念

LSM = Log Structured Merge Trees

来源于google的bigtable论文。

2 解决问题

传统的数据库如MySql采用B+树存放数据，B+树是一个随机读写的数据结构。我们知道，顺序读写要比随机读写快无数倍，所以需要把数据结构改成顺序读写。

3 应用场景

LSM是当前被用在许多产品的文件结构策略：HBase, Cassandra, LevelDB, SQLite,甚至在mangodb3.0中也带了一个可选的LSM引擎（Wired Tiger 实现的）。

LSM-Tree比较适合的应用场景是：insert数据量大，读数据量和update数据量不高且读一般针对最新数据。

4 实现原理

4.1 基本原理

1、数据按时间和大小分文件存放(sstable文件)。

2、新的修改用Copy-On-Write Tree方式按key缓存在内存(memtable)中，内存中保序。

3、内存达到时间或大小条件后，保存在一个新的文件里(顺序写，速度很快)。

4、对已经保存的文件，不再修改。

5、查询的时候，先查内存，然后依次查各个保存的文件。

6、因为每个文件里的数据都是顺序存放的，所以查询速度较快(二分查找)。

4.2 提升读性能的方案

1、定时触发文件合并操作，删除冗余记录，并减少文件个数，提升查询效率（由于sstable里的记录是顺序存放的，所以合并非常高效(归并算法、顺序读写)）。

2、采用页缓存，减少二分查找的消耗。LevelDB 和 BigTable 是将 block-index 保存在文件尾部，这样查找就只要一次IO操作，如果block-index在内存中。

3、采用布隆过滤器，减少不存在数据的判定逻辑。

4、并行合并。

打个比方，合并操作就是JVM里的GC，在合并的时候，势必会影响其他操作。所以我们用G1的思想，把文件分区域，各个区域分别合并，这样，就可以减少停顿(加锁)的时间，同时也减少了合并文件额外需要的空间。

想想这个结构，类似于一颗新的树，这个树的每个节点是一个文件，每个文件的内容是sstable。

5 优点

1、写性能高。

2、只需要对内存部分加锁，文件不会修改，无需加锁

6 缺点

1、对于频繁大规模改动的场景不好。

7 最佳实践

1、 memtable丢失的问题：需要记录redo日志和恢复时间点，用于重建memtable。

2、

8 参考

LSM存储模型

https://www.cnblogs.com/chenny7/p/4568829.html

LSM 算法的原理是什么？

https://www.zhihu.com/question/19887265

Log Structured Merge Trees (LSM)的更多相关文章

Log Structured Merge Trees(LSM) 算法
十年前,谷歌发表了 “BigTable” 的论文,论文中很多很酷的方面之一就是它所使用的文件组织方式,这个方法更一般的名字叫 Log Structured-Merge Tree. LSM是当前被用在许 ...
Log Structured Merge Trees(LSM) 原理
http://www.open-open.com/lib/view/open1424916275249.html
LSM(Log Structured Merge Trees ) 笔记
目录一.大幅度制约存储介质吞吐量的原因二.传统数据库的实现机制三.LSM Tree的历史由来四.提高写吞吐量的思路 4.1 一种方式是数据来后,直接顺序落盘 4.2 另一种方式,是保证落盘的数 ...
The storage wars: Shadow Paging, Log Structured Merge and Write Ahead Logging
The storage wars: Shadow Paging, Log Structured Merge and Write Ahead Logging previous: Seek, and yo ...
SSTable and Log Structured Storage: LevelDB
If Protocol Buffers is the lingua franca of individual data record at Google, then the Sorted String ...
InfluxDB存储引擎Time Structured Merge Tree——本质上和LSM无异，只是结合了列存储压缩，其中引入fb的float压缩，字串字典压缩等
The New InfluxDB Storage Engine: Time Structured Merge Tree by Paul Dix | Oct 7, 2015 | InfluxDB | 0 ...
Log-Structured Merge Tree (LSM Tree)
一种树,适合于写多读少的场景.主要是利用了延迟更新.批量写.顺序写磁盘(磁盘sequence access比random access快). 背景回顾数据存储的两个“极端”发展方向加快读:加索引( ...
Pull后产生多余的log（Merge branch 'master' of ...）
第一步: git reset --hard 73d0d18425ae55195068d39b3304303ac43b521a 第二步: git push -f origin feature/PAC_1 ...
[转][译] 存储引擎原理：LSM
原译文地址:http://www.tuicool.com/articles/qqQV7za http://www.zhihu.com/question/19887265 http://blog.csd ...

随机推荐

double类型转换为int类型四舍五入工具类
package com.qiyuan.util; import java.math.BigDecimal; import java.text.DecimalFormat; public class G ...
开始使用Newbe.Pct-Web自动化测试
前篇介绍了,使用 Newbe.Pct 之前的准备工作.本篇将开始介绍如何使用本项目运行第一个测试用例. 阅前语从本篇开始,读者将会接触到使用一些代码.希望读者不必纠结于语法本身.出现代码的地方都会伴 ...
2<<3=?
public static void main(String[] args) { // TODO Auto-generated method stub System.out.println(" ...
vue权限路由实现方式总结二
之前已经写过一篇关于vue权限路由实现方式总结的文章,经过一段时间的踩坑和总结,下面说说目前我认为比较"完美"的一种方案:菜单与路由完全由后端提供. 菜单与路由完全由后端返回这种 ...
unity 判断平台（安卓，iOS还是编辑器）
两种方式 --------------- C预处理器编译判断 --------------- #if UNITY_IOS // ... iOS项目才会编译 #elif UNITY_ANDROID // ...
AE开发流程
using System;using System.Collections.Generic;using System.ComponentModel;using System.Data;using Sy ...
《Programming iOS 7》读书笔记 - 窗体大小与状态栏
1.从iOS7开始,状态栏开始变为透明的,根识图占领了整个窗体,包括状态栏后面的20像素高的区域,这种样式无法被改变.iOS6的状态栏是不透明的,窗体的尺寸通常会比屏幕的尺寸要小,可以设置窗体的尺寸为 ...
基于 vue+element ui 的cdn网站（多页面，都是各种demo）
前言:这个网站持续更新中...,有网上预览,github上也有源码,喜欢记得star哦,欢迎留言讨论. 网站地址:我的个人vue+element ui demo网站 github地址:yuleGH g ...
java泛型详解（加一点语法糖）
首先请看如下代码: public class Test{ public static void main(String str[]) { Hashtable h =new Hashtable(); h ...
Dubbo安装及其实战1
一.Dubbo安装 (1)安装zk和tomcat yum 安装tomcat 默认路径为 /usr/share/tomcat zookeeper 我这里采用的是使用zookeeper管理的.所以要安装z ...

Log Structured Merge Trees (LSM)