玩转Leveldb原理及源码--拙见1

可以说是不知天高地厚。。

可以说是班门弄斧。。

但是，我今天还就这样走了，我喜欢!!!!!!

注：后续文章，限于篇幅，不懂名词都有紫色+下划线超链接，有兴趣，可以查阅；

网上关于Leveldb 的源码剖析啊，解析啊什么的有好多，差不多都是大神级别的在搞，如果我们水平相当，那不如凑一对呗：

既然开始了，哪有停下的道理，先了解一下Levedb的关荣历史、完美现在和光辉的未来：

Leveldb:

1.Leveldb是一个google实现的非常高效的kv数据库，目前能够支持billion级别的数据量了。

在这个数量级别下还有着非常高的性能，主要归功于它的良好的设计，特别是LMS算法。

2.LevelDB
是单进程的服务，性能非常之高，在一台4核Q6600的CPU机器上，

每秒钟写数据超过40w，而随机读的性能每秒钟超过10w。

3.LevelDB
只是一个 C/C++ 编程语言的库（有没有超级感动，哈）

4.Leveldb只是一个语言库，不包含网络服务封装,
所以无法像一般意义的存储服务器(如 MySQL)那样, 用客户端来连接它.

LevelDB
自己也声明, 使用者应该封装自己的网络服务器（这得等我学网络啦）

5.LevelDB具有很高的随机写，顺序读/写性能，但是随机读的性能很一般，

也就是说，LevelDB很适合应用在查询较少，而写很多的场景。

LevelDB应用了LSM （不懂吧，点这里）策略，lsm_tree（不懂吧，点这里）对索引变更进行延迟及批量处理，

并通过一种类似于归并排序的方式高效地将更新迁移到磁盘，降低索引插入开销。

6.key和value都是任意长度的字节数组；

7.entry（即一条K-V记录）默认是按照key的字典顺序存储的，当然开发者也可以重载这个排序函数；

8.提供的基本操作接口：Put()、Delete()、Get()、Batch()；

9.支持批量操作以原子操作进行；

10.可以创建数据全景的snapshot(快照)，并允许在快照中查找数据；

11.可以通过前向（或后向）迭代器遍历数据（迭代器会隐含的创建一个snapshot）；

12.自动使用Snappy压缩数据；

13.可移植性；

以下是百度来的资料加一整理：如果了解，可以略过：

Jeff Dean其人：http://research.google.com/people/jeff/index.html

Google大规模分布式平台Bigtable和MapReduce主要设计和实现者。

Sanjay Ghemawat其人：http://research.google.com/people/sanjay/index.html

Google大规模分布式平台GFS，Bigtable和MapReduce主要设计和实现工程师。

LevelDb就是这两位大神级别的工程师发起的开源项目，简而言之，LevelDb是能够处理十亿级别规模Key-Value型数据持久性存储的C++程序库。正像上面介绍的，这二位是Bigtable的设计和实现者，如果了解Bigtable的话，应该知道在这个影响深远的分布式存储系统中有两个核心的部分：Master Server和Tablet Server。其中Master Server做一些管理数据的存储以及分布式调度工作，实际的分布式数据存储以及读写操作是由Tablet
Server完成的，而LevelDb则可以理解为一个简化版的Tablet Server。

LevelDb有如下一些特点：

首先，LevelDb是一个持久化存储的KV系统，和Redis这种内存型的KV系统不同，LevelDb不会像Redis一样狂吃内存，而是将大部分数据存储到磁盘上。

其次，LevleDb在存储数据时，是根据记录的key值有序存储的，就是说相邻的key值在存储文件中是依次顺序存储的，而应用可以自定义key大小比较函数，LevleDb会按照用户定义的比较函数依序存储这些记录。

再次，像大多数KV系统一样，LevelDb的操作接口很简单，基本操作包括写记录，读记录以及删除记录。也支持针对多条操作的原子批量操作。

另外，LevelDb支持数据快照（snapshot）功能，使得读取操作不受写操作影响，可以在读操作过程中始终看到一致的数据。

除此外，LevelDb还支持数据压缩等操作，这对于减小存储空间以及增快IO效率都有直接的帮助。

LevelDb性能非常突出，官方网站报道其随机写性能达到40万条记录每秒，而随机读性能达到6万条记录每秒。总体来说，LevelDb的写操作要大大快于读操作，而顺序读写操作则大大快于随机读写操作。

玩转Leveldb原理及源码--拙见1的更多相关文章

springmvc工作原理以及源码分析(基于spring3.1.0)
springmvc是一个基于spring的web框架.本篇文章对它的工作原理以及源码进行深入分析. 一.springmvc请求处理流程二.springmvc的工作机制三.springmvc核心源码 ...
LevelDB(v1.3) 源码阅读之 Arena（内存管理器）
LevelDB(v1.3) 源码阅读系列使用 LevelDB v1.3 版本的代码,可以通过如下方式下载并切换到 v1.3 版本的代码: $ git clone https://github.com/ ...
LevelDB(v1.3) 源码阅读之 Slice
LevelDB(v1.3) 源码阅读系列使用 LevelDB v1.3 版本的代码,可以通过如下方式下载并切换到 v1.3 版本的代码: $ git clone https://github.com/ ...
OpenCV学习笔记（27）KAZE 算法原理与源码分析（一）非线性扩散滤波
http://blog.csdn.net/chenyusiyuan/article/details/8710462 OpenCV学习笔记(27)KAZE 算法原理与源码分析(一)非线性扩散滤波 201 ...
ConcurrentHashMap实现原理及源码分析
ConcurrentHashMap实现原理 ConcurrentHashMap源码分析总结 ConcurrentHashMap是Java并发包中提供的一个线程安全且高效的HashMap实现(若对Ha ...
CopyOnWriteArrayList实现原理及源码分析
CopyOnWriteArrayList是Java并发包中提供的一个并发容器,它是个线程安全且读操作无锁的ArrayList,写操作则通过创建底层数组的新副本来实现,是一种读写分离的并发策略,我们也可 ...
Spark源码剖析（七）：Job触发流程原理与源码剖析
引言我们知道在application中每存在一个action操作就会触发一个job,那么spark底层是怎样触发job的呢?接下来我们用一个wordcount程序来剖析一下job的触发机制. 解析w ...
Spark源码剖析（八）：stage划分原理与源码剖析
引言对于Spark开发人员来说,了解stage的划分算法可以让你知道自己编写的spark application被划分为几个job,每个job被划分为几个stage,每个stage包括了你的哪些代码 ...
HashMap和ConcurrentHashMap实现原理及源码分析
HashMap实现原理及源码分析哈希表(hash table)也叫散列表,是一种非常重要的数据结构,应用场景及其丰富,许多缓存技术(比如memcached)的核心其实就是在内存中维护一张大的哈希表, ...

随机推荐

【BZOJ3282】Tree （Link-Cut Tree）
[BZOJ3282]Tree (Link-Cut Tree) 题面 BZOJ权限题呀,良心luogu上有题解 Link-Cut Tree班子提最近因为NOIP考炸了学科也炸了时间显然没有以后 ...
POJ 3167 Layout（差分约束）
题面 Like everyone else, cows like to stand close to their friends when queuing for feed. FJ has N (2 ...
js实现对树深度优先遍历与广度优先遍历
深度优先与广度优先的定义首先我们先要知道什么是深度优先什么是广度优先. 深度优先遍历是指从某个顶点出发,首先访问这个顶点,然后找出刚访问这个结点的第一个未被访问的邻结点,然后再以此邻结点为顶点,继续 ...
css学习の第一四弹—代码格式简写归纳
一.代码简写方式归纳 >>1.盒模型代码简写: 外边距(margin).内边距(padding)和边框(border)设置上下左右四个方向的边距是按照顺时针方向设置的:上右下左 1.如果t ...
RHEL7 网卡绑定
//bond(主要用于6系统) nmcli connection add type bond mode balance-rr con-name bond0 ifname bond0 ipv4.met ...
Hadoop集群环境安装
转载请标明出处: http://blog.csdn.net/zwto1/article/details/45647643: 本文出自:[zhang_way的博客专栏] 工具: 虚拟机virtual ...
Lastpass——密码管理工具
Lastpass是一个优秀的在线密码管理器和页面过滤器,采用了强大的加密算法,自动登录/云同步/跨平台/支持多款浏览器. 我之前一直都在使用这个工具,不过都是在浏览器上以扩展的方式使用,在火狐浏览器上 ...
windows下大文件SQL导入问题
今天遇到了一个比较棘手的问题,SQL文件太大,导入数据库时太过于麻烦,超过1G以后nodpad.sublime等编辑器都打不开,这就有了一个比较尴尬的问题. 因为是本地测试所以环境是windows,最 ...
maven依赖大全
1.oracle mysql驱动  <dependency> <groupId>mysql</groupId> &l ...
java 常用正则表达式总结
邮政编码: ^[1-9]\d{5}$ QQ号码: ^[1-9]\d{4,10}$ 或者:[1-9][0-9]{4,11} 邮箱: ^[a-zA-Z_]{1,}[0-9]{0,}@(([a-zA-z0- ...

玩转Leveldb原理及源码--拙见1

玩转Leveldb原理及源码--拙见1的更多相关文章

随机推荐

热门专题