leveldb源码分析--SSTable之TableBuilder

上一篇文章讲述了SSTable的格式以后，本文结合源码解析SSTable是如何生成的。

void TableBuilder::Add(const Slice& key, const Slice& value) {

//如果已经插入过数据，那么要保证当前插入的key > 之前最后一次插入的key，

// SSTable必须是有序的插入数据

if (r->num_entries > ) {

    assert(r->options.comparator->Compare(key, Slice(r->last_key)) > );

  }

//新的block

  if (r->pending_index_entry) {

//找到前一个block和当前key之间的最短的字符串作为block分界Key，作为块索引

    r->options.comparator->FindShortestSeparator(&r->last_key, key);

    r->pending_handle.EncodeTo(&handle_encoding);

    //将找到的shortest key 和encode后的块索引加入索引块中

    r->index_block.Add(r->last_key, Slice(handle_encoding));

    r->pending_index_entry = false;

  }

   //如果使用了filter（leveldb中一般为bloomfilter

  if (r->filter_block != NULL) {

    r->filter_block->AddKey(key);

  }

//记录最后一次插入的key，插入数量，添加的数据块中

  r->last_key.assign(key.data(), key.size());

  r->num_entries++;

  r->data_block.Add(key, value);

//如果当前已插入的大小达到设定的block阈值，将block写到数据文件中

  const size_t estimated_block_size = r->data_block.CurrentSizeEstimate();

  if (estimated_block_size >= r->options.block_size) {

    Flush();

  }

}

函数Flush()主要是作一些基本的判断以后调用WriteBlock将数据写入文件并刷到磁盘，然后为下一个block新建一个filter段。仔细看看WriteBlock

void TableBuilder::WriteBlock(BlockBuilder* block, BlockHandle* handle) {

//调用block的Finish将block组码为一个内存段，block_builder的内容稍后分析

  Slice raw = block->Finish();

  // 根据压缩类型压缩

  switch (type) {

    case kNoCompression:

      block_contents = raw;

      break;

    case kSnappyCompression: {

      std::string* compressed = &r->compressed_output;

//如果压缩后的大小比原始大小的7/8小（压缩率12.5%以上），则压缩，否则写入原始数据

      if (port::Snappy_Compress(raw.data(), raw.size(), compressed) &&

          compressed->size() < raw.size() - (raw.size() / 8u)) {

        block_contents = *compressed;

      } else {

        block_contents = raw;

        type = kNoCompression;

      }

      break;

    }

  }

//将内容写入文件，格式为（block_data，type，crc）

  WriteRawBlock(block_contents, type, handle);

}

Status TableBuilder::Finish() 将当前SSTable的数据写完以后的一些Meta信息的写入，也即数据文件的管理信息的写入，这一部分数据是SSTable中非常关键的一部分数据，我们来看他的写入过程。

Status TableBuilder::Finish() {

  //先将data_block内容写到文件

  Flush();

  // 写filterblock也即为Metablock记录的filter信息，具体分析稍后再filterblock中专门分析

  if (ok() && r->filter_block != NULL) {

    WriteRawBlock(r->filter_block->Finish(), kNoCompression,

                  &filter_block_handle);

  }

  // 写入metablock的index，包含一个key=filter.filter名，value=开始的filter_block的handle

  if (ok()) {

    BlockBuilder meta_index_block(&r->options);

    if (r->filter_block != NULL) {

      std::string key = "filter.";

      key.append(r->options.filter_policy->Name());

      std::string handle_encoding;

      filter_block_handle.EncodeTo(&handle_encoding);

     meta_index_block.Add(key, handle_encoding);

    }

    // 写入文件中

    WriteBlock(&meta_index_block, &metaindex_block_handle);

  }

  // 写data_block的索引块，之前每个data_block会取一个FindShortestSeparator作为key，

  // value为该block的block_handle，最后一块的key为FindShortSuccessor

  if (ok()) {

    if (r->pending_index_entry) {

      r->options.comparator->FindShortSuccessor(&r->last_key);

      std::string handle_encoding;

      r->pending_handle.EncodeTo(&handle_encoding);

      r->index_block.Add(r->last_key, Slice(handle_encoding));

      r->pending_index_entry = false;

    }

    WriteBlock(&r->index_block, &index_block_handle);

  }

  // 写footer块，包括了MetaIndex block和Indexblock 的BlockHandle，以及填充区和一个magic数字

  if (ok()) {

    Footer footer;

    footer.set_metaindex_handle(metaindex_block_handle);

    footer.set_index_handle(index_block_handle);

    footer.EncodeTo(&footer_encoding);

    r->status = r->file->Append(footer_encoding);

    if (r->status.ok()) {

      r->offset += footer_encoding.size();

    }

  }

  return r->status;

}

知道了table_builder的各个函数的处理流程以后，我们自然会想这些函数是在什么地方调用的呢？什么地方初始化的呢？通过阅读代码我们可以知道build SSTable都是在compaction的时候进行的，为compact memtable和SSTable的时候都会调用到。其中compact memtable是在builder.cc的BuildTable中，而compact SSTable则是在DoCompactionWork中。BuildTable逻辑简单，这里就不再进行解释，推荐读者先阅读这个流程，以认识生成一个SSTable 的过程。而DoCompactionWork由于涉及到更多的compaction相关的内容，这个我们在后面解释compaction的时候再专门介绍。

leveldb源码分析--SSTable之TableBuilder的更多相关文章

leveldb源码分析--SSTable之block
在SSTable中主要存储数据的地方是data block,block_builder就是这个专门进行block的组织的地方,我们来详细看看其中的内容,其主要有Add,Finish和CurrentSi ...
LevelDB源码分析-sstable的Block
sstable中的Block(table/block.h table/block.cc table/block_builder.h table/block_builder.cc) sstable中的b ...
leveldb源码分析--SSTable之Compaction
对于compaction是leveldb中体量最大的一部分,也应该是最为复杂的部分,为了便于理解我们首先从一些基本的概念开始.下面是一些从doc/impl.html中翻译和整理的内容: Level 0 ...
leveldb源码分析--SSTable之逻辑结构
SSTable是leveldb 的核心模块,这也是其称为leveldb的原因,leveldb正是通过将数据分为不同level的数据分为对应的不同的数据文件存储到磁盘之中的.为了理解其机制,我们首先看看 ...
Leveldb源码分析--1
coming from http://blog.csdn.net/sparkliang/article/details/8567602 [前言:看了一点oceanbase,没有意志力继续坚持下去了,暂 ...
leveldb源码分析--WriteBatch
从[leveldb源码分析--插入删除流程]和WriteBatch其名我们就很轻易的知道,这个是leveldb内部的一个批量写的结构,在leveldb为了提高插入和删除的效率,在其插入过程中都采用了批 ...
leveldb源码分析--Key结构
[注]本文参考了sparkliang的专栏的Leveldb源码分析--3并进行了一定的重组和排版经过上一篇文章的分析我们队leveldb的插入流程有了一定的认识,而该文设计最多的又是Batch的概念 ...
leveldb源码分析--日志
我们知道在一个数据库系统中为了保证数据的可靠性,我们都会记录对系统的操作日志.日志的功能就是用来在系统down掉的时候对数据进行恢复,所以日志系统对一个要求可靠性的存储系统是极其重要的.接下来我们分析 ...
leveldb源码分析之Slice
转自:http://luodw.cc/2015/10/15/leveldb-02/ leveldb和redis这样的优秀开源框架都没有使用C++自带的字符串string,redis自己写了个sds,l ...

随机推荐

Android_view的生命周期
onFinishInflate() 当View中所有的子控件均被映射成xml后触发 onMeasure( int , int ) 确定所有子元素的大小 onLayout( boolean , int ...
全网最详细的Windows系统里Oracle 11g R2 Database（64bit）安装后的初步使用（图文详解）
不多说,直接上干货! 前期博客全网最详细的Windows系统里Oracle 11g R2 Database(64bit)的下载与安装(图文详解) 命令行方式测试安装是否成功 1) 打开服务(cm ...
理解 Generator 的执行
Generator & yield 开局官宣:sec-generatoryield,这是对yield的介绍. 同样巴拉巴拉列了9条,将以上链接中的说明简化成3条: 1. 在GeneratorF ...
TCP滑动窗口
TCP利用滑动窗口实现流量控制基本的数据单位不是数据段,而是字节滑动窗口本质上是描述接受方(本地)的TCP数据报缓冲区大小的数据,发送方根据这个数据来计算自己最多能发送多长的数据.如果发送方收到接受 ...
javaweb的web.xml配置说明，初始化过程
[重点]初始化过程可知容器对于web.xml的加载过程是context-param >> listener >> fileter >> servlet 首先了解 ...
【IT笔试面试题整理】位操作
如何准备: Bit manipulation can be a scary thing to many candidates, but it doesn't need to be! If you're ...
团队作业6——展示博客（alpha阶段）
Deadline: 2018-5-9 10:00PM,以提交至班级博客时间为准. 5.10周四实验课将进行alpha阶段项目复审,请在5.10之前,根据以下要求,完成alpha版本的展示,并以此作为参 ...
UVA 11134 Fabled Rooks（贪心的妙用+memset误用警示）
题目链接: https://cn.vjudge.net/problem/UVA-11134 /* 问题输入棋盘的规模和车的数量n(1=<n<=5000),接着输入n辆车的所能在的矩阵的范 ...
apache 隐藏 index.php
在根目录下添加文件 .htaccess <IfModule mod_rewrite.c> Options +FollowSymlinks RewriteEngine On RewriteC ...
css溢出滚动条及去除滚动条的方法
<div class="father"> <div class="childern"></div> </div> ...

leveldb源码分析--SSTable之TableBuilder

leveldb源码分析--SSTable之TableBuilder的更多相关文章

随机推荐

热门专题