数据库系统——B+树索引

原文来自于：http://dblab.cs.toronto.edu/courses/443/2013/05.btree-index.html

1. B+树索引概述

在上一篇文章中，我们讨论了关于index的几个中重要的课题：

A) index是保存在磁盘上的一种数据结构，用于提高查询或是扫描record的速度。

B) 排序索引树通过保存page的指针加速record的查找。（ISAM）

C) 维护排序索引树的代价很高，因此，ISAM通过创建overflow page来解决这个问题，但是过多的overflow page会使查询性能从log（指数log）级别降低到线性遍历。

下面我们将介绍一种高度健壮的、比较流行的一种数据结构——B+树，作为ISAM的扩展。

一般说来，B+树是一种高效的基于磁盘保存的数据结构，主要保存(key, value)pair。它支持对key的高效查找，和高效的范围迭代。

B+树提供了这些功能：

A) 快速的record查找

B) 快速的record遍历

C) 不通过overflow page的形式维护排序树结构

B+树背后的关键思想是利用有序平衡树，替代ISAM中的排序树。

2. B+树的定义

B+树是用磁盘上的page作为node节点的树。B+树中的节点可以区分为leaf node（叶子节点）和interior node（内部节点）。

由于每一个node刚好是磁盘中的一个page，在B+树中，我们使用的术语node和page是可以互换的。

2.1 leaf node

leaf node保存数据entry（条目，相当于record），entry的形式是(key, value)。所有的leaf node也被组织成page链表的形式。B+树的leaf node如下图所示：

下面是leaf node抽象的数据结构定义：

struct LeafNode

{

    vector<Key> keys;

    vector<Value> values;

    PagePointer next_page;

};

对任意的leaf node，下面的公式都是成立的：

p.keys.size() == p.values.size()

2.2 interior node

Interior node组织成一个树的形式，从root node（根节点，根节点也是一个interior node）开始，通过保存一系列key，来加速查询leaf node。

Interior node保存着一系列key和page指针，它的结构如图所示：

下面是interior node抽象的数据结构定义：

struct InteriorNode

{

    vector<Key> keys;

    vector<PagePointer> pointers;

};

对任意的interior node来时，下面的公式都是成立的：

p.keys.size() +1 == p.pointers.size()

有一个定义：Neighbouring pointer（临近指针）

对于一个key ki，我们定义before(ki)是ki前面临近的page指针，after(ki)是ki后面临近的指针。也就是说：

p.before(ki) = p.pointers[i]

p.after(ki) = p.pointers[i+1]

2.3 B+树的属性和约束条件

2.3.1 node中的key都是排好序的。

假设，p是B+树中的node，那么我们必须维持p.keys关于value是有序的。

2.3.2 各个node之间也是按key进行排序的。

B+树是有序树，表现在一下几个方面：

A) leaf node是有序的：

∀p∈LeafNode,∀k∈p.keys,∀k′∈p.next_page.keys,k<k′

多个leaf node组成一个有序链表，在各个leaf node之间使得高效的对(key, value)遍历成为可能。

B) interior node是有序的：

B+树对所有的key k，和其临近的指针after(k) 、after(k)，满足下面的条件：

k>max(keys(before(k)))

k≤min(keys(after(k)))

换句话说，k是介于before(k)、after(k) 的key之间的key。如图：

2.3.3 B+树是平衡树

B+树是平衡树，所有从root node到任何leaf node的路径长度是相等的。

2.3.4 B+树node是充分填充的

B+树允许它的node部分填充。主要是设计了一个填充因子的参数，用来限定每个non-root node（非根节点）的最小填充度。

如果一个non-root node的填充度不够，我们就说该node underflow，在B+树里只有root node可以underflow。

这里有一个不合格的B+数的例子。假设我们定义了下面的参数：

Capacity of each node: 4 keys

Fill factor: 50%

当该树经过平衡和排序后，它的结构如下图所示：

它存在着这样一个问题：没有满足我们上面定义的填充因子（fill factor）50%：

3. B+树的查询search和插入insert

B+树的主要操作有：

/**

 * finds the leaf node that _should_ contain the entry with the specified key

 */

LeafNode search(Node root, Key key)

/**

 * Inserts a key/val pair into the tree.

 * Returns the root of the new tree which _may_ be different

 * from the old root node.

 */

InteriorNode insert_into_tree(InteriorNode root, Key newkey, Value val)

B+树的insert算法必须保证执行相应的操作之后使得树依然满足B+的所有属性和约束。

3.1 Searching

B+树的查询算法就是简单直接的树的查找算法：

LeafNode search(Node p, Key key)

{

    if(p is LeafNode)

        return root;

　　else

　　{

        if(key < p.keys[0])

            return search(before(p.keys[0]), key);

        else if(key > p.keys[-1])

            return search(after(p.keys[-1]), key);

        else {

            let i be p.keys[i] <= key < p.keys[i+1]

            return search(after(p.keys[i]), key)

        }

    }

}

3.2 Inserting

B+树的insert操作是非常棘手的。它不像AVL的insert操作那样简单，B+树还需要考虑node的overflow和underflow。

Insert算法从这开始：

1）寻找insert的正确的目标leaf node

2）向目标leaf node中尝试insert操作

InteriorNode insert_into_tree(InteriorNode root, Key newkey, Value val)

{

    LeafNode leaf = search(root, newkey);

    return insert_into_node(leaf, newkey, val);

}

其中，insert_into_node中，要做如下的一些事：

/**

 * Tries to inserts the (newkey/val) pair into

 * the node.

 *

 * If `target` is an interior node, then `val` must be a page pointer.

 */

InteriorNode insert_into_node(Node target, newkey, val)

{

    if( ... CASE 1 ... )

	{

        /* handle CASE 1 */

    }

	else if( ... CASE 2 ... )

	{

        /* handle CASE 2 */

    }

	else if( ... CASE 3 ... )

	{

        /* handle CASE 2 */

    }

}

其中三个不同的case包括：

A) 目标leaf node有足够的空间保存key

B) 目标leaf node已满，但是它的parent node（父节点）有足够的空间保存key

C) 目标leaf node和它的parent node已满。

Case 1：

这是最简单的一种情况，将entry(newkey, value) 插入到目标leaf node即可。

A) Root node 不需要改变

B) 磁盘I/O也无需讨论。所有的操作都在一个page中。buffer manager（缓存管理）可以被用到，仿佛所有的node都保存在内存。

如图示：

Case 2：

在这种情况下，target node已满，但是它的parent node有足够的空间保存一个key。

A) 创建一个target node的兄弟node作为new_target node，将new_target node插入带target node之后。

B) 将target node中的所有entry和我们需要增加的entry分配保存到target node和new_target node中。由于分配之前target node是满的，那么就可以断定分配之后，这两个node不会存在underflow。

C) 将new_target的指针(k,p) = (leaf2.keys[0], ADDRESS[leaf2]) insert到target node的parent node中。由于parent node有足够的空间保存一个key，所以parent node不会出现overflow。

如图示：

Case 3：

这种情况是target和parent[target]都满了的情况。我们需要递归的尝试将新的key insert到target的祖先node中。甚至都有这种情况：root node也没有足够的空间保存这个新key ，这种情况下，我们必须对root进行分割，创建一个新的node作为B+树的root node。

具体细节如下：

A) 创建一个new_target node，insert到target之后。

B) 将target中的entry分配保存到target和new_target中。

现在我们需要将new_target node的指针(k,p) = (leaf2.keys[0], ADDRESS[leaf2])插入到它的PARENT[target]，但是PARENT[target]已经满了。

A) 令target_parent = PARENT[target]

B) 令all_keys = sorted(target_parent.keys ∪ {k})

C) 申请一个新的node：new_interior

D) 令i = floor(all_keys.size() / 2)

middle_key = all_keys[i]

E) 将all_keys[0 .. i-1]保存到target_parent中，将all_keys[i+1 .. n]保存new_interior到中。

F) 如果target_parent是root，那么我们就创建一个新的node作为grandparent ，令grandparent = PARENT[target_parent]。

G) 递归地调用：

insert_into_node(grandparent, middle_key, ADDRESS[new_interior])

如图所示：

4. B+树的其它的东西

a) B+树也支持高效的删除delete。删除算法是insert算法的逆过程。在delete的算法中会通过merge（合并）node，去避免underflow。如果发生merge node，那么会在parent node递归的delete这个(Key, PagePointer)。

b) 如果所有的data entry都保存在sequential file中，并且关于key排序，那么就可以非常有效的将sequential file装载到B+树。

c) B+树可以作为基于磁盘有序存储的排序算法。

数据库系统——B+树索引的更多相关文章

【转】数据库系统——B+树索引
原文来自于:http://blog.csdn.net/cjfeii/article/details/10858721 1. B+树索引概述在上一篇文章中,我们讨论了关于index的几个中重要的课题: ...
B+树索引
结构上 B树中关键字集合分布在整棵树中,叶节点中不包含任何关键字信息,而B+树关键字集合分布在叶子结点中,非叶节点只是叶子结点中关键字的索引: B树中任何一个关键字只出现在一个结点中,而B+树中的关键 ...
[转帖]B树索引和位图索引的结构介绍
B树索引和位图索引的结构介绍 http://blog.itpub.net/12679300/viewspace-1174236/ 一前言:? ROWID:包含键值的行的行ID,(查找块的最快方法, ...
[MySQL] B+树索引
B+树是一种经典的数据结构,由平衡树和二叉查找树结合产生,它是为磁盘或其它直接存取辅助设备而设计的一种平衡查找树,在B+树中,所有的记录节点都是按键值大小顺序存放在同一层的叶节点中,叶节点间用指针相连 ...
Oracle索引梳理系列（二）- Oracle索引种类及B树索引
版权声明:本文发布于http://www.cnblogs.com/yumiko/,版权由Yumiko_sunny所有,欢迎转载.转载时,请在文章明显位置注明原文链接.若在未经作者同意的情况下,将本文内 ...
MySQL：InnoDB存储引擎的B+树索引算法
很早之前,就从学校的图书馆借了MySQL技术内幕,InnoDB存储引擎这本书,但一直草草阅读,做的笔记也有些凌乱,趁着现在大四了,课程稍微少了一点,整理一下笔记,按照专题写一些,加深一下印象,不枉读了 ...
B+树索引和哈希索引的区别——我在想全文搜索引擎为啥不用hash索引而非得使用B+呢？
哈希文件也称为散列文件,是利用哈希存储方式组织的文件,亦称为直接存取文件.它类似于哈希表,即根据文件中关键字的特点,设计一个哈希函数和处理冲突的方法,将记录哈希到存储设备上. 在哈希文件中,是使用一个 ...
Hash索引和B树索引
要知道磁盘结构优化访问的关键在于以block为单位(比如每次读取一个页面) 这两种索引差别也就在聚集到一个block的标准: B树聚集到一个block是因为关键字在一个范围内,关键字在block内的排 ...
浅谈B+树索引的分裂优化(转)
http://www.tamabc.com/article/85038.html 从MySQL Bug#67718浅谈B+树索引的分裂优化原文链接:http://hedengcheng.com/ ...

随机推荐

Java学习----对象间的继承
继承:子类可以使用父类非私有的成员变量和方法 public class Father { public String name; public String bloodType; private in ...
utf8汉字编码16进制对照
utf8汉字编码16进制对照 GB Unicode UTF-8 Chinese Character Code code# Code (coded in UT ...
thinkphp 总结转
用ThinkPHP做过几个项目后,感觉这个框架蛮不错的,很适合自己的逻辑习惯,开发起来也快捷,呵呵, 总结了一些项目中常用的东东,希望对初学TP的朋友有所帮助! 1. 模板中不能使用的标签 {$co ...
Linux系统上使用php获取apk信息
最近在做一个apk商城,需要在用户上传了apk之后系统自动读取apk信息(包名,版本号等),后台语言使用的是php,需要php去调用系统的aapt命令去读取apk信息,在Linux系统上安装aapt的 ...
Python Tutorial 学习(三)--An Informal Introduction to Python
3.1. 将Python用作计算器 3.1.1. Numbers 数作为一个计算器,python支持简单的操作, '+','-','*','/'地球人都知道的加减乘除. ()可以用来改变优先级,同数 ...
D题 - A+B for Input-Output Practice (III)
Time Limit:1000MS Memory Limit:32768KB 64bit IO Format:%I64d & %I64u Description Your ...
spring mvc ModelAndView 404的原因
在使用ModelAndView时不要导入 import org.springframework.web.portlet.ModelAndView; 而要导入以下这个包 import org.sprin ...
go bufio
1 bufio 读结构 type Reader struct { buf []byte // 缓冲区 rd io.Reader // read ...
UNIX Filesystems - Evolution Design and Implementation.pdf
UNIX Filesystems - Evolution Design and Implementation.pdf
BZOJ 3884 上帝与集合的正确用法
Description 根据一些书上的记载,上帝的一次失败的创世经历是这样的: 第一天, 上帝创造了一个世界的基本元素,称做"元". 第二天, 上帝创造了一个新的元素,称作&quo ...

数据库系统——B+树索引

数据库系统——B+树索引的更多相关文章

随机推荐

热门专题