skip list

概述

Skip list是平衡树的一种替代的数据结构，但是和红黑树不相同的是，跳表对于树的平衡的实现是基于一种随机化的算法的，这样也就是说跳表的插入和删除的工作是比较简单的。并且是Redis、LevelDB、nessDB、SkipDB等的底层结构，学习skip list为后面学习levelDB打下基础。

核心思想

如果是一个简单的链表，如图1，那么我们知道在链表中查找一个元素I的话，需要将整个链表遍历一次。

图 1

如果是说链表是排序的，并且节点中还存储了指向前面第二个节点的指针的话，如图2，那么在查找一个节点时，仅仅需要遍历N/2个节点即可。

图 2

这基本上就是跳表的核心思想，其实也是一种通过“空间来换取时间”的一个算法，通过在每个节点中增加了向前的指针，从而提升查找的效率。

跳表数据存储模型

我们定义：

如果一个基点存在k个向前的指针的话，那么陈该节点是k层的节点。

一个跳表的层MaxLevel定义为跳表中所有节点中最大的层数。

下面给出一个完整的跳表的图示：

那么我们该如何将该数据结构使用二进制存储呢？通过上面的跳表的很容易设计这样的数据结构：

定义每个节点类型：

typedef struct NodeStructure *Node;

typedef struct NodeStructure

{

keyType key; // key值

valueType value; // value值

// 向前指针数组，根据该节点层数的不同指向不同大小的数组

NodeStructure *forward[1];

}NodeStructure;

上面的每个结构体对应着图中的每个节点，如果一个节点是一层的节点的话（如7，12等节点），那么对应的forward将指向一个只含一个元素的数组，以此类推。

定义跳表数据类型：

// 定义跳表数据类型

typedef struct SkipList{

int level; /* Maximum level of the list

(1 more than the number of levels in the list) */

Node header; /* pointer to header */

} * SkipList;跳表数据类型中包含了维护跳表的必要信息，level表明跳表的层数，header如下所示：

定义辅助变量：

#define MAX_LEVEL 10

定义辅助方法：

创建节点

Node CreateNode(int level,int key,int value)

{

Node node=(NodeStructure *)malloc(sizeof(NodeStructure)+level*sizeof(NodeStructure*));

node->key=key;

node->value=value;

return node;

}

好的基本的数据结构定义已经完成，接下来来分析对于跳表的一个操作。

跳表代码实现

1 初始化

初始化的过程很简单，仅仅是生成下图中红线区域内的部分，也就是跳表的基础结构：

SkipList CreateSkiplist()

{

SkipList skiplist=(SkipList *)malloc(sizeof(struct SkipList));

skiplist->level=0;

skiplist->header=CreateNode(MAX_LEVEL-1,0,0);

for(int i=0;i<MAX_LEVEL;i++)

{

skiplist->header->forward[i]=NULL;

}

return skiplist;

}

2 查找

//搜索指定key的value

int Search(SkipList skiplist,int key)

{

Node pre,now=NULL;

pre=skiplist->header;

//从最高层开始搜

int k=skiplist->level;

for(int i=k-1; i >= 0; i--)

{

while((now=pre->forward[i])&&(now->key<=key))

{

if(now->key == key)

{

return now->value;

}

pre=now;

}

return NULL;

}

3 插入操作

由于跳表数据结构整体上是有序的，所以在插入时，需要首先查找到合适的位置，然后就是修改指针（和链表中操作类似），然后更新跳表的level变量。

//随机产生层数

int randomLevel()

{

int k=1;

while (rand()%2)

k++;

k=(k<MAX_LEVEL)?k:MAX_LEVEL;

return k;

}

//插入节点

bool Insert(SkipList *skiplist,int key,int value)

{

Node update[MAX_LEVEL];

Node p, q = NULL;

p=skiplist->header;

int k=skiplist->level;

//从最高层往下查找需要插入的位置

//填充update

for(int i=k-1; i >= 0; i--)

{

//q!=NULL

while((q=p->forward[i])&&(q->key<key))

{

p=q;

}

update[i]=p;

}

// 这里已经查找到了合适的位置，并且update数组已经

// 填充好了元素

//不能插入相同的key

if(q&&q->key==key)

{

return false;

}

//产生一个随机层数K

//新建一个待插入节点q

//一层一层插入

k=randomLevel();

// 如果新生成的层数比跳表的层数大的话

// 增加整个跳表的层数

if(k>(skiplist->level))

{

for(int i=skiplist->level; i < k; i++)

{

// 在update数组中将新添加的层指向skiplist->header

update[i] = skiplist->header;

}

skiplist->level=k;

}

q=CreateNode(k,key,value);

//逐层更新节点的指针，和普通列表插入一样

for(int i=0;i<k;i++)

{

q->forward[i]=update[i]->forward[i];

update[i]->forward[i]=q;

}

return true;

}

4 删除某个节点

和插入是相同的，首先查找需要删除的节点，如果找到了该节点的话，那么只需要更新指针域，如果跳表的level需要更新的话，进行更新。

//删除指定的key

bool Delete(SkipList skiplist,int key)

{

Node update[MAX_LEVEL];

Node p,q=NULL;

p=skiplist->header;

//从最高层开始搜

int k=skiplist->level;

for(int i=k-1; i >= 0; i--)

{

while((q=p->forward[i])&&(q->key<key))

{

p=q;

}

update[i]=p;

}

if(q&&q->key==key)

{

//逐层删除，和普通列表删除一样

for(int i=0; i<skiplist->level; i++)

{

if(update[i]->forward[i]==q)

{

update[i]->forward[i]=q->forward[i];

}

free(q);

//如果删除的是最大层的节点，那么需要重新维护跳表的

for(int i=skiplist->level - 1; i >= 0; i--)

{

if(skiplist->header->forward[i]==NULL)

{

skiplist->level--;

}

return true;

}

else

return false;

}

5 参考文献

SkipList论文

ftp://ftp.cs.umd.edu/pub/skipLists/skiplists.pdf

#define MAX_LEVEL 10

typedef struct NodeStructure *Node;

typedef struct NodeStructure

{

	keyType key; // key值

	valueType value; // value值

	// 向前指针数组，根据该节点层数的不同指向不同大小的数组

	NodeStructure *forward[1];

}NodeStructure;

typedef struct SkipList{

	int level;  /* Maximum level of the list

　　	          (1 more than the number of levels in the list) */

	Node header; /* pointer to header */

} * SkipList;

Node CreateNode(int level,int key,int value)

 {

     Node node=(NodeStructure *)malloc(sizeof(NodeStructure)+level*sizeof(NodeStructure*));

     node->key=key;

    node->value=value;

	return node;

}  

SkipList CreateSkiplist()

{

     SkipList skiplist=(SkipList *)malloc(sizeof(struct SkipList));

     skiplist->level=0;

     skiplist->header=CreateNode(MAX_LEVEL-1,0,0);   

	for(int i=0;i<MAX_LEVEL;i++)

	{

        skiplist->header->forward[i]=NULL;

    }

    return skiplist;

 }  

 //搜索指定key的value

int Search(SkipList skiplist,int key)

{

     Node pre,now=NULL;

     pre=skiplist->header;

     //从最高层开始搜

     int k=skiplist->level;

     for(int i=k-1; i >= 0; i--)

	 {

         while((now=pre->forward[i])&&(now->key<=key))

         {

             if(now->key == key)

             {

                 return now->value;

			 }

             pre=now;

         }

     }

     return NULL;

 }  

 //随机产生层数

int randomLevel()

{

    int k=1;

	while (rand()%2)

	k++;

	k=(k<MAX_LEVEL)?k:MAX_LEVEL;

	return k;

 }  

 //插入节点

 bool Insert(SkipList skiplist,int key,int value)

{

     Node update[MAX_LEVEL];

     Node p, q = NULL;

     p=skiplist->header;

    int k=skiplist->level;

	//从最高层往下查找需要插入的位置

     //填充update

     for(int i=k-1; i >= 0; i--)

	 {

		 //q!=NULL

         while((q=p->forward[i])&&(q->key<key))

         {

             p=q;

         }

        update[i]=p;

     }

	 // 这里已经查找到了合适的位置，并且update数组已经

	 // 填充好了元素

     //不能插入相同的key

     if(q&&q->key==key)

    {

         return false;

     }  

     //产生一个随机层数K

    //新建一个待插入节点q

	//一层一层插入

     k=randomLevel();

	// 如果新生成的层数比跳表的层数大的话

	// 增加整个跳表的层数

	if(k>(skiplist->level))

     {

         for(int i=skiplist->level; i < k; i++)

		 {

			// 在update数组中将新添加的层指向skiplist->header

            update[i] = skiplist->header;

         }

         skiplist->level=k;

     }  

    q=CreateNode(k,key,value);

	//逐层更新节点的指针，和普通列表插入一样

     for(int i=0;i<k;i++)

    {

		q->forward[i]=update[i]->forward[i];

        update[i]->forward[i]=q;

     }

     return true;

 }  

 //删除指定的key

bool Delete(SkipList skiplist,int key)

{

    Node update[MAX_LEVEL];

	Node p,q=NULL;

    p=skiplist->header;

    //从最高层开始搜

     int k=skiplist->level;

     for(int i=k-1; i >= 0; i--)

	 {

        while((q=p->forward[i])&&(q->key<key))

         {

             p=q;

         }

         update[i]=p;

     }

     if(q&&q->key==key)

     {

         //逐层删除，和普通列表删除一样

         for(int i=0; i<skiplist->level; i++)

		 {

             if(update[i]->forward[i]==q)

			 {

                update[i]->forward[i]=q->forward[i];

            }

        }

         free(q);

         //如果删除的是最大层的节点，那么需要重新维护跳表的

        for(int i=skiplist->level - 1; i >= 0; i--)

		{

            if(skiplist->header->forward[i]==NULL)

			{

                skiplist->level--;

             }

         }

         return true;

     }

    else

         return false;

 }  

 void Print(SkipList skiplist)

 {

    //从最高层开始打印

     nodeStructure *p,*q=NULL;  

     //从最高层开始搜

     int k=skiplist->level;

	for(int i=k-1; i >= 0; i--)

	{

         p=skiplist->header;

        while(q=p->forward[i])

		{

			printf("%d -> ",p->value);

			p=q;

         }

         printf("\n");

     }

     printf("\n");

 }

 int main()

 {

     SkipList skiplist=CreateSkiplist();

     for(int i=1;i<=19;i++)

     {

         Insert(skiplist,i,i*2);

     }

     Print(skiplist);

     //搜索

     int i=Search(skiplist,4);

     printf("i=%d\n",i);

     //删除

     bool b=Delete(skiplist,4);

     if(b)

         printf("删除成功\n");

     Print(skiplist);

    system("pause");

     return 0;

 }

skip list的更多相关文章

LINQ系列：LINQ to SQL Take/Skip
1. Take var expr = context.Products .Take(); var expr = (from p in context.Products select p) .Take( ...
EntityFramework 7 OrderBy Skip Take－计算排序分页 SQL 翻译
先解释一下这个标题的意思,OrderBy 在 Linq 语句中,我们经常使用,比如 OrderBy(b => b.BlogId) 就是对 BlogId 字段进行升序排序,这是针对一个字段的排序, ...
【记录】AutoMapper Project To OrderBy Skip Take 正确写法
AutoMapper:Queryable Extensions 示例代码: using (var context = new orderEntities()) { return context.Ord ...
Xcode插件安装错选了Skip Bundle解决办法
1.首先找到Xcode的UUID,在终端运行defaults read /Applications/Xcode.app/Contents/Info DVTPlugInCompatibilityUUID ...
ASP.NET泛型List的各种用法Skip、Take等
List在.NET里面使用得非常频繁,但有好多人不了解它各种小用法.我就一直记不大住... asp.net中List的简单用法,例如: 1 2 3 4 5 6 7 List<int> li ...
mongodb-$type、limit、skip、sort方法、索引、聚合
一.$type操作符 $type操作符是基于BSON类型来检索集合中匹配的数据类型,并返回结果. MongoDB 中可以使用的类型如下表所示: 类型数字备注 Double 1 String 2 ...
Xcode安装插件,错误选择了Skip Bundles,重新出现Load Bundles方法
Xcode安装插件经常会遇到这样的问题,出现提示性选择,还是英文提示,所以没仔细看就习惯性的选择了右侧的按钮点击了Skip Bundle,结果悲剧的发现,发现插件完全失效了,以后不管怎么打开Xcod ...
[Android Pro] InputStream.skip方法的思考
参考 : http://blog.csdn.net/gsyzhu/article/details/8102286 在java.io.InputStream类中定义了skip这个方法.在API中的描述如 ...
跳跃表Skip List的原理和实现
>>二分查找和AVL树查找二分查找要求元素可以随机访问,所以决定了需要把元素存储在连续内存.这样查找确实很快,但是插入和删除元素的时候,为了保证元素的有序性,就需要大量的移动元素了.如果 ...
转MongoDB 使用Skip和limit分页
关于MongoDB 数据分页和排序 limit,skip用户的一些基础语句,介绍MongoDB 数据分页和排序实例方法. 使用Skip和limit可以如下做数据分页: Code: page1 = db ...

随机推荐

IOS内存管理「2」- 点语法的内存管理
实体框架 (EF) 入门 => 一、我该用哪个工作流？
入门的参考资料:http://msdn.microsoft.com/zh-cn/data/ee712907 本篇的参考资料:http://msdn.microsoft.com/zh-cn/data/j ...
17.Quartus 怎么回读CPLD里面的东西
可以使用Quartus® II Programmer的“Examine”特性回读编程目标文件(.POF)是CPLD不是FPGA 先用auto检测加没加加密位,然后执行ex,然后save,Examine ...
JNA开发中的问题积累
[Qboy原创] 2013年12月28日在开发一个项目过程中需要调用第三方的C的dll.由于是第一次在项目中使用JNA,很多都安装开发文档来做,但是出现了很多的问题. 由于很多接口还没调完,还不知道 ...
Travis-CI的进一步使用
今天主要对.travis.yml文件和makefile进行进一步的了解: 1.在.travis.yml文件中添加了给linux系统中安装了cppunit库的语句,使能够持续集成写过的单元测试的代码.主 ...
MVC缓存技术
一.MVC缓存简介缓存是将信息(数据或页面)放在内存中以避免频繁的数据库存储或执行整个页面的生命周期,直到缓存的信息过期或依赖变更才再次从数据库中读取数据或重新执行页面的生命周期.在系统优化过程中, ...
查询sql耗时（运行时间）
SET STATISTICS TIME ON SELECT * FROM dbo.UserBase SET STATISTICS TIME OFF
我是IT小小鸟，老师我之前上传了！！！！老是请您看到我
我是IT小小鸟读后感世界上没有一蹴而就的成功者,只有头悬梁锥刺股的奋斗者.蜉蝣向往大鹏的辉煌,却不曾知大鹏以往的汗水.蜉蝣之所以为蜉蝣,是因为它犹如井底之蛙,目光短浅,之盲目地羡慕成功者,而大鹏之所 ...
js判断手机还是pc并跳转相关页面
<script type="text/javascript"> function GetRequest() { var url = location.search; / ...
C++ Template之非类型模板参数
非类型模板参数是通过基本变量类型引入,例如int,在使用时必须显式自定值,不能通过推断. 非类型模板参数的限制:不能是浮点数(在vc6.0上测试可以为浮点型),对象以及指向内部链接对象的指针. #in ...

skip list

概述

核心思想

跳表数据存储模型

跳表代码实现

1 初始化

2 查找

3 插入操作

4 删除某个节点

5 参考文献

skip list的更多相关文章

随机推荐

热门专题