跳跃表skiplist

简介

你一定比较好奇Redis里面的 sorted set 是怎么实现的，底层到底是什么？它的排序功能就是用到了这个skiplist-跳跃表。

什么是跳跃表？

跳跃表可以看做是链表的一个变种，一个多层顺序链表层级结构组成。它是一种顺序查找数据结构。

它是由William Pugh发明的，最早出现于他在1990年发表的论文《Skip Lists: A Probabilistic Alternative to Balanced Trees。

看一张图，能形象的记住

来自：http://prismoskills.appspot.com/lessons/Algorithms/Chapter_04_-_Skip_Lists.jsp

它有着堪比红黑树的效率，但是比红黑树的操作简单多了。

这里有一份跳跃表各种概念介绍，很详细：https://www.iteye.com/blog/kenby-1187303

Redis中的跳跃表

Redis中的数据结构定义和操作API，编写的非常简洁明了，十分适合阅读。

Redis 中就使用了这种数据结构，它用于zset的排序操作，数据结构定义如下：

数据结构定义:

// src/redis.h  redis3.0 老版本结构简单

typedef struct zskiplistNode {

    robj *obj;                        // 对象成员

    double score;                      //分数

    struct zskiplistNode *backward;    //向后的指针

    struct zskiplistLevel {            //水平层级

        struct zskiplistNode *forward;  //向前指针

        unsigned int span;             // 跨度(redis中用于计算元素排名)

    } level[];

} zskiplistNode;

typedef struct zskiplist {

    struct zskiplistNode *header, *tail;

    unsigned long length;

    int level;

} zskiplist;

层 level：

跳跃表的节点的level数组可以包含多个元素，每个元素都包含一个指向其他节点的指针，程序可以通过这些层加快访问其他节点的速度。

层的高度怎么确定呢？
程序根据幂次定律随机生成一个介于1和32之间的值作为level数组的大小。

向前指针 forward：
用于访问前面的元素

跨度 span：
用于记录2个节点之间的距离。如果指向NULL，那么跨度就为0。

分数 score：
是一个double的浮点数，跳跃表中的所有节点都是按照分值从小到大来排序的。

成员对象 obj：
是一个指针，指向一个字符串对象，字符串对象保存在SDS中。

在跳跃表中，各个节点保存的成员对象必须唯一，但是多个节点保存的分值却可以相同。分值按从小到大来排序，成员对象的分值较小的排在前面。

操作的API:

创建新的跳跃表

// src/t_zset.c redis3.0

zskiplist *zslCreate(void) {

    int j;

    zskiplist *zsl;

    zsl = zmalloc(sizeof(*zsl));

    zsl->level = 1;

    zsl->length = 0;

    zsl->header = zslCreateNode(ZSKIPLIST_MAXLEVEL,0,NULL);

    for (j = 0; j < ZSKIPLIST_MAXLEVEL; j++) {

        zsl->header->level[j].forward = NULL;

        zsl->header->level[j].span = 0;

    }

    zsl->header->backward = NULL;

    zsl->tail = NULL;

    return zsl;

}

创建跳跃表节点Node

zskiplistNode *zslCreateNode(int level, double score, robj *obj) {

    zskiplistNode *zn = zmalloc(sizeof(*zn)+level*sizeof(struct zskiplistLevel));

    zn->score = score;

    zn->obj = obj;

    return zn;

}

释放跳跃表以及表中包含的节点

// src/t_zset.c redis3.0

void zslFree(zskiplist *zsl) {

    zskiplistNode *node = zsl->header->level[0].forward, *next;

    zfree(zsl->header);

    while(node) {

        next = node->level[0].forward;

        zslFreeNode(node);

        node = next;

    }

    zfree(zsl);

}

插入节点到跳跃表中

// src/t_zset.c redis3.0

int zslRandomLevel(void) {

    int level = 1;

    while ((random()&0xFFFF) < (ZSKIPLIST_P * 0xFFFF))

        level += 1;

    return (level<ZSKIPLIST_MAXLEVEL) ? level : ZSKIPLIST_MAXLEVEL;

}

zskiplistNode *zslInsert(zskiplist *zsl, double score, robj *obj) {

    zskiplistNode *update[ZSKIPLIST_MAXLEVEL], *x;

    // 记录每一层插入节点的前面一个节点在skiplist中的排名

    unsigned int rank[ZSKIPLIST_MAXLEVEL];

    int i, level;

    redisAssert(!isnan(score));

    x = zsl->header;

    // 计算待插入点的位置

    for (i = zsl->level-1; i >= 0; i--) {

        /* store rank that is crossed to reach the insert position */

        rank[i] = i == (zsl->level-1) ? 0 : rank[i+1];

        // 先根据score比较，相等即根据sds的字符串字典序比较

        while (x->level[i].forward &&

            (x->level[i].forward->score < score ||

                (x->level[i].forward->score == score &&

                compareStringObjects(x->level[i].forward->obj,obj) < 0))) {

            rank[i] += x->level[i].span;

            x = x->level[i].forward;

        }

        update[i] = x;// 每一个层级的待插入位置，即当前层最后一个小于x的点

    }

    /* we assume the key is not already inside, since we allow duplicated

     * scores, and the re-insertion of score and redis object should never

     * happen since the caller of zslInsert() should test in the hash table

     * if the element is already inside or not. */

    level = zslRandomLevel();

    // 如果计算出来的层级比当前层级高，则重设超出zsl原来层级的指针

    if (level > zsl->level) {

        for (i = zsl->level; i < level; i++) {

            rank[i] = 0;

            update[i] = zsl->header;

            update[i]->level[i].span = zsl->length;

        }

        zsl->level = level;

    }

    x = zslCreateNode(level,score,obj);

    for (i = 0; i < level; i++) {

        x->level[i].forward = update[i]->level[i].forward;

        update[i]->level[i].forward = x;

        /* update span covered by update[i] as x is inserted here */

        x->level[i].span = update[i]->level[i].span - (rank[0] - rank[i]);

        update[i]->level[i].span = (rank[0] - rank[i]) + 1;

    }

    /* increment span for untouched levels */

     /* 自增没有到达的层级的span */

    for (i = level; i < zsl->level; i++) {

        update[i]->level[i].span++;

    }

    x->backward = (update[0] == zsl->header) ? NULL : update[0];

    if (x->level[0].forward)

        x->level[0].forward->backward = x;

    else

        zsl->tail = x;

    zsl->length++;

    return x;

}

删除节点

// src/t_zset.c redis3.0

/* Internal function used by zslDelete, zslDeleteByScore and zslDeleteByRank */

void zslDeleteNode(zskiplist *zsl, zskiplistNode *x, zskiplistNode **update) {

    int i;

    for (i = 0; i < zsl->level; i++) {

        if (update[i]->level[i].forward == x) {

            update[i]->level[i].span += x->level[i].span - 1;

            update[i]->level[i].forward = x->level[i].forward;

        } else {

            update[i]->level[i].span -= 1;

        }

    }

    if (x->level[0].forward) {

        x->level[0].forward->backward = x->backward;

    } else {

        zsl->tail = x->backward;

    }

    while(zsl->level > 1 && zsl->header->level[zsl->level-1].forward == NULL)

        zsl->level--;

    zsl->length--;

}

Redis原理再学习01：数据结构-跳跃表skiplist的更多相关文章

Redis原理再学习04：数据结构-哈希表hash表(dict字典)
哈希函数简介哈希函数(hash function),又叫散列函数,哈希算法.散列函数把数据"压缩"成摘要,有的也叫"指纹",它使数据量变小且数据格式大小也固定 ...
Redis原理再学习05：数据结构-整数集合intset
intset介绍 intset 整数集合,当一个集合只有整数元素,且元素数量不多时,Redis 就会用整数集合作为集合键的底层实现. redis> SADD numbers 1 3 5 7 9 ...
Redis数据结构—跳跃表
目录 Redis数据结构-跳跃表跳跃表产生的背景跳跃表的结构利用跳跃表查询有序链表 Redis跳跃表图示 Redis跳跃表数据结构小结 Redis数据结构-跳跃表大家好,我是白泽,最近学校有 ...
Redis数据结构之跳跃表-skiplist
在Redis中,zset是一个复合结构: 使用hash来存储value和score的映射关系使用跳跃表来提供按照score进行排序的功能,同时可以指定score范围来获取value列表结构 zse ...
redis 5.0.7 源码阅读——跳跃表skiplist
redis中并没有专门给跳跃表两个文件.在5.0.7的版本中,结构体的声明与定义.接口的声明在server.h中,接口的定义在t_zset.c中,所有开头为zsl的函数. 一.数据结构单个节点: t ...
Redis学习之zskiplist跳跃表源码分析
跳跃表的定义跳跃表是一种有序数据结构,它通过在每个结点中维持多个指向其他结点的指针,从而达到快速访问其他结点的目的跳跃表的结构关于跳跃表的学习请参考:https://www.jianshu.co ...
Redis源码解析：05跳跃表
一:基本概念跳跃表是一种随机化的数据结构,在查找.插入和删除这些字典操作上,其效率可比拟于平衡二叉树(如红黑树),大多数操作只需要O(log n)平均时间,但它的代码以及原理更简单.跳跃表的定义如下 ...
跳跃表 SkipList【数据结构】原理及实现
为什么选择跳表目前经常使用的平衡数据结构有:B树,红黑树,AVL树,Splay Tree, Treep等. 想象一下,给你一张草稿纸,一只笔,一个编辑器,你能立即实现一颗红黑树,或者AVL树出来吗? ...
用golang实现常用算法与数据结构——跳跃表(Skip list)
背景最近在学习 redis,看到redis中使用了skip list.在网上搜索了一下发现用 golang 实现的 skip list 寥寥无几,性能和并发性也不是特别好,于是决定自己造一个并发安 ...
探索c#之跳跃表(SkipList)
阅读目录: 基本介绍算法思想演化步骤实现细节总结基本介绍 SkipList是William Pugh在1990年提出的,它是一种可替代平衡树的数据结构. SkipList在实现上相对比较简单 ...

随机推荐

[转帖]记录一次spring-boot程序内存泄露排查
现象 spring boot项目jvm启动配置-Xms4g -Xmx4g,然而很不幸的是程序所占的内存越来越高,都达到了12个多G,只能临时重启服务常用命令 jstat -class PID jst ...
Docker 部署 Ceph的简单方法
https://zhuanlan.zhihu.com/p/390377674 学习一下. docker部署部署的思路和网络架构和前面分布式是一样的,区别在于命令的形式. 在每个节点安装 docker ...
el-dialog组件无法跟新视图上的数据
<el-dialog title="提示" :visible.sync="dialogVisible" width="30%"> ...
ETL之apache/hop-web 2.5安装和简单入门
一.使用Docker 安装部署 1.拉取镜像推荐使用下面的web版本 docker pull apache/hop:latest docker pull apache/hop-web:latest ...
C/C++ 实现FTP文件上传下载
FTP(文件传输协议)是一种用于在网络上传输文件的标准协议.它属于因特网标准化的协议族之一,为文件的上传.下载和文件管理提供了一种标准化的方法,在Windows系统中操作FTP上传下载可以使用WinI ...
7.3 C/C++ 实现顺序栈
顺序栈是一种基于数组实现的栈结构,它的数据元素存储在一段连续的内存空间中.在顺序栈中,栈顶元素的下标是固定的,而栈底元素的下标则随着入栈和出栈操作的进行而变化.通常,我们把栈底位置设置在数组空间的起始 ...
node版本控制工具nvm安装教程
一.安装nvm 查看node对应NPM:https://nodejs.org/en/about/previous-releases 1.卸载node,后删除node文件夹里的所有内容 2:安装nvm管 ...
【操作系统到计网从入门到深入】（一）Linux基础知识预备
前言这个专栏其实是博主在复习操作系统和计算机网络时候的笔记,所以如果是博主比较熟悉的知识点,博主可能就直接跳过了,但是所有重要的知识点,在这个专栏里面都会提到!而且我也一定会保证这个专栏知识点的完整 ...
Shopee x JuiceFS：ClickHouse 冷热数据分离存储架构与实践
本文来自 shopee 技术团队摘要 Shopee ClickHouse 是一款基于开源数据库 ClickHouse 做二次开发.架构演进的高可用分布式分析型数据库.本文将主要介绍 Shopee C ...
Java浅谈BufferedReader
既然Scanner简单好用,为什么要用BufferedReader呢? 主要原因是面对大量的读入显得较慢且不安全,这里体现在三个方面,一方面是解析的问题,好用意味着封装的更复杂,一拖n的接口解析起来会 ...

Redis原理再学习01：数据结构-跳跃表skiplist