本文是使用 golang 实现 redis 系列的第五篇，将介绍如何使用跳表实现有序集合(SortedSet)的相关功能。

跳表(skiplist) 是 Redis 中 SortedSet 数据结构的底层实现, 跳表优秀的范围查找能力为ZRange和ZRangeByScore等命令提供了支持。

本文完整源代码在GithubHDT3213/godis

结构定义

实现ZRange命令最简单的数据结构是有序链表:

在有序链表上实现ZRange key start end命令需要进行end次查询, 即时间复杂度为 O(n)

跳表的优化思路是添加上层链表，上层链表中会跳过一些节点。如图所示:

在有两层的跳表中，搜索的时间复杂度降低为了O(n / 2)。以此类推在有 log2(n) 层的跳表中，搜索元素的时间复杂度为O(log n)。

了解数据结构之后，可以定义相关的类型了:

// 对外的元素抽象

type Element struct {

    Member string

    Score  float64

}

type Node struct {

    Element // 元素的名称和 score

    backward *Node // 后向指针

    level []*Level // 前向指针, level[0] 为最下层

}

// 节点中每一层的抽象

type Level struct {

    forward *Node // 指向同层中的下一个节点

    span int64 // 到 forward 跳过的节点数

}

// 跳表的定义

type skiplist struct {

    header *Node

    tail *Node

    length int64

    level int16

}

用一张图来表示一下:

查找节点

有了上文的描述查找节点的逻辑不难实现, 以 RangeByRank 的核心逻辑为例:

// 寻找排名为 rank 的节点, rank 从1开始

func (skiplist *skiplist) getByRank(rank int64)*Node {

    var i int64 = 0

    n := skiplist.header

    // 从顶层向下查询

    for level := skiplist.level - 1; level >= 0; level-- {

        // 从当前层向前搜索

        // 若当前层的下一个节点已经超过目标 (i+n.level[level].span > rank)，则结束当前层搜索进入下一层

        for n.level[level].forward != nil && (i+n.level[level].span) <= rank {

            i += n.level[level].span

            n = n.level[level].forward

        }

        if i == rank {

            return n

        }

    }

    return nil

}

ZRangeByScore 命令需要 getFirstInScoreRange 函数找到分数范围内第一个节点:

func (skiplist *skiplist) getFirstInScoreRange(min *ScoreBorder, max *ScoreBorder) *Node {

    // 判断跳表和范围是否有交集，若无交集提早返回

    if !skiplist.hasInRange(min, max) {

        return nil

    }

    n := skiplist.header

    // 从顶层向下查询

    for level := skiplist.level - 1; level >= 0; level-- {

        // 若 forward 节点仍未进入范围则继续向前(forward)

        // 若 forward 节点已进入范围，当 level > 0 时 forward 节点不能保证是 *第一个* 在 min 范围内的节点， 因此需进入下一层查找

        for n.level[level].forward != nil && !min.less(n.level[level].forward.Score) {

            n = n.level[level].forward

        }

    }

    // 当从外层循环退出时 level=0 (最下层), n.level[0].forward 一定是 min 范围内的第一个节点

    n = n.level[0].forward

    if !max.greater(n.Score) {

        return nil

    }

    return n

}

插入节点

插入节点的操作比较多，我们以注释的方式进行说明:

func (skiplist *skiplist)insert(member string, score float64)*Node {

    // 寻找新节点的先驱节点，它们的 forward 将指向新节点

    // 因为每层都有一个 forward 指针, 所以每层都会对应一个先驱节点

    // 找到这些先驱节点并保存在 update 数组中

    update := make([]*Node, maxLevel)

    rank := make([]int64, maxLevel) // 保存各层先驱节点的排名，用于计算span

    node := skiplist.header

    for i := skiplist.level - 1; i >= 0; i-- { // 从上层向下寻找

        // 初始化 rank

        if i == skiplist.level - 1 {

            rank[i] = 0

        } else {

            rank[i] = rank[i + 1]

        }

        if node.level[i] != nil {

            // 遍历搜索

            for node.level[i].forward != nil &&

                (node.level[i].forward.Score < score ||

                    (node.level[i].forward.Score == score && node.level[i].forward.Member < member)) { // same score, different key

                rank[i] += node.level[i].span

                node = node.level[i].forward

            }

        }

        update[i] = node

    }

    level := randomLevel() // 随机决定新节点的层数

    // 可能需要创建新的层

    if level > skiplist.level {

        for i := skiplist.level; i < level; i++ {

            rank[i] = 0

            update[i] = skiplist.header

            update[i].level[i].span = skiplist.length

        }

        skiplist.level = level

    }

    // 创建新节点并插入跳表

    node = makeNode(level, score, member)

    for i := int16(0); i < level; i++ {

        // 新节点的 forward 指向先驱节点的 forward

        node.level[i].forward = update[i].level[i].forward

        // 先驱节点的 forward 指向新节点

        update[i].level[i].forward = node

        // 计算先驱节点和新节点的 span

        node.level[i].span = update[i].level[i].span - (rank[0] - rank[i])

        update[i].level[i].span = (rank[0] - rank[i]) + 1

    }

    // 新节点可能不会包含所有层

    // 对于没有层，先驱节点的 span 会加1 (后面插入了新节点导致span+1)

    for i := level; i < skiplist.level; i++ {

        update[i].level[i].span++

    }

    // 更新后向指针

    if update[0] == skiplist.header {

        node.backward = nil

    } else {

        node.backward = update[0]

    }

    if node.level[0].forward != nil {

        node.level[0].forward.backward = node

    } else {

        skiplist.tail = node

    }

    skiplist.length++

    return node

}

randomLevel 用于随机决定新节点包含的层数，随机结果出现2的概率是出现1的25%，出现3的概率是出现2的25%:

func randomLevel() int16 {

    level := int16(1)

    for float32(rand.Int31()&0xFFFF) < (0.25 * 0xFFFF) {

        level++

    }

    if level < maxLevel {

        return level

    }

    return maxLevel

}

删除节点

删除节点的思路与插入节点基本一致:

// 删除操作可能一次删除多个节点

func (skiplist *skiplist) RemoveRangeByRank(start int64, stop int64)(removed []*Element) {

    var i int64 = 0  // 当前指针的排名

    update := make([]*Node, maxLevel)

    removed = make([]*Element, 0)

    // 从顶层向下寻找目标的先驱节点

    node := skiplist.header

    for level := skiplist.level - 1; level >= 0; level-- {

        for node.level[level].forward != nil && (i+node.level[level].span) < start {

            i += node.level[level].span

            node = node.level[level].forward

        }

        update[level] = node

    }

    i++

    node = node.level[0].forward // node 是目标范围内第一个节点

    // 删除范围内的所有节点

    for node != nil && i < stop {

        next := node.level[0].forward

        removedElement := node.Element

        removed = append(removed, &removedElement)

        skiplist.removeNode(node, update)

        node = next

        i++

    }

    return removed

}

接下来分析一下执行具体节点删除操作的removeNode函数:

// 传入目标节点和删除后的先驱节点

// 在批量删除时我们传入的 update 数组是相同的

func (skiplist *skiplist) removeNode(node *Node, update []*Node) {

    for i := int16(0); i < skiplist.level; i++ {

        // 如果先驱节点的forward指针指向了目标节点，则需要修改先驱的forward指针跳过要删除的目标节点

        // 同时更新先驱的 span

        if update[i].level[i].forward == node {

            update[i].level[i].span += node.level[i].span - 1

            update[i].level[i].forward = node.level[i].forward

        } else {

            update[i].level[i].span--

        }

    }

    // 修改目标节点后继节点的backward指针

    if node.level[0].forward != nil {

        node.level[0].forward.backward = node.backward

    } else {

        skiplist.tail = node.backward

    }

    // 必要时删除空白的层

    for skiplist.level > 1 && skiplist.header.level[skiplist.level-1].forward == nil {

        skiplist.level--

    }

    skiplist.length--

}

Golang 实现 Redis(5): 使用跳表实现 SortedSet的更多相关文章

Golang 实现 Redis(5): 用跳表实现SortedSet
本文是使用 golang 实现 redis 系列的第五篇, 将介绍如何使用跳表实现有序集合(SortedSet)的相关功能. 跳表(skiplist) 是 Redis 中 SortedSet 数据结构 ...
Redis 为什么用跳表而不用平衡树
Redis 为什么用跳表而不用平衡树? 本文是<Redis内部数据结构详解>系列的第六篇.在本文中,我们围绕一个Redis的内部数据结构--skiplist展开讨论. Redis里面使用s ...
Redis中的跳表
date: 2020-10-15 14:58:00 updated: 2020-10-19 17:58:00 Redis中的跳表参考网址1 参考网址2 redis 数据类型 zset 实现有序集合, ...
跳表，Redis 为什么用跳表而不用平衡树？
https://juejin.im/post/57fa935b0e3dd90057c50fbc 在 Redis 中,list 有两种存储方式:双链表(LinkedList)和压缩双链表(ziplist ...
【转】Redis为什么用跳表而不用平衡树？
Redis里面使用skiplist是为了实现sorted set这种对外的数据结构.sorted set提供的操作非常丰富,可以满足非常多的应用场景.这也意味着,sorted set相对来说实现比较复 ...
深入理解跳表在Redis中的应用
本文首发于:深入理解跳表在Redis中的应用微信公众号:后端技术指南针持续输出干货欢迎关注前面写了一篇关于跳表基本原理和特性的文章,本次继续介绍跳表的概率平衡和工程实现, 跳表在Redis.Lev ...
自己动手实现java数据结构（九）跳表
1. 跳表介绍在之前关于数据结构的博客中已经介绍过两种最基础的数据结构:基于连续内存空间的向量(线性表)和基于链式节点结构的链表. 有序的向量可以通过二分查找以logn对数复杂度完成随机查找,但由于 ...
Redis源码研究--跳表
-------------6月29日-------------------- 简单看了下跳表这一数据结构,理解起来很真实,效率可以和红黑树相比.我就喜欢这样的. typedef struct zski ...
聊聊Mysql索引和redis跳表
摘要面试时,交流有关mysql索引问题时,发现有些人能够涛涛不绝的说出B+树和B树,平衡二叉树的区别,却说不出B+树和hash索引的区别.这种一看就知道是死记硬背,没有理解索引的本质.本文旨在剖析这 ...

随机推荐

动态网页D-html
BOM(Browser Object Model)浏览器对象模型 window对象(window – 代表浏览器中打开的一个窗口) 1.alert()方法 – 定义一个消息对话框 window.ale ...
你知道如何自动保存 Spring Boot 应用进程号吗
1. 前言欢迎阅读 Spring Boot 2 实战系列文章. PID 对于系统运维来说并不陌生,但是对于一些开发者特别是新手还是要简单介绍一下的.它是 Process ID 的简称,是系统分配给 ...
CTF中的命令执行绕过
本位原创作者:Smity 在介绍命令注入之前,有一点需要注意:命令注入与远程代码执行不同.他们的区别在于,远程代码执行实际上是调用服务器网站代码进行执行,而命令注入则是调用操作系统命令进行执行. 作为 ...
O - Employment Planning HDU - 1158
题目大意: 第一行一个n,表示共n个月份,然后第二行分别表示一个工人的聘请工资,月薪水,解雇工资.第三行是n个月每个月需要的工人的最少数目.然后求最少花费题解: dp[i][j] 表示第i个月聘请j ...
selenium Webdriver多窗口切换
应用场景: 在页面操作过程中有时候点击某个链接会弹出新的窗口,这时候就需要主机切换到新打开的窗口上进行操作.WebDriver提供了switch_to.window()方法,可以实现在不同的窗口直接切 ...
[腾讯云]简单在腾讯云 CenTOS7.0 安装Nginx，Mysql(MariaDB),Memcache，解析PHP!
1.安装LNMP之前要安装EPEL,以便安装源以外的软件,如Nginx,phpMyAdmin等. yum install epel-release 2.安装Nginx a) yum install n ...
MySQL笔记总结-TCL语言
TCL语言事务一.含义事务控制语言 Transaction Control Language 事务:一条或多条sql语句组成一个执行单位,一组sql语句要么都执行要么都不执行二.特点(ACID ...
感受python之美，python简单易懂的小例子
前言本文的文字及图片来源于网络,仅供学习.交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理. 1 简洁之美通过一行代码,体会Python语言简洁之美 2 Python ...
ajax轮询思路
以我个人理解 ,ajax短轮询就是用定时器,定时请求数据库,然后把有用的数据做处理 ajax长轮询恩就是在 ajax回调函数,继续调用ajax请求
How to change the header background color of a QTableView
You can set the style sheet on the QTableView ui->tableView->setStyleSheet("QHeaderView:: ...