Go语言的跳跃表(SkipList)实现
之所以会有这篇文章,是因为我在学习Go语言跳表代码实现的过程中,产生过一些困惑,但网上的大家都不喜欢写注释- -
我的代码注释一向是写的很全的,所以发出来供后来者学习参考。
本文假设你已经理解了跳表的原理,不再做细节阐述。(可能会考虑以后补充)
代码实现参考了 https://github.com/wangzheng0822/algo/blob/master/go/17_skiplist/skiplist.go
但以上项目实现是有问题的(截至2020/06/14 14:18),Find 方法有概率查不到 score 重复的不同元素,Delete 方法也有bug,有可能会出现空指针,代码写的略奇怪,我直接重写了。
我还没去提pull request,因为测试用例我完全没写。有空补充一下。
本文的跳跃表参考了Redis跳表实现,加入了score属性区分优先级,跳表元素不能重复,允许score重复。
定义数据结构如下:
type SkipList struct {
Head *SkipListNode
LevelN int // 包含原始链表的层数
Length int // 长度
}
type SkipListNode struct {
Val interface{}
Level int // 该节点的最高索引层是多少
Score int
Next []*SkipListNode // key是层高
}
提供了以下方法:
func (sl *SkipList) Insert(val interface{}, score int) (bool, error)func (sl *SkipList) Find(v interface{}, score int) *skipListNodefunc (sl *SkipList) Delete(v interface{}, score int) bool
此外,可以使用func (sl *SkipList) printSkipList()方法打印跳跃表的索引结构,加深理解。
整体代码如下:
const MAX_LEVEL = 16 // 最大索引层级限制
// 不支持重复元素
// 支持相同的score
type SkipList struct {
Head *skipListNode
LevelN int // 包含原始链表的层数
Length int // 长度
}
type skipListNode struct {
Val interface{}
Level int // 该节点的最高索引层是多少
Score int
Next []*skipListNode // key是层高
}
func NewSkipList() *SkipList {
return &SkipList{
Head: newSkipListNode(nil, math.MinInt64, MAX_LEVEL),
LevelN: 1,
Length: 0,
}
}
func newSkipListNode(val interface{}, score, level int) *skipListNode {
return &skipListNode{
Val: val,
Level: level,
Score: score,
Next: make([]*skipListNode, level, level),
}
}
func (sl *SkipList) Insert(val interface{}, score int) (bool, error) {
if val == nil {
return false, errors.New("can't insert nil value to skiplist")
}
cur := sl.Head
update := [MAX_LEVEL]*skipListNode{} // 记录在每一层的插入位置,value保存哨兵结点
k := MAX_LEVEL - 1
// 从最高层的索引开始查找插入位置,逐级向下比较,最后插入到原始链表也就是第0级
for ; k >= 0; k-- {
for cur.Next[k] != nil {
if cur.Next[k].Val == val {
return false, errors.New("can't insert repeatable value to skiplist")
}
if cur.Next[k].Score > score {
update[k] = cur
break
}
cur = cur.Next[k]
}
// 如果待插入元素的优先级最大,哨兵节点就是最后一个元素
if cur.Next[k] == nil {
update[k] = cur
}
}
randomLevel := sl.getRandomLevel()
newNode := newSkipListNode(val, score, randomLevel)
// 插入元素
for i := randomLevel - 1; i >= 0; i-- {
newNode.Next[i] = update[i].Next[i]
update[i].Next[i] = newNode
}
if randomLevel > sl.LevelN {
sl.LevelN = randomLevel
}
sl.Length++
return true, nil
}
// skiplist在插入元素时需要维护索引,生成一个随机值,将元素插入到第1-k级索引中
func (sl *SkipList) getRandomLevel() int {
level := 1
for i := 1; i < MAX_LEVEL; i++ {
if rand.Int31()%7 == 1 {
level++
}
}
return level
}
func (sl *SkipList) Find(v interface{}, score int) *skipListNode {
if v == nil || sl.Length == 0 {
return nil
}
cur := sl.Head
for i := sl.LevelN - 1; i >= 0; i-- {
if cur.Next[i] != nil {
if cur.Next[i].Val == v && cur.Next[i].Score == score {
return cur.Next[i]
} else if cur.Next[i].Score >= score {
continue
}
cur = cur.Next[i]
}
}
// 如果没有找到该元素,这时cur是原始链表中,score相同的第一个元素,向后查找
for cur.Next[0].Score <= score {
if cur.Next[0].Val == v && cur.Next[0].Score == score {
return cur.Next[0]
}
cur = cur.Next[0]
}
return nil
}
func (sl *SkipList) Delete(v interface{}, score int) bool {
if v == nil {
return false
}
cur := sl.Head
// 记录每一层待删除数据的前驱结点
// 如果某些层没有待删除数据,那么update[i]为空
// 如果待删除数据不存在,那么update[i]也为空
update := [MAX_LEVEL]*skipListNode{}
for i := sl.LevelN - 1; i >= 0; i-- {
for cur.Next[i] != nil && cur.Next[i].Score <= score {
if cur.Next[i].Score == score && cur.Next[i].Val == v {
update[i] = cur
break
}
cur = cur.Next[i]
}
}
// 删除节点
for i := sl.LevelN - 1; i >= 0; i-- {
if update[i] == nil {
continue
}
// 如果该层中,删除节点是第一个节点且没有下一个节点,直接降低索引层(只有最高层会出现这种情况)
if update[i] == sl.Head && update[i].Next[i].Next[i] == nil {
sl.LevelN = i
continue
}
update[i].Next[i] = update[i].Next[i].Next[i]
}
sl.Length--
return true
}
func (sl *SkipList) printSkipList() {
if sl.Length > 0 {
for i := 0; i < sl.LevelN; i++ {
cur := sl.Head
output := fmt.Sprintf("The %dth skipList is: ", i)
for cur.Next[i] != nil && cur.Next[i].Val != nil {
// value(score)
output += fmt.Sprintf("-%v(%d)-", cur.Next[i].Val, cur.Next[i].Score)
cur = cur.Next[i]
}
fmt.Println(output)
}
}
}
之后有空可能会补充一些API,不过最关键的就是这些了。
如有疏漏请联系我,感谢!
Go语言的跳跃表(SkipList)实现的更多相关文章
- Redis数据结构之跳跃表-skiplist
在Redis中,zset是一个复合结构: 使用hash来存储value和score的映射关系 使用跳跃表来提供按照score进行排序的功能,同时可以指定score范围来获取value列表 结构 zse ...
- redis 5.0.7 源码阅读——跳跃表skiplist
redis中并没有专门给跳跃表两个文件.在5.0.7的版本中,结构体的声明与定义.接口的声明在server.h中,接口的定义在t_zset.c中,所有开头为zsl的函数. 一.数据结构 单个节点: t ...
- 跳跃表 SkipList【数据结构】原理及实现
为什么选择跳表 目前经常使用的平衡数据结构有:B树,红黑树,AVL树,Splay Tree, Treep等. 想象一下,给你一张草稿纸,一只笔,一个编辑器,你能立即实现一颗红黑树,或者AVL树出来吗? ...
- 探索c#之跳跃表(SkipList)
阅读目录: 基本介绍 算法思想 演化步骤 实现细节 总结 基本介绍 SkipList是William Pugh在1990年提出的,它是一种可替代平衡树的数据结构. SkipList在实现上相对比较简单 ...
- [Redis]Redis的设计与实现-链表/字典/跳跃表
redis的设计与实现:1.假如有一个用户关系模块,要实现一个共同关注功能,计算出两个用户关注了哪些相同的用户,本质上是计算两个用户关注集合的交集,如果使用关系数据库,需要对两个数据表执行join操作 ...
- Redis底层探秘(二):链表和跳跃表
链表简介 链表提供了高效的节点重排能力,以及顺序性的节点访问方式,并且可以通过增删节点来灵活地跳转链表的长度. 作为一种常用数据结构,链表内置在很多高级的编程语言里面,因为Redis使用C语言并没有内 ...
- redis 系列7 数据结构之跳跃表
一.概述 跳跃表(skiplist)是一种有序数据结构,它通过在每个节点中维持多个指向其他节点的指针,从而达到快速访问节点的目的.在大部分情况下,跳跃表的效率可以和平衡树(关系型数据库的索引就是平衡树 ...
- Redis(2)——跳跃表
一.跳跃表简介 跳跃表(skiplist)是一种随机化的数据结构,由 William Pugh 在论文<Skip lists: a probabilistic alternative to ba ...
- 【Redis】跳跃表原理分析与基本代码实现(java)
最近开始看Redis设计原理,碰到一个从未遇见的数据结构:跳跃表(skiplist).于是花时间学习了跳表的原理,并用java对其实现. 主要参考以下两本书: <Redis设计与实现>跳表 ...
随机推荐
- 面试官:你精通多少种语言的 Hello World?
Hello World,是程序员入门编程语言的第一课.不论是C.C++还是Java ,我们写的第一个程序就是它了,还记得小编在大一C语言课上,花了一整节课时间才把它打印到控制台上.万事开头难啊,相信看 ...
- (1)RabbitMQ简介与安装
1.RabbitMQ简介 因为RabbitMQ是基于开源的AMQP协议来实现的,所以在了解MQ时候,首先我们来了解下AMQP协议.AMQP,即Advanced Message Queuing Prot ...
- 数据库管理与迁移(Liquibase)
SpringBoot 是为了简化 Spring 应用的创建.运行.调试.部署等一系列问题而诞生的产物,自动装配的特性让我们可以更好的关注业务本身而不是外部的XML配置,我们只需遵循规范,引入相关的依赖 ...
- String类、static关键字、Arrays类、 Math类的一些学习心得
String类 java.lang.String 类代表字符串.Java程序中所有的字符串文字(例如"abc" )都可以被看作是实现此类的实例. 类 String 中包括用于检查各 ...
- CSS粘性定位
粘性定位(position:sticky) 1.定义 粘性定位可以被认为是相对定位和固定定位的混合.元素在跨越特定阈值前为相对定位,之后为固定定位.(MDN传送门) 这个特定阈值指的是 top, ri ...
- Tomcat启动流程简析
Tomcat是一款我们平时开发过程中最常用到的Servlet容器.本系列博客会记录Tomcat的整体架构.主要组件.IO线程模型.请求在Tomcat内部的流转过程以及一些Tomcat调优的相关知识. ...
- VMware Workstation安装centos
begin 2020年7月4日16:32:34 今天我们是食神,来做一道菜,名曰VMware Workstation安装centos. 首先我们需要准备好锅和食材. 锅和食材 锅:VMware Wor ...
- MySQL的数据类型 及注意事项
MySQL的数据类型 注意 选择合适的数据类型,能节省储存空间,提升计算性能.(1)在符合应用要求(取值范围.精度)的前提下,尽量使用“短”数据类型(2)数据类型越简单越好.(3)在MySQL中, ...
- 在具体的前端工作中通常HTML页面乱码怎么解决?
HTML文件乱码一般是因为编码格式不匹配造成的,比如:不同编码内容混杂.浏览器不能自动检测网页编码等等:但无论是哪种情况造成乱码,在HTML文件头中设置网页编码,匹配好编码格式就可. 下面是一个中文乱 ...
- AT2272 [ARC066B] Xor Sum 题解
题目连接:传送门 分析 这道题只看题目中给的样例是找不出规律的 所以我们可以打一下表 1, 2, 4, 5, 8, 10, 13, 14, 18 如果你还是没有看出什么规律的话,我们可以从OEIS上搜 ...