查找——图文翔解Treap(树堆)
之前我们讲到二叉搜索树,从二叉搜索树到2-3树到红黑树到B-树。
二叉搜索树的主要问题就是其结构与数据相关,树的深度可能会非常大,Treap树就是一种解决二叉搜索树可能深度过大的还有一种数据结构。
Treap
Treap=Tree+Heap。
Treap本身是一棵二叉搜索树,它的左子树和右子树也各自是一个Treap。和一般的二叉搜索树不同的是。Treap纪录一个额外的数据,就是优先级。Treap在以关键码构成二叉搜索树的同一时候,还满足堆的性质。这些优先级是是在结点插入时,随机赋予的。Treap依据这些优先级满足堆的性质。这种话,Treap是有一个随机附加域满足堆的性质的二叉搜索树,其结构相当于以随机数据插入的二叉搜索树。
其基本操作的期望时间复杂度为O(logn)。相对于其它的平衡二叉搜索树,Treap的特点是实现简单。且能基本实现随机平衡的结构。
Treap维护堆性质的方法仅仅用到了旋转。仅仅须要两种旋转。编程复杂度比Splay要小一些。
插入
给节点随机分配一个优先级,先和二叉搜索树的插入一样,先把要插入的点插入到一个叶子上,然后跟维护堆一样。假设当前节点的优先级比根大就旋转,假设当前节点是根的左儿子就右旋,假设当前节点是根的右儿子就左旋。
以下我们以一个实例来图解Treap的插入过程。看完之后你一定对Treap的插入了然于胸。
删除
删除一个节点有两种方式。能够像删除二叉树节点那样删除一个节点。也能够像删除堆中节点那样删除。
1、用二叉搜索树的方式删除
先在二叉查找树中找到要删除的节点的位置,然后依据节点分下面情况:
情况一:
该节点是叶节点(没有非空子节 点的节点),直接把节点删除就可以。
情况二:
该节点是链节点(仅仅有一个非空子节点的节点),为了删除这个节点而不影响它的子树,须要把它的子节点取代它的位置,然后把它删除。
watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQveWFuZ195dWxlaQ==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center" width="400" height="220" alt="">
该节点有两个非空子节点。因为情况比較复杂,一般的策略是用它右子树的最小值来取代它,然后把它删除。如图所看到的,删除节点2时,在它的右子树中找到最小的节点3, 该节点一定为待删除节点的后继。删除节点3(它可能是叶节点或者链节点),然后把节点2的值改为3。
(当然,我们也能够使用结点的左子树的最大值来替代它,为了不使Treap向一边偏沉,我们能够随机地选取是用后继还是前驱取代它, 并保证两种选择的概率均等。)
关于查找最小值:
基本方法就是从子树的根节点開始, 假设左子节点不为空,那么就訪问左子节点,直到左子节点为空,当前节点就是该子树的最 小值节点。删除它仅仅需用它的右子节点取代它本身。
2、用堆的方式删除
由于Treap满足堆性质,所以仅仅须要把要删除的节点旋转到叶节点上。然后直接删除就能够了。
详细的方法:
假设该节点的左子节点的优先级小于右子节点的优先级。右旋该节点,使该节点降为右子树的根节点,然后訪问右子树的根节点,继续操作。
反之,左旋该节点,使该节点降为左子树的根节点,然后訪问左子树的根节点。继续操作,直到变成能够直接删除的节点。
(即:让小优先级的结点旋到上面,满足堆的性质)
删除最多进行O(h)次旋转,期望复杂度是O(logn)。
查找
和一般的二叉搜索树一样。可是因为Treap的随机化结构,Treap中查找的期望复杂度是O(logn)。
对照
与 Splay树 相比:
Splay 和 BST 一样,不须要维护不论什么附加域,比 Treap 在空间上有节约。但 Splay 在查找时也会调整结构,这使得 Splay 灵活性稍有欠缺。Splay 的查找插入删除等基本操作的时间复杂度为均摊O(logN)而非期望。能够有益构造出使 Splay 变得非常慢的数据。
与AVL 红黑树相比:
AVL 和红黑树在调整的过程中,旋转都是均摊 O(1)的,而 Treap 要 O(logN)。
与 Treap 的随机优先级不同,它们维护的附加域要动态的调整,而 Treap 的随机修正值一经生成不再改变,这一点使得灵活性不如 Treap。
AVL 和红黑树都是时间效率非常高的经典算法,在很多专业的应用领域(如 STL)有着十分重要的地位。然而AVL和红黑树的编程实现的难度要比Treap大得多。
维护子树的大小
Treap 是一种排序的数据结构,假设我们想查找第k小的元素或者询问某个元素在Treap中从小到大的排名时,我们就必须知道每一个子树中节点的个数。
因为插入、删除、旋转等操作,会使每一个子树的大小改变,所 以我们必须对子树的大小进行动态的维护。
对于旋转,我们要在旋转后对子节点和根节点分别又一次计算其子树的大小。 
对于插入,在寻找插入的位置时,每经过一个节点,都要先使以它为根的子树的大小添加 1,再递归进入子树查找。 
对于删除,在寻找待删除节点,递归返回时要把全部的经过的节点的子树的大小降低 1。
要注意的是,删除之前一定要保证待删除节点存在于 Treap 中。
(维护了子树的大小,我们就能够求“排名第k的元素”这种问题了。
快排也能求“第k大”问题,可是快排适合静态的数据,对于常常变动的数据。我们用树结构来维护更灵活。)
(我们还能够求“某个元素的排名”。我们的基本思想是查找目标元素在 Treap 中的位置,且在查找路径中统计出小于目标元素的节点的总个数,目标元素的排名就是总个数+1。即:在查找的路径中统计小于目标元素的个数,当找到目标元素后加上其左子树的个数就可以。)
举个栗子
Treap 是一种高效的动态的数据容器,据此我们能够用它处理一些数据的动态统计问题。
一、一个应用实例
[问题描写叙述] 有一个游戏排名系统,通常要应付三种请求:上传一条新的得分记录、查询某个玩家的当前 排名以及返回某个区段内的排名记录。
当某个玩家上传自己最新的得分记录时,他原有的得 分记录会被删除。
为了减轻server负担,在返回某个区段内的排名记录时,最多返回 10 条 记录。
[求]
(1)更新玩家的得分记录
(2)查询玩家排名(假设两个玩家的得分同样, 则先得到该得分的玩家排在前面。
)
(3)查询第 Index 名開始的最多 10 名玩家名字
[解]
由于作为字符串的姓名是不便于处理的,我们给每一个玩家都制定一个ID,首先要建立一个由姓名到玩家ID的映射数据结构。
为了查找高速,能够用Trie树。之后我们建立一个双keyword的Treap,keyword1为得分从小到大,keyword2为时间戳从大到小,这样的排列方式的逆序,恰好是我们要的顺序(也能够直接就是逆序)。
对于问题(1),先查询玩家是否已经存在,假设已经存在,在Treap中更新相应已经存在的记录。
对于问题(2),就是主要的求排名操作。
对于问题(3)。就是分别查找第(总记录数 + 1 – k)小的记录。
二、双端优先队列的实现
优先队列(Priority Queue)是一种按优先级维护进出顺序的数据容器结构,能够选择维护实现取出最小值或最大值。我们通经常使用堆实现优先队列,通常取出最值的时间复杂度为 O(logN)。
用最小堆能够实现最小优先队列,用最大堆能够实现最大优先队列。可是假设我们要求一种 “双端优先队列”,即要求同一时候支持插入、取出最大值、取出最小值的操作,用一个单纯的堆就不能高效地实现了。
(能够用两个堆来实现,两堆中的元素都互指,但维护两个堆比較复杂。)
我们能够方便地使用Treap实现双端优先队列,仅仅需建立一个 Treap,分别写出取最大值和最小值的功能代码就能够了, 无需做不论什么改动。
因为Treap平衡性不如堆完美,但期望时间仍是 O(logN)。更重要的是在 实现的复杂程度上大大下降,并且便于其它操作的推广。所以,用 Treap 实现优先队列不失为一种便捷而又灵活的方法。
其他:
平衡树并不适合作为全部数据类型的数据的有序存储容器,由于可能有些类型的两个元素直接相互比較大小是十分 耗时的,这个常数时间的消耗是无法忍受的。比如字符串,作为检索字符串的容器,我们更推荐Trie树,而不是平衡树。平衡树仅适合做元素间相互比較时间非常少的类型的有序存储容器。
基本方法就是从子树的根节点開始, 假设左子节点不为空,那么就訪问左子节点,直到左子节点为空,当前节点就是该子树的最 小值节点。删除它仅仅需用它的右子节点取代它本身。
【參考】
中文维基百科http://zh.wikipedia.org/wiki/%E6%A0%91%E5%A0%86
《随机平衡二叉查找树Treap的分析与应用》 清华大学计算机系 郭家宝
查找——图文翔解Treap(树堆)的更多相关文章
- 查找——图文翔解HashTree(哈希树)
		引 在各种数据结构(线性表.树等)中,记录在结构中的相对位置是随机的.因此在机构中查找记录的时须要进行一系列和keyword的比較.这一类的查找方法建立在"比較"的基础上.查找的效 ... 
- 查找——图文翔解SkipList(跳跃表)
		跳跃表 跳跃列表(也称跳表)是一种随机化数据结构,基于并联的链表,其效率可比拟于二叉查找树(对于大多数操作须要O(logn)平均时间). 基本上.跳跃列表是对有序的链表添加上附加的前进链接,添加是以随 ... 
- BZOJ3224/LOJ104     普通平衡树 treap(树堆)
		您需要写一种数据结构,来维护一些数,其中需要提供以下操作:1. 插入x2. 删除x(若有多个相同的数,因只删除一个)3. 查询x的排名(若有多个相同的数,因输出最小的排名)4. 查询排名为x的数5. ... 
- 可旋转Treap(树堆)总结
		树堆,在数据结构中也称Treap,是指有一个随机附加域满足堆的性质的二叉搜索树,其结构相当于以随机数据插入的二叉搜索树.其基本操作的期望时间复杂度为O(logn).相对于其他的平衡二叉搜索树,Trea ... 
- treap(树堆)
		一棵treap是一棵修改了结点顺序的二叉查找树,如图,显示一个例子,通常树内的每个结点x都有一个关键字值key[x],另外,还要为结点分配priority[x],它是一个独立选取的随机数. 假设所有的 ... 
- B树和B+树的插入、删除图文详解(good)
		B树和B+树的插入.删除图文详解 1. B树 1. B树的定义 B树也称B-树,它是一颗多路平衡查找树.我们描述一颗B树时需要指定它的阶数,阶数表示了一个结点最多有多少个孩子结点,一般用字母m表示阶数 ... 
- 树堆(Treap)学习笔记 2020.8.12
		如果一棵二叉排序树的节点插入的顺序是随机的,那么这样建立的二叉排序树在大多数情况下是平衡的,可以证明,其高度期望值为 \(O( \log_2 n )\).即使存在一些极端情况,但是这种情况发生的概率很 ... 
- 数据结构图文解析之:树的简介及二叉排序树C++模板实现.
		0. 数据结构图文解析系列 数据结构系列文章 数据结构图文解析之:数组.单链表.双链表介绍及C++模板实现 数据结构图文解析之:栈的简介及C++模板实现 数据结构图文解析之:队列详解与C++模板实现 ... 
- Treap树理解
		title: Treap树理解 comments: true date: 2016-10-06 07:57:37 categories: 算法 tags: Treap树 树 Treap树理解 简介 随 ... 
随机推荐
- MVC in Javascript
			MVC in Javascript From http://www.cnblogs.com/tugenhua0707/p/5156179.html 原博的比我详细 我是以自己的惯用的方式实现了一下 M ... 
- Javascript禁止父元素滚动条滚动, pc、移动端均有效
			在网页中经常会遇到这样的场景, 网页比较长有滚动条, 然后网页内的某个内容块里面的内容也比较长, 也具有滚动条.当鼠标移到内容块中使用滚动条来滚动查看内容到达底部或头部的时候,父元素的滚动条也就开始滚 ... 
- paip.c++ qt 外部dll共享库的导入以及引用
			paip.c++ qt 外部dll共享库的导入以及引用 作者Attilax , EMAIL:1466519819@qq.com 来源:attilax的专栏 地址:http://blog.csdn. ... 
- LightOJ - 1422 Halloween Costumes (区间dp)
			Description Gappu has a very busy weekend ahead of him. Because, next weekend is Halloween, and he i ... 
- python 的一些高级编程技巧
			正文: 本文展示一些高级的Python设计结构和它们的使用方法.在日常工作中,你可以根据需要选择合适的数据结构,例如对快速查找性的要求.对数据一致性的要求或是对索引的要求等,同时也可以将各种数据结构合 ... 
- javascript第四课变量作用域
			局部变量: function f1() { var n1=0; //局部变量 n1=10; //全局变量,当前页面均可调用 } n1=10;//全局变量 var n1=10;//全局变量 在方法内的 ... 
- 《github一天一道算法题》:插入排序
			看书.思考.写代码! /*********************************************** * copyright@hustyangju * blog: http://bl ... 
- TCP慢启动算法
			慢启动定义 慢启动,是传输控制协议使用的一种阻塞控制机制.慢启动也叫做指数增长期.慢启动是指每次TCP接收窗口收到确认时都会增长.增加的大小就是已确认段的数目.这种情况一直保持到要么没有收到一些段,要 ... 
- html教程系列--form frameset
			<font> 标签: 规定文本的字体.字体尺寸.字体颜色.不建议直接使用,可以使用样式表替代. <footer> 标签:定义公用的底部信息.通常包含文档的作者.版权信息.使用条 ... 
- 第七课 GC资源管理器实验
			<GC资源管理器> 要求: 1.定义2个资源消耗组(OLTP事务处理资源消耗组和DSS数据仓库资源消耗组) 2.创建一个日程计划schedule 3.对于OLTP资源消耗组,我们最多不 ... 
