Hash索引和B+树索引总结
先说Hash索引
在理想的情况下,key非常分散,不存在Hash碰撞的话,采用Hash索引可以唯一得确定一个key的位置,并且这个位置上就只有一个key,所以查找时间复杂度是O(1),非常快,这是Hash索引的最主要优势。但是呢,Hash索引不是没有缺点,不存在Hash碰撞这是理想情况,通常情况下,同一个Hash值都不只有一个key,也就是说你根据一个key找到了他的hash值位置之后,但是这个位置还有别的key,所以你还得从这个位置找到真正的key,至于怎么找,这个和具体的hash碰撞处理方式有关,最常用的扩展链表法,就是在hash位置上放置链表,此时,就存在一个链表查询的过程,如果hash碰撞比较严重,查询的时间复杂度就远不止O(1),那么hash索引的优势就失去了。其次,Hash索引是不排序的,因此它只适用于等值查询,如果你要查询一定的范围内的数据,那么hash索引是无能为力的,只能把数据挨个查,而不能仅仅是查询到头尾数据之后,从头读到位。并且,hash索引也无法根据索引完成排序,这也是它的不足之一。
再说B+数索引
B+树是一颗严格平衡搜索的树,从根节点到达每一个叶子节点的路径长度都是一样的,并且每个节点可以有多个孩子节点(高扇出),所以可以进可能的把树的高度降到很低。这么做的好处是可以降低读取节点的次数,这就是的B+树非常适合做外部文件索引了。在外部文件索引中,必须要读取到一个节点之后,才能知道它所有的孩子几点的位置,而读取一个节点对应一次IO,所以读取叶子节点的IO数就等于树的高度了,因此树的高度越低,所需要的IO次数就越少。B+树是一颗搜索树,所有的数据都放在叶子节点上,并且这些数据是按顺序排列的。所以在范围查询中,只需要找到范围的上下界节点,就可以得到整个范围内的数据,而且还有一个好处,由于这些数据都是排好序的,所以无需对数据进行再次排序。
总结:
1.Hash索引在不存在hash碰撞的情况下,之需一次读取,查询复杂度为O(1),比B+树快。
2.但是Hash索引是无序的,所以只适用于等值查询,而不能用于范围查询,自然也不具备排序性。根据hash索引查询出来的数据,还有再次进行排序
3.B+树索引的复杂度等于树的高度,一般为3-5次IO。但是B+树叶子节点上的数据是排过序的,因此可以作用于范围查找,而且查询的数据是排过序的,无需再次排序。对于像“SELECT xxx FROM TABLE1 WHERE xxx LIKE 'aaa%'”这样涉及到模糊匹配的查询,本质上也是范围查询。
4.还有一点,数据库中的多列索引中,只能用B+树索引。数据在B+树的哪个结点上,只取决于最左边的列上的key,在结点中在一次按照第二列、第三列排序。所以B+树索引有最左原则的特性。
Hash索引和B+树索引总结的更多相关文章
- Hash索引和B树索引
要知道磁盘结构优化访问的关键在于以block为单位(比如每次读取一个页面) 这两种索引差别也就在聚集到一个block的标准: B树聚集到一个block是因为关键字在一个范围内,关键字在block内的排 ...
- SQL优化 MySQL版 - B树索引详讲
SQL优化 MySQL版 - -B树索引详讲 作者:Stanley 罗昊 [转载请注明出处和署名,谢谢!] 为什么要进行SQL优化呢?很显然,当我们去写sql语句时: 1会发现性能低 2.执行时间太 ...
- 搞懂MySQL InnoDB B+树索引
一.InnoDB索引 InnoDB支持以下几种索引: B+树索引 全文索引 哈希索引 本文将着重介绍B+树索引.其他两个全文索引和哈希索引只是做简单介绍一笔带过. 哈希索引是自适应的,也就是说这个不能 ...
- 深入研究B树索引(一)
摘要:本文对B树索引的结构.内部管理等方面做了一个全面的介绍.同时深入探讨了一些与B树索引有关的广为流传的说法,比如删除记录对索引的影响,定期重建索引能解决许多性能问题等. 1.B树索引的相关概念 索 ...
- 基于R树索引的点面关系判断以及效率优化统计
文章版权由作者李晓晖和博客园共有,若转载请于明显处标明出处:http://www.cnblogs.com/naaoveGIS/ 1.背景 在之前的博客中,我分别介绍了基于网格的空间索引(http:// ...
- MySQL之B+树索引(转自掘金小册 MySQL是怎样运行的,版权归作者所有!)
每个索引都对应一棵B+树,B+树分为好多层,最下边一层是叶子节点,其余的是内节点.所有用户记录都存储在B+树的叶子节点,所有目录项记录都存储在内节点. InnoDB存储引擎会自动为主键(如果没有它会自 ...
- mysql在innodb索引下b+树的高度问题。
B+树索引介绍 B+树索引的本质是B+树在数据库中的实现.但是B+树索引有一个特点是高扇出性,因此在数据库中,B+树的高度一般在2到3层.也就是说查找某一键值的记录,最多只需要2到3次IO开销.按磁盘 ...
- [转帖]B树索引和位图索引的结构介绍
B树索引和位图索引的结构介绍 http://blog.itpub.net/12679300/viewspace-1174236/ 一 前言:? ROWID:包含键值的行的行ID,(查找块的最快方法, ...
- MySQL索引(一)索引基础
索引是数据库系统里面最重要的概念之一.一句话简单来说,索引的出现其实是为了提高数据查询的效率,就像书的目录一样. 常见模型 索引的出现是为了提高查询效率,但是实现索引的方式却有很多种,这里就介绍三种常 ...
随机推荐
- 七月小说网 Python + GraphQL (三)
概述 后台数据库几个基本表基本搭建完毕,看了下Github Develop的V4 Api抛弃了RESTful,采用GraphQL,感觉很有意思,一看文档,竟然有Python的开源实现 Graphene ...
- vs2010 does not have a strong name
处理步骤: C:\myWorkSpace\IECG Dev. Tool\Forklift\DbUpgraderDLL\bin\Debug 为dll 所在目录 DbUpgraderDLL.dll为dll ...
- SSM项目配置文件及其各项使用
$说明: ·Spring 5 + Mybatis 3.4.5 +SpringMVC ·使用druid数据库 ·使用log4j输出日志 $Spring 及其配置文件(部分) Spring官方网站:h ...
- Deferred Shading,延迟渲染(提高渲染效率,减少多余光照计算)【转】
Deferred Shading,看过<Gems2> 的应该都了解了.最近很火的星际2就是使用了Deferred Shading. 原帖位置: http://blog.csdn.net ...
- [原创]ObjectARX开发环境搭建之VS2010+ObjectARX2012Wizard+Addin工具条问题修复
目前ObjectARX版本越来越高,也越来越简化开发,如果需要同时开发低版本和高版本的ARX程序,就需要搭建批量编译环境,以满足ARX开发的需要. 批量编译的搭建网络上已经有了很多的教程,基本上都是基 ...
- 1. C语言对文件的操作
1. 文件常见输入输出函数与屏幕.键盘输入输出函数的对比,如:fprintf.fscanf等. #define _CRT_SECURE_NO_WARNINGS #include <stdio.h ...
- P3705 [SDOI2017]新生舞会 01分数规划+费用流
$ \color{#0066ff}{ 题目描述 }$ 学校组织了一次新生舞会,Cathy作为经验丰富的老学姐,负责为同学们安排舞伴. 有\(n\)个男生和\(n\)个女生参加舞会买一个男生和一个女生一 ...
- C# 动态创建实例化泛型对象,实例化新对象 new()
普通类实现字符串创建实例: var type =Assembly.Load("SqlSugar").GetType("SqlSugar.SqlServerDb" ...
- TFS 30177 错误
不知道什么原因,创建团队项目失败. 参考 下面链接成功解决,表示感谢. http://www.cnblogs.com/Wendy_Yu/archive/2012/07/26/TFS2010_T ...
- 锐速破解版linux一键自动安装包
锐速破解版linux一键自动安装包(5月28日更新) 锐速破解版安装方法: wget -N --no-check-certificate https://github.com/91yun/server ...