1.文件很大,不可能全部存储在内存中,所以要存在磁盘上 2.索引的组织结构要尽量减少查找过程中磁盘I/O的存取次数(为什么用B-/+Tree,还跟磁盘存取原理有关) 3.B+树所有的data域在叶子节点,一般来说都会进行一个优化,就是将所有的叶子节点用指针串起来,这样遍历叶子节点就能获得全部数据 二.什么是聚簇索引 像innodb中,主键的索引结构中,既存储了主键值,有存储了行数据,这种数据成为‘聚簇索引’ 三.为什么MongoDB采用B树索引,而mysql用B+树做索引 b+树只有叶节点存放数…
MySQL 树形索引结构 B树 B+树   如何评估适合索引的数据结构 索引的本质是一种数据结构 内存只是临时存储,容量有限且容易丢失数据.因此我们需要将数据放在硬盘上. 在硬盘上进行查询时也就产生了硬盘的I/O操作,而硬盘的I/O存取消耗的时间要比读取内存大很多.因此数据查询的时间主要决定于I/O操作的次数. 每访问一次节点就需要对磁盘进行一次I/O操作.   树模型 二分查找的时间复杂度是O(log2n),是一种很高效的查询方式.在一系类树种使用二分查找的树有很多,但并不是所有树都适合作为索…
MySQL InnoDB 索引 (INDEX) 页结构 InnoDB 为了不同的目的而设计了不同类型的页,我们把用于存放记录的页叫做索引页 索引页内容 索引页分为以下部分: File Header:表示页的一些通用信息,占固定的38字节 Page Header:表索引页专有的一些信息,占固定的56个字节 Infimum & Supremum:两个虚拟的伪记录,分别表示页中的最小和最大记录,占固定的26个字节 User Records:真实存储我们插入的记录的部分,大小不固定 Free Space…
B+树索引介绍 B+树索引的本质是B+树在数据库中的实现.但是B+树索引有一个特点是高扇出性,因此在数据库中,B+树的高度一般在2到3层.也就是说查找某一键值的记录,最多只需要2到3次IO开销.按磁盘每秒100次IO来计算,查询时间只需0.0.2到0.03秒.   数据库中B+树索引分为聚集索引(clustered index)和非聚集索引(secondary index).这两种索引的共同点是内部都是B+树,高度都是平衡的,叶节点存放着所有数据.不同点是叶节点是否存放着一整行数据.   (1)…
引言 回想四年前,我在学习mysql的索引这块的时候,老师在讲索引的时候,是像下面这么说的 索引就像一本书的目录.而当用户通过索引查找数据时,就好比用户通过目录查询某章节的某个知识点.这样就帮助用户有效地提高了查找速度.所以,使用索引可以有效地提高数据库系统的整体性能. 嗯,这么说其实也对.但是呢,大家看完这种说法,其实可能还是觉得太抽象了!因此呢,我还想再深入的细说一下,所以就有了此文! 需要说明的是,我说的内容只在Mysql的Innodb引擎中是成立的.在Sql Server.oracle.…
引言 回想四年前,我在学习mysql的索引这块的时候,老师在讲索引的时候,是像下面这么说的 索引就像一本书的目录.而当用户通过索引查找数据时,就好比用户通过目录查询某章节的某个知识点.这样就帮助用户有效地提高了查找速度.所以,使用索引可以有效地提高数据库系统的整体性能. 嗯,这么说其实也对.但是呢,大家看完这种说法,其实可能还是觉得太抽象了!因此呢,我还想再深入的细说一下,所以就有了此文!需要说明的是,我说的内容只在Mysql的Innodb引擎中是成立的.在Sql Server.oracle.M…
基本概念 对于mysql目前的默认存储引擎Innodb来说,索引分为2个,一个是聚集索引,一个是普通索引(也叫二级索引). 聚集索引:聚集索引的顺序和数据在磁盘的顺序一致,因此查询时使用聚集索引,效率更高,但是因此聚集索引也只能一条.一般来说,主键就是聚集索引,当然没有主键的话,就会创建一个隐藏的列来作为聚集索引列.B+树的叶子节点就是数据值 2级索引就是不是聚集索引的索引了.其叶子节点存的是指向数据值的地址. 为什么需要索引? 数据存储到数据库中是以数据块作为基本单位存放的,每个表有个参数叫块…
0.索引结构 1).MyISAM与InnoDB索引结构比较,如下: 2).MyISAM的索引结构 主键索引和二级索引结构很像,叶子存储的都是索引以及数据存储的物理地址,其他节点存储的仅仅是索引信息.其数据物理地址相连. 3).InnoDB的索引结构 主键索引的每一个叶子存储的都是一行数据,而二级索引的每一个叶子存储的是二级索引以及主键索引,其他节点存储的仅仅是索引信息. 1.索引使用原则 1).最左前缀匹配原则,mysql会一直向右匹配直到遇到范围查询(>.<.between.like)就停止…
本文由  网易云发布. 作者:范鹏程,网易考拉海购 InnoDB是 MySQL最常用的存储引擎,了解InnoDB存储引擎的索引对于日常工作有很大的益处,索引的存在便是为了加速数据库行记录的检索.以下是我对最近学习的知识的一些总结,以及对碰到的以及别人提到过的问题的一些分析,如有错误,请指正,我会及时更正. 目录 InnoDB表结构 B树与B+树 聚簇索引和二级索引 SQL执行顺序 SQL优化建议 一些问题分析 参考资料 1. InnoDB表结构 此小结与索引其实没有太多的关联,但是为了便于理解索…
一.B+树是什么 B+ 树是一种树型数据结构,通常用于数据库和操作系统的文件系统中.B+ 树的特点是能够保持数据稳定有序,其插入与修改操作拥有较稳定的对数时间复杂度.B+ 树元素自底向上插入,这与二叉树恰好相反. B+ 树的创造者Rudolf Bayer没有解释B代表什么.最常见的观点是B代表平衡(balanced),因为所有的叶子节点在树中都在相同的级别上.B也可能代表Bayer,或者是波音(Boeing),因为他曾经工作于波音科学研究实验室 1)B+树的节点 在 B+ 树中的节点通常被表示为…