什么是索引

索引是帮助MySQL高效获取数据的排好序的数据结构

索引数据结构(掌握)

数据结构可视化

前置知识:树的高度越低查询效率越高

二叉树:不能自平衡,极端情况出现倾斜,查询效率和链表类似

红黑树:数据量大不适合

Hash

B树:

- 叶节点具有相同的深度,叶节点的指针为空
- 所有索引元素不重复
- 节点中的数据索引从左到右递增排列

B+树:

  • 非叶子节点不存储data,只存储索引(冗余存储),可以放更多的索引
  • 叶子节点包含所有索引字段
  • 叶子节点用指针连接,提高区间访问的性能

假如树的度是3,在一层添加第四个元素的时候,会将中间节点冗余作为父节点,叶子节点依然保存所有索引。

B+树又称多路/多叉平衡树,上图空白处是下一个字节点的地址,空白处是6byte,一个索引8byte(以bigint为例)。

所有叶子节点是从左到右递增

一颗B+树可以存多少数据

树的高度多少能存放1000万数据

一个节点大小16k,是磁盘存储块的大小,

16k/(6+8)=1170,每个节点放满16k,每个节点可以存储1170个索引。

一个叶子节点中的每个索引和数据大概1k,也就是一个叶子节点可以存放约16个索引和数据。

一个B+树总共可以存放的数据:1170x1170x16=2000万

根节点一般放内存。

第一层,一个节点可以放1170个索引

2000万数据,最多经过IO,可以查到数据。

MyISAM存储引擎索引的实现

MyISAM索引文件和数据文件是分离的(非聚集)

存储引擎是作用于表的

索引文件存放索引,数据文件存放数据,索引和数据不放在一起存

查询:先查询B+树上的索引,再用查询到的位置查询数据文件

Innodb存储引擎索引实现

.ibd 表和数据放一起

叶子节点存放索引的列数据

聚集索引:

  • 表数据文件本身就是按B+树组织的一个索引结构文件
  • 聚集索引-叶子节点包含了完整的数据记录
  • 为什么非主键索引结构叶子节点存储的是主键值?(一致性和节省内存)

聚集索引的意思:叶子节点存放了索引和数据

又叫聚簇索引。非聚集索引又叫稀疏索引。

为什么InnoDB表必须有主键,并且推荐使用整型的自增主键?

主键是InnoDB用来构建B+树的。

如果没有主键,会使用唯一的列作为索引,

如果还是没有,会建立隐藏列,作为索引列。

如果不用整型的自增主键,用UUID作为主键会怎么样?

  • UUID是字符串类型,查询操作会有比较操作,整型比较操作快

  • 整型主键比UUID省空间

  • UUID不是自增的

HASH索引:值做hash运算,运算后的值和存储位置一一映射

为什么不用Hash?

Hash对范围查询支持不好。某一列数据是无序的,B+树在构建的时候可以让数据有序。

如何基于B+树精准建立高性能索引

B树

  • 叶子节点具有相同的深度,叶子节点的指针为空
  • 所有索引元素不重复
  • 节点中的数据索引从左到右递增排列

B+树索引

  • 非叶子节点不存储data,只存储索引(冗余),可以放更多的索引
  • 叶子节点包含所有索引字段
  • 叶子节点用指针连接,提高区间访问的性能

为什么data节点挪到叶子节点,一个节点可以存储更多的索引

16^n=2000万,n就是树的高度,

存储同样的数据,B+树的高度远远小于B树

mysql不使用自增主键会怎么样?

插入过程中,B+树会因为一个节点存放不了索引而分裂,然后重新自平衡,影响效率。

联合索引底层数据结构

B+树每个节点上的索引是有序的,且符合二叉平衡树的规则,左子树小于根节点,右子树大于根节点。

联合索引插入时如何维护顺序呢?

依次从左到右比较字段的大小。按创建索引的顺序比较大小。

你必须知道的MySQL知识点的更多相关文章

  1. Javascript:必须知道的Javascript知识点之“单线程事件驱动”

    heiboard: Javascript:必须知道的Javascript知识点之“单线程事件驱动”

  2. 面试前必须知道的MySQL命令【explain】

    前言 只有光头才能变强 刷面试题的时候,不知道你们有没有见过MySQL这两个命令:explain和profile(反正我就见过了).. 之前虽然知道这两个命令大概什么意思,但一直没有去做笔记.今天发现 ...

  3. 必须知道的String知识点

    1.String 类型的概述 Java中String就是Unicode字符序列,例如,字符串"Java\u2122"由5个Unicode字符J.a.v.a和 ™ 组成.不像C/C+ ...

  4. 《jQuery风暴》第2章 必须知道的JavaScript知识

    第2章 必须知道的JavaScript知识 JavaScript是jQuery应用的基础,掌握JavaScript这门语言是使用jQuery的基础条件.本章不会全面细致的讲解JavaScript的全部 ...

  5. 必须知道的ADO.NET 数据库连接池

    http://www.cnblogs.com/liuhaorain/archive/2012/02/19/2353110.html 题外话 通过前几章的学习,不知道大家对ADO.NET有一定的了解了没 ...

  6. C语言学习书籍推荐《你必须知道的495个C语言问题》

    萨米特 (Steve summit) (作者), 孙云 (译者), 朱群英 (译者) 下载地址:点我 <你必须知道的495个C语言问题>以问答的形式组织内容,讨论了学习或使用C语言的过程中 ...

  7. C#刨根究底:《你必须知道的.NET》读书笔记系列

    一.此书到底何方神圣? <你必须知道的.NET>来自于微软MVP—王涛(网名:AnyTao,博客园大牛之一,其博客地址为:http://anytao.cnblogs.com/)的最新技术心 ...

  8. (转)【推荐】初级.NET程序员,你必须知道的EF知识和经验

    转自:http://www.cnblogs.com/zhaopei/p/5721789.html [推荐]初级.NET程序员,你必须知道的EF知识和经验   阅读目录   [本文已下咒.先顶后看,会涨 ...

  9. 《你必须知道的.NET》读书笔记一:小OO有大智慧

    此篇已收录至<你必须知道的.Net>读书笔记目录贴,点击访问该目录可以获取更多内容. 一.对象  (1)出生:系统首先会在内存中分配一定的存储空间,然后初始化其附加成员,调用构造函数执行初 ...

随机推荐

  1. UNION 和 UNION ALL的区别,一个例子就看明白

    [UNION ALL] select a,b,sum(sm) AS s1, SUM(qm) AS s2 from ( select 'a' AS a, 'b' AS b, 2 AS sm, 200 A ...

  2. day002|python基础回顾2

    目录 00 上节课复习 01 基本数据类型 02 与用户交互 03 运算符 04 流程运算之if判断 05 流程判断之while循环 06 TEST 00 上节课复习 ""&quo ...

  3. (一)廖师兄springboot微信点餐SQL建表脚本

      数据库设计 数据库表之间的关系 类目表(product_category) 商品表(product_info) 订单主表(order_master) 订单详情表(order_detail) 卖家信 ...

  4. 3、Spring Boot日志

    1.日志框架 市面上的日志框架:JUL.JCL.Jboss-logging.logback.log4j.log4j2.slf4j.... 日志门面 (日志的抽象层) 日志实现 JCL(Jakarta ...

  5. java基本权限指南之:文件和共享目录的基本权限

    简介 java程序是跨平台的,可以运行在windows也可以运行在linux.但是平台不同,平台中的文件权限也是不同的.windows大家经常使用,并且是可视化的权限管理,这里就不多讲了. 本文主要讲 ...

  6. Linux提权(持续更新)

    利用/etc/passwd提权 个人认为,这种提权方式在现实场景中难以实现,条件太过苛刻,但是建立Linux下的隐藏账户是个不错的选择,灵感来自:https://www.hackingarticles ...

  7. python 中 try...finally... 的优雅实现

    1. 关于 try.. finally.. 假如上帝用 python 为每一个来到世界的生物编写程序,那么除去中间过程的种种复杂实现,最不可避免的就是要保证每个实例最后都要挂掉.代码可简写如下: tr ...

  8. 解析MindMapper选项中的鱼骨选项

    MindMapper思维导图可以画鱼骨图,而且完成的相当漂亮,我们可以在选项设置中定义鱼骨图图的默认样式.下面本文就分析了MindMapper选项中可以更改哪些鱼骨图设置. 我们首先打开MindMap ...

  9. k8s内网安装部署(二)

    续上篇 https://www.cnblogs.com/wangql/p/13397034.html 一.kubeadm安装 1.kube-proxy开启ipvs的前置条件 modprobe br_n ...

  10. LeetCode双周赛#36

    1604. 警告一小时内使用相同员工卡大于等于三次的人 题目链接 题意 给定两个字符串数组keyName和keyTime,分别表示名字为keytime[i]的人,在某一天内使用员工卡的时间(格式为24 ...