谈谈MySQL 索引
1、索引是什么
索引(Index)是帮助MySQL高效获取数据的数据结构。我们可以简单理解为:索引的目的在于提高查询效率。
2、原理
索引的数据结构是B+树,原理图如下

关于B+树的详细介绍,可以参见文章下面的参考。
精简描述:B+树是为了磁盘或其他直接存储辅助设备设计的一种平衡查找树。在B+树中,所有记录节点都是按键值的大小顺序存放在叶子节点上,各叶子节点直接由指针进行连接。
B+树中的B不是代表二叉(binary),而是代表平衡(balance),因为B+树是从最早的平衡二叉树演化而来,但是B+树不是一个二叉树。
索引的内部也是一张表,索引组织表,索引的构建需要使用到磁盘空间跟内存空间,并不是索引越多越好,太多反而导致性能下降,建议一张表最多不要超过8个索引。
3、索引分类
下面的分类维度没有标准,但一般索引我们会比较关注聚集索引跟非聚集索引。
3.1 聚集索引
聚集索引(clustered index)是按照每张表的主键构造一棵B+树,同时叶子节点中存放的即为整张表的行记录数据,也将聚集索引的叶子节点称为数据页。
由于实际的数据页只能按照一棵B+树进行排序,因此每张表只能拥有一个聚集索引。
主键是一个聚集索引,如果在InnoDB没有定义主键,那么默认生成一个rowId作为聚集索引。
3.2 非聚集索引
非聚集索引(Secondary Index,也称辅助索引),叶子节点并不包含行记录的全部数据。叶子节点除了包含键值以外,每个叶子节点中的索引行中还包含了一个书签(bookmark)。该书签用来告诉InnoDB存储引擎哪里可以找到与索引相对应的行数据。
当通过辅助索引来寻找数据时,InnoDB存储引擎会遍历辅助索引并通过叶级别的指针获得指向主键索引的主键,然后再通过主键索引来找到一个完整的行记录。

3.3 覆盖索引
从辅助索引中就可以得到查询的记录,而不需要查询聚集索引中的记录。
使用覆盖索引的好处是辅助索引不包括整行记录中的所有信息,可以减少IO操作。
3.4 唯一索引
不允许具有索引值相同的行,从而禁止重复的索引或键值。
3.5 联合索引
联合索引是指对表上的多个列进行索引。从本质上来说,联合索引也是一颗B+树,不同的是联合索引的键值的数量不是1,而是大于等于2。
索引匹配的原则是最左匹配原则,MySQL会一直向右匹配直到遇到范围查询(>、<、between、like)就停止匹配。
如建立了索引(a,b,c),那么这些条件语句是可以走到这个索引的,“a=1 and b = 2 and c > 3”、“a=1 and b = 2”,但“b > 1 and d = 10”就没有走到这个索引了,第一个命中的必须是“a”。
4、索引的使用
4.1 选择性:
count(distinct colname)/count(colname) ->1,尽量将选择性高的列放在索引的最前面,但是也存在例外情况。
典型的例子如性别,一般是不建索引的。
4.2 避免Null:
额外存储,特殊处理;
使索引统计和值更加复杂;
SQL执行结果不符合预期
4.3 索引上不要做运算
select id,value from tab where id+10=15 (x)
4.4 多使用联合索引:
将多个字段建立一个组合索引
一个索引可以被多个query利用
减少索引数量,消除重复索引
4.5 避免负向查询
避免使用NOT、!=、<>、!<、!>、NOT EXISTS、NOT IN、NOT LIKE等
5、索引优化
5.1 explain
使用EXPLAIN关键字可以模拟优化器执行SQL查询语句,从而知道MySQL是如何处理你的SQL语句的。分析你的查询语句或是表结构的性能瓶颈。
一般重点看type、key、rows。
type:表示表的连接类型。常用的类型有: ALL、index、range、 ref、eq_ref、const、system、NULL(从左到右,性能从差到好)
key:表示实际使用的索引
rows:扫描出的行数(估算的行数),一般这个值越小越好
5.2 Cardinality值
索引是否具有高选择性,一般就可以看Cardinality值。
可以通过“SHOW INDEX FROM table”结果中的列Cardinality来观察,这是一个预估的值,而不是一个准确的值,是通过采样得到的数据。
Cardinality/总条数越接近1,越有必要建索引。
5.3 MySQL查询优化器
MySQL 查询优化器的主要功能是完成SELECT语句的执行,在保证SELECT语句正确执行之外,还有一个重要的功能,就是使用关系代数、启发式规则、代价估值模型等不同种类的技术,提高SELECT语句的执行效率。
这部分是MySQL实现的,可以让我们的SQL写得更“随意”。
参考资料
官方文档mysql-index https://dev.mysql.com/doc/refman/5.6/en/mysql-indexes.html
官方文档聚集索引与辅助索引 https://dev.mysql.com/doc/refman/5.6/en/innodb-index-types.html
姜承饶 《MySQL技术内幕:InnoDB存储引擎》
MySQL索引原理及慢查询优化 https://tech.meituan.com/2014/06/30/mysql-index.html
深入理解什么是B+树 https://cloud.tencent.com/developer/article/1425602
BTree和B+Tree详解 https://www.cnblogs.com/vianzhang/p/7922426.html
Hollis关于Explain的讲解 https://mp.weixin.qq.com/s/OpS_F5lG9CaFw4xqnofWLw
MySQL查询优化器 https://yq.aliyun.com/articles/680912
谈谈MySQL 索引的更多相关文章
- 谈谈MySql索引
刚刚学习完丁奇老师<MySql 实战 45 讲>专栏中的索引部分,图文并茂的风格解开了我之前的许多疑惑,并且学习到许多新的东西,在此做个笔记,方便后续复习.由于 MySql 中存在多种存储 ...
- 谈谈MySQL的索引
目录 索引 前言 是什么 B树 B+树 B树和B+树结构上异同 有什么用 怎么用 索引 前言 总所周知,数据库查询是数据库的最主要功能之一.我们都希望查询数据的速度能尽可能的快.而支撑这一快速的背后就 ...
- 谈谈MySQL数据表的类型(转)
谈谈MySQL数据表的类型 通常意义上,数据库也就是数据的集合,具体到计算机上数据库可以是存储器上一些文件的集合或者一些内存数据的集合. 我们通常说的MySql数据库,sql server数据库等等其 ...
- 谈谈MySQL支持的事务隔离级别,以及悲观锁和乐观锁的原理和应用场景?
在日常开发中,尤其是业务开发,少不了利用 Java 对数据库进行基本的增删改查等数据操作,这也是 Java 工程师的必备技能之一.做好数据操作,不仅仅需要对 Java 语言相关框架的掌握,更需要对各种 ...
- 浅谈Mysql索引
文章原创于公众号:程序猿周先森.本平台不定时更新,喜欢我的文章,欢迎关注我的微信公众号. 我们都知道,数据库索引可以帮助我们更加快速的找出符合的数据,但是如果不使用索引,Mysql则会从第一条开始查询 ...
- 索引很难么?带你从头到尾捋一遍MySQL索引结构,不信你学不会!
前言 Hello我又来了,快年底了,作为一个有抱负的码农,我想给自己攒一个年终总结.自上上篇写了手动搭建Redis集群和MySQL主从同步(非Docker)和上篇写了动手实现MySQL读写分离and故 ...
- 带你从头到尾捋一遍MySQL索引结构(1)
从一个简单的表开始 create table user( id int primary key, age int, height int, weight int, name varchar(32) ) ...
- 带你从头到尾捋一遍MySQL索引结构(2)
前言 Hello我又来了,快年底了,作为一个有抱负的码农,我想给自己攒一个年终总结.索性这次把数据库中最核心的也是最难搞懂的内容,也就是索引,分享给大家. 这篇博客我会谈谈对于索引结构我自己的看法,以 ...
- 第36讲 谈谈MySQL支持的事务隔离级别,以及悲观锁和乐观锁的原理和应用场景
在日常开发中,尤其是业务开发,少不了利用 Java 对数据库进行基本的增删改查等数据操作,这也是 Java 工程师的必备技能之一.做好数据操作,不仅仅需要对 Java 语言相关框架的掌握,更需要对各种 ...
随机推荐
- POJ - 2387 Til the Cows Come Home (最短路入门)
Bessie is out in the field and wants to get back to the barn to get as much sleep as possible before ...
- POJ2421 Constructing Roads 最小生成树
修路 时限: 2000MS 内存限制: 65536K 提交总数: 31810 接受: 14215 描述 有N个村庄,编号从1到N,您应该修建一些道路,使每两个村庄可以相互连接.我们说两个村庄A ...
- muduo网络库源码学习————日志滚动
muduo库里面的实现日志滚动有两种条件,一种是日志文件大小达到预设值,另一种是时间到达超过当天.滚动日志类的文件是LogFile.cc ,LogFile.h 代码如下: LogFile.cc #in ...
- 题目分享L
题意:n个人围成一个环,每个人初始有一些金币,每个人可以把金币递给相邻的人,问最少传递多少金币使每个人金币数相同? 分析:首先在保证最优的情况下不可能会出现相邻的两个人互相送金币,因为这样他们公共的部 ...
- linux关于suid提权笔记
suid全称是Set owner User ID up on execution.这是Linux给可执行文件的一个属性,上述情况下,普通用户之所以也可以使用ping命令,原因就在我们给ping这个可执 ...
- CC2530通用IO口的输入输出
一.引脚概述 CC2530有40 个引脚.其中,有21个数字I/O端口,其中P0和P1是8 位端口,P2仅有5位可以使用.P2端口的5个引脚中,有2个需要用作仿真,有2个需要用作晶振.所以可供我们使用 ...
- 【漫画】JAVA并发编程之并发模拟工具
原创声明:本文来源于公众号[胖滚猪学编程],转载请注明出处. 上一节[漫画]JAVA并发编程三大Bug源头(可见性.原子性.有序性)我们聊了聊并发编程的三个bug源头,这还没开始进入并发世界,胖滚猪就 ...
- 【FreeRTOS学习03】小白都能懂的Task Management 任务管理基本概念介绍
在FreeRTOS中,线程的术语又可以被称之为任务,或许这样更加合适,本文将介绍任务的创建/删除,任务参数的使用,以及任务优先级: 1 软实时和硬实时 硬实时系统的任务运行正确性与响应时限是紧密相关的 ...
- [hdu4713 Permutation]DP
题意:将一个数拆成若干数的和使得它们的最小公倍数最大 思路:一个数x可以拆成p1k1 + p2k2 + ... + pnkn形式,其中pi是质数或1.对于最小公倍数最大的情况,一定可以表示成这种形式. ...
- OpenStack黄金十年:我与OpenStack的故事
导读:从2010年到2020年,OpenStack项目整整走过了十个春夏秋冬.不管是OpenStack基金会,还是积极参与OpenStack社区的厂商.企业乃至开发者,想必都有肺腑之言想对OpenSt ...