谈谈MySQL 索引
1、索引是什么
索引(Index)是帮助MySQL高效获取数据的数据结构。我们可以简单理解为:索引的目的在于提高查询效率。
2、原理
索引的数据结构是B+树,原理图如下

关于B+树的详细介绍,可以参见文章下面的参考。
精简描述:B+树是为了磁盘或其他直接存储辅助设备设计的一种平衡查找树。在B+树中,所有记录节点都是按键值的大小顺序存放在叶子节点上,各叶子节点直接由指针进行连接。
B+树中的B不是代表二叉(binary),而是代表平衡(balance),因为B+树是从最早的平衡二叉树演化而来,但是B+树不是一个二叉树。
索引的内部也是一张表,索引组织表,索引的构建需要使用到磁盘空间跟内存空间,并不是索引越多越好,太多反而导致性能下降,建议一张表最多不要超过8个索引。
3、索引分类
下面的分类维度没有标准,但一般索引我们会比较关注聚集索引跟非聚集索引。
3.1 聚集索引
聚集索引(clustered index)是按照每张表的主键构造一棵B+树,同时叶子节点中存放的即为整张表的行记录数据,也将聚集索引的叶子节点称为数据页。
由于实际的数据页只能按照一棵B+树进行排序,因此每张表只能拥有一个聚集索引。
主键是一个聚集索引,如果在InnoDB没有定义主键,那么默认生成一个rowId作为聚集索引。
3.2 非聚集索引
非聚集索引(Secondary Index,也称辅助索引),叶子节点并不包含行记录的全部数据。叶子节点除了包含键值以外,每个叶子节点中的索引行中还包含了一个书签(bookmark)。该书签用来告诉InnoDB存储引擎哪里可以找到与索引相对应的行数据。
当通过辅助索引来寻找数据时,InnoDB存储引擎会遍历辅助索引并通过叶级别的指针获得指向主键索引的主键,然后再通过主键索引来找到一个完整的行记录。

3.3 覆盖索引
从辅助索引中就可以得到查询的记录,而不需要查询聚集索引中的记录。
使用覆盖索引的好处是辅助索引不包括整行记录中的所有信息,可以减少IO操作。
3.4 唯一索引
不允许具有索引值相同的行,从而禁止重复的索引或键值。
3.5 联合索引
联合索引是指对表上的多个列进行索引。从本质上来说,联合索引也是一颗B+树,不同的是联合索引的键值的数量不是1,而是大于等于2。
索引匹配的原则是最左匹配原则,MySQL会一直向右匹配直到遇到范围查询(>、<、between、like)就停止匹配。
如建立了索引(a,b,c),那么这些条件语句是可以走到这个索引的,“a=1 and b = 2 and c > 3”、“a=1 and b = 2”,但“b > 1 and d = 10”就没有走到这个索引了,第一个命中的必须是“a”。
4、索引的使用
4.1 选择性:
count(distinct colname)/count(colname) ->1,尽量将选择性高的列放在索引的最前面,但是也存在例外情况。
典型的例子如性别,一般是不建索引的。
4.2 避免Null:
额外存储,特殊处理;
使索引统计和值更加复杂;
SQL执行结果不符合预期
4.3 索引上不要做运算
select id,value from tab where id+10=15 (x)
4.4 多使用联合索引:
将多个字段建立一个组合索引
一个索引可以被多个query利用
减少索引数量,消除重复索引
4.5 避免负向查询
避免使用NOT、!=、<>、!<、!>、NOT EXISTS、NOT IN、NOT LIKE等
5、索引优化
5.1 explain
使用EXPLAIN关键字可以模拟优化器执行SQL查询语句,从而知道MySQL是如何处理你的SQL语句的。分析你的查询语句或是表结构的性能瓶颈。
一般重点看type、key、rows。
type:表示表的连接类型。常用的类型有: ALL、index、range、 ref、eq_ref、const、system、NULL(从左到右,性能从差到好)
key:表示实际使用的索引
rows:扫描出的行数(估算的行数),一般这个值越小越好
5.2 Cardinality值
索引是否具有高选择性,一般就可以看Cardinality值。
可以通过“SHOW INDEX FROM table”结果中的列Cardinality来观察,这是一个预估的值,而不是一个准确的值,是通过采样得到的数据。
Cardinality/总条数越接近1,越有必要建索引。
5.3 MySQL查询优化器
MySQL 查询优化器的主要功能是完成SELECT语句的执行,在保证SELECT语句正确执行之外,还有一个重要的功能,就是使用关系代数、启发式规则、代价估值模型等不同种类的技术,提高SELECT语句的执行效率。
这部分是MySQL实现的,可以让我们的SQL写得更“随意”。
参考资料
官方文档mysql-index https://dev.mysql.com/doc/refman/5.6/en/mysql-indexes.html
官方文档聚集索引与辅助索引 https://dev.mysql.com/doc/refman/5.6/en/innodb-index-types.html
姜承饶 《MySQL技术内幕:InnoDB存储引擎》
MySQL索引原理及慢查询优化 https://tech.meituan.com/2014/06/30/mysql-index.html
深入理解什么是B+树 https://cloud.tencent.com/developer/article/1425602
BTree和B+Tree详解 https://www.cnblogs.com/vianzhang/p/7922426.html
Hollis关于Explain的讲解 https://mp.weixin.qq.com/s/OpS_F5lG9CaFw4xqnofWLw
MySQL查询优化器 https://yq.aliyun.com/articles/680912
谈谈MySQL 索引的更多相关文章
- 谈谈MySql索引
刚刚学习完丁奇老师<MySql 实战 45 讲>专栏中的索引部分,图文并茂的风格解开了我之前的许多疑惑,并且学习到许多新的东西,在此做个笔记,方便后续复习.由于 MySql 中存在多种存储 ...
- 谈谈MySQL的索引
目录 索引 前言 是什么 B树 B+树 B树和B+树结构上异同 有什么用 怎么用 索引 前言 总所周知,数据库查询是数据库的最主要功能之一.我们都希望查询数据的速度能尽可能的快.而支撑这一快速的背后就 ...
- 谈谈MySQL数据表的类型(转)
谈谈MySQL数据表的类型 通常意义上,数据库也就是数据的集合,具体到计算机上数据库可以是存储器上一些文件的集合或者一些内存数据的集合. 我们通常说的MySql数据库,sql server数据库等等其 ...
- 谈谈MySQL支持的事务隔离级别,以及悲观锁和乐观锁的原理和应用场景?
在日常开发中,尤其是业务开发,少不了利用 Java 对数据库进行基本的增删改查等数据操作,这也是 Java 工程师的必备技能之一.做好数据操作,不仅仅需要对 Java 语言相关框架的掌握,更需要对各种 ...
- 浅谈Mysql索引
文章原创于公众号:程序猿周先森.本平台不定时更新,喜欢我的文章,欢迎关注我的微信公众号. 我们都知道,数据库索引可以帮助我们更加快速的找出符合的数据,但是如果不使用索引,Mysql则会从第一条开始查询 ...
- 索引很难么?带你从头到尾捋一遍MySQL索引结构,不信你学不会!
前言 Hello我又来了,快年底了,作为一个有抱负的码农,我想给自己攒一个年终总结.自上上篇写了手动搭建Redis集群和MySQL主从同步(非Docker)和上篇写了动手实现MySQL读写分离and故 ...
- 带你从头到尾捋一遍MySQL索引结构(1)
从一个简单的表开始 create table user( id int primary key, age int, height int, weight int, name varchar(32) ) ...
- 带你从头到尾捋一遍MySQL索引结构(2)
前言 Hello我又来了,快年底了,作为一个有抱负的码农,我想给自己攒一个年终总结.索性这次把数据库中最核心的也是最难搞懂的内容,也就是索引,分享给大家. 这篇博客我会谈谈对于索引结构我自己的看法,以 ...
- 第36讲 谈谈MySQL支持的事务隔离级别,以及悲观锁和乐观锁的原理和应用场景
在日常开发中,尤其是业务开发,少不了利用 Java 对数据库进行基本的增删改查等数据操作,这也是 Java 工程师的必备技能之一.做好数据操作,不仅仅需要对 Java 语言相关框架的掌握,更需要对各种 ...
随机推荐
- Linked List-1
链表一直是面试的重点问题,恰好最近看到了Stanford的一篇材料,涵盖了链表的基础知识以及派生的各种问题. 第一篇主要是关于链表的基础知识. 一.基本结构 1.数组回顾 链表和数组都是用来存储一堆数 ...
- 图论--2-SAT--详解
问题描述: 现有一个由N个布尔值组成的序列A,给出一些限制关系,比如A[x]AND A[y]=0.A[x] OR A[y] OR A[z]=1等,要确定A[0..N-1]的值,使得其满足所有限制关系. ...
- 洛谷 P1816 忠诚 ST函数
题目描述 老管家是一个聪明能干的人.他为财主工作了整整10年,财主为了让自已账目更加清楚.要求管家每天记k次账,由于管家聪明能干,因而管家总是让财主十分满意.但是由于一些人的挑拨,财主还是对管家产生了 ...
- 安装KubeSphere
1. KubeSphere 是什么 1.1. 官方解释 KubeSphere是一个分布式操作系统,提供以Kubernetes为核心的云原生堆栈,旨在成为第三方应用程序的即插即用架构,以促进其生态系统的 ...
- 操作系统实验——PV操作实现生产者消费者模型
操作系统PV操作之--生产者消费者模型 个人博客主页 参考资料: Java实现PV操作 | 生产者与消费者 浙大公开课 在操作系统的多进程.多线程操作中经常会有因为同步.互斥等等问题引发出的一系列问题 ...
- 王颖奇 20171010129《面向对象程序设计(java)》第十三周学习总结
实验十三 图形界面事件处理技术 实验时间 2018-11-22 1.实验目的与要求 (1) 掌握事件处理的基本原理,理解其用途: (2) 掌握AWT事件模型的工作机制: (3) 掌握事件处理的基 ...
- python gdal 读取栅格数据
1.gdal包简介 gdal是空间数据处理的开源包,其支持超过100种栅格数据类型,涵盖所有主流GIS与RS数据格式,包括Arc/Info ASCII Grid(asc),GeoTiff (tiff) ...
- 【MySQL基础总结】索引的使用
索引的使用 概述 1.索引由数据库中一列或多列组合而成,其作用是提高对表中数据的查询速度 2.索引的优点是可以提高检索数据的速度 3.缺点是创建和维护索引需要耗费时间 4.所以索引可以提高查询速度,减 ...
- 排序算法整理(Python实现)
目录 1. 冒泡排序 2. 选择排序 3. 插入排序 4. 归并排序 5. 快速排序 1. 冒泡排序 冒泡排序(Bubble Sort)是稳定排序,其基本思想是:遍历待排序列,依次两两比较,如果顺 ...
- shell 条件结构之 if 语句使用总结
文章目录 #条件判断的格式 [ exp ] [[ exp ]] test exp 注意: exp 与 "["."]"括号之间必须要有空格,否则会报语法错误: [ ...