从原理上理解`MySQL`的优化建议

预备知识

B+树索引

mysql的默认存储引擎InnoDB使用B+树来存储数据的，所以在分析优化建议之前，了解一下B+树索引的基本原理。
上图是一个B+树索引示意图，每个节点表示一个磁盘块，也可以理解为数据库中的页。
分析下B+树索引的查找过程，如果我要查询主键为35的数据，索引会怎么走？
1. 首先会判断35小于根节点37，继续查询左子树
2. 判断35大于22和33，那么进入右子树，找到了叶子节点33
3. 继续遍历找到35
4. 最后取出其data即可
在索引的情况下，查询35只用了3次IO操作，这是非常高效的
在真实场景下，3层的B+树可以表示上百万的数据，如果上百万的数据查找只需要3次IO，性能提升将是巨大的，如果没有索引，每个数据项都要发生一次IO，那么总共需要百万次IO，显然成本非常非常高
上图也是体现了只要维持树的高度足够低，IO操作就会足够少，IO次数少，查询性能就会高

Explain执行计划

各个字段的含义

id：Query Optimizer所选定的执行计划中的查询编号

select_type:所使用的查询类型，主要有几种查询类型：

SIMPLE	除子查询或者UNION查询之外的其他查询
PRIMARY	子查询中的最外层查询，注意并不是主键查询
UNION	UNION语句中第二个 SELECT 开始的后面所有 SELECT，第一个 SELECT 为 PRIMARY
DEPENDENT UNION	子查询中的 UNION，且为 UNION 中从第二个 SELECT 开始的后面所有 SELECT ，同样依赖于外部查询的结果集
`SUBQUERY`	子查询内层查询的第一个 SELECT，结果不依赖于外部查询结果集
`DEPENDENT SUBQUERY`	子查询内层查询的第一个 SELECT，结果依赖于外部查询结果集
类型名称	说明

table:显示执行这一步所访问的数据库中的表的名称
partitions:查询分区表匹配的分区，非分区表显示为NULL

type：查询表所使用的的方式，类型如下

类型名称	说明
all	全表扫描
`const`	读常量，最多只有一条记录匹配，由于是常量，所以实际上只要读一次
system	系统表，表中只要一条数据，他是特殊的`const`类型
`eq_ref`	最多会匹配一条结果，一般是通过主键或者唯一索引来访问
ref	join语句中被驱动标的索引查询
full_text	使用full_text索引
index	全索引扫描
index_merge	查询中同时使用两个（或者多个）索引，然后对索引结果进行merge之后再读表数据
range	索引范围扫描，经常出现在比较条件中,如：<, > ,BETWEEN 等

他们的性能由好到差依次是：

system > const > eq_ref > ref > full_text > ref_or_null > unique_subquery > index_subquery > range > index_merge > index > all
possible_keys: 查询可能用到的索引
key_len: 用到的索引长度
ref: 展示将那些列或者常量与命中的索引比较
rows: 执行这次查询扫描的行数
filtered: 过滤行数百分比，最大值是100，当显示100时候，表示没有过滤行， rows显示了检查的估计行数，乘以过滤百分比将显示与下表连接的行数。例如，如果行数为1000，过滤条件为50.00（50％），则与下表联接的行数为1000×50％= 500
extra: 执行查询额外的条件

为什么建议使用自增主键

为什么？

当我们每次建立表的时候都在考虑是用表的自增主键呢？还是用 uuid呢？但是从性能考虑我们还是建议使用自增 Id,为什么呢？主要是由于 MySQL B+ 树索引性质决定的，数据的新增是要更新索引的，也就是要更新 B+ 树。换句话说，使用自增Id 和非自增 Id 哪种更新 B+ 树更快，成本更低，谁就是更优的选择。我们来模拟下自增 Id 插入和非自增 Id 插入情况。

自增主键与非自增的比较

自增Id 插入情况： 我们在一个已经有10条数据的 B + 数上插入2条数据，分别是10和11，我们看看树是如何变化的。

我们这里可以发现两个特点：

1. 自增的数据插入影响的范围永远只有最右的子树，要么直接在子树插入节点，要么就是子树分裂，影响其父节点。

2. 除了最右子树，其他子树的节点都是满的。

3. 上面两个特点有什么影响呢？我们根据前面 B+ 树索引示意图可以知道，每个点都是一个磁盘块，操作每个节点相当于进行一次 IO,由于每次插入影响的节点只有最右子树，那么磁盘 IO 的范围就可控；最重要一点是除最右子树，其他子树的节点都是满的，这种情况，叶子节点数据的物理连续性会更好， 根据局部性原理,查询性能也会更高

非自增 Id 插入情况

非自增 Id 插入特点对比自增 Id 插入我们很容易就能知道：
1. 插入影响节点不可控，无法预知。
2. 每个子树都存在叶子节点不满的情况
3. 按照之前的分析思路，我们也就知道了非自增 Id 插入有什么性能劣势了。由于插入数据影响节点不可控，导致节点分裂的情况就会更频繁，节点分裂也是 IO 操作，性能自然受到影响。子树的叶子节点不满，会导致叶子节点物理连续性不好。最后如果我们是UUID的话，Id 过长，会占用节点空间，每个页能存储的节点变少，页分裂变多，性能也会受到影响。这也是为什么建议使用自增主键的原因

为什么不要使用 select * 查询

为什么

我们能想到很直观的理由就是，数据库要帮你翻译成每个字段名去查询，接着查询多余的字段会占用内存，带宽等资源。这确实是一个理由，而且这个理由很重要
但是我这里想说的是另外一个原因，覆盖索引

总结

本文从原理上分析了我们日常的两点建议，为什么建议使用自增主键？为什么不建议使用 select * 查询？其实主要最终的原因还是和索引相关，既然我们用索引来提高我们的效率就要充分利用它，下面是知识点总结：

1、B+ 树查询的效率高低是受其树高影响，树的高度越低，查询IO次数越少，性能相对也就越高。

2、执行计划的类型由好到差依次是：system > const > eq_ref > ref > full_text > ref_or_null > unique_subquery > index_subquery > range > index_merge > index > all 。

3、自增主键的好处就是连续，插入维护的成本相对较低，同时子树的叶子节点大部分是满节点，物理连续性好，查询性能更优。

4、UUID 主键长度过长，导致单个子节点存储的主键变少，更平凡的出发页分裂，影响性能，这也是为什么建议索引不要太长的原因。

5、覆盖索引是很好的优化技巧，可以让查询直接通过索引返回数据，而不用回表，减少IO，提升性能。

从原理上理解MySQL的优化建议的更多相关文章

redmine在linux上的mysql性能优化方法与问题排查方案
iredmine的linux服务器mysql性能优化方法与问题排查方案问题定位: 客户端工具: 1. 浏览器inspect-tool的network timing工具分析 2. 浏览 ...
50多条mysql数据库优化建议
1.对查询进行优化,应尽量避免全表扫描,首先应考虑在 where 及 order by 涉及的列上建立索引. 缺省情况下建立的索引是非群集索引,但有时它并不是最佳的.在非群集索引下,数据在物理上随机存 ...
Mysql语句优化建议
一.建立索引 1)考虑在 where 及 order by 涉及的列上建立索引 2)对于模糊查询, 建立全文索引 3)对于多主键查询,建立组合索引二.避免陷阱然而,一些情况下可能使索引无效: 1) ...
微服务实战（三）：以MySQL为例，从原理上理解那些所谓的数据库军规
原文链接:微服务化的数据库设计与读写分离(来源:刘超的通俗云计算) 数据库永远是应用最关键的一环,同时越到高并发阶段,数据库往往成为瓶颈,如果数据库表和索引不在一开始就进行良好的设计,则后期数据库横向 ...
从原理上理解NodeJS的适用场景
NodeJS是近年来比较火的服务端JS平台,这一方面得益于其在后端处理高并发的卓越性能,另一方面在nodeJS平台上的npm.grunt.express等强大的代码与项目管理应用崛起,几乎重新定义了前 ...
从原理上理解Base64编码
开发者对Base64编码肯定很熟悉,是否对它有很清晰的认识就不一定了.实际上Base64已经简单到不能再简单了,如果对它的理解还是模棱两可实在不应该.大概介绍一下Base64的相关内容,花几分钟时间 ...
MySQL 是怎样运行的：从根儿上理解 MySQL：字符集和比较规则
本文章借鉴自https://juejin.im/book/5bffcbc9f265da614b11b731 字符集和比较规则简介一些重要的字符集 ASCII字符集共收录128个字符,包括空格.标点 ...
mysql索引优化建议
1.对查询进行优化,应尽量避免全表扫描,首先应考虑在 where 及 order by 涉及的列上建立索引. 2.应尽量避免在 where 子句中对字段进行 null 值判断,否则将导致引擎放弃使用索 ...
从原理上理解如何由震源机制一个节面的解：strike,dip,rake可以求出另一个节面的解
首先,需要回到最原始的地震矩的表达式: 已知strike,dip,rake 根据strike和dip可以求出v,根据strike,dip,rake,可以求出u. 把求出来的v和u互换,相当于原来的位错 ...

随机推荐

PHP dechex() 函数
实例把十进制转换为十六进制: <?phpecho dechex("30") . "<br>";echo dechex("10&qu ...
区块链钱包开发 - USDT - 一、Omni本地钱包安装
背景 Tether(USDT)中文又叫泰达币,是一种加密货币,是Tether公司推出的基于稳定价值货币美元(USD)的代币Tether USD,也是目前数字货币中最稳定的币,USDT目前发行了两种代币 ...
day7.关于字符串的相关操作
一.字符串的相关操作 """ (1)字符串的拼接 (2)字符串的重复 (3)字符串跨行拼接 (4)字符串的索引 (5)字符串的切片: 语法 => 字符串[::] 完 ...
Elasticsearch权威指南（中文版）
Elasticsearch权威指南(中文版) 下载地址: https://pan.baidu.com/s/1bUGJmwS2Gp0B32xUyXxCIw 扫码下面二维码关注公众号回复100010 获取 ...
Python3,逻辑运算符
优先级 ()>not>and>or 1.or 在python中,逻辑运算符or,x or y, 如果x为True则返回x,如果x为False返回y值.因为如果x为True那么or运算 ...
【av68676164（p33-p34)】进程通信
4.7.1 匿名管道通信任务:把一个CMD控制台程序改成窗口程序 "算命大师"程序的改进版改进目标:标准的Windows窗口程序 (匿名)管道通信机制管道定义 pipe 定义 ...
15、Java中级进阶面向对象继承
1.何为面向对象其本质是以建立模型体现出来的抽象思维过程和面向对象的方法(百度百科)是一种编程思维,也是一种思考问题的方式如何建立面向对象的思维呢?1.先整体,再局部2.先抽象,再具体3.能做什么 ...
Xlua中LuaBehaviour的实现
简介在基于lua进行热更新的项目中,我们通常会通过luaBehaviour来让lua文件模拟MonoBehaviour,可以让lua文件拥有一些MonoBehaviour的生命周期,如Enabl ...
C#LeetCode刷题之#686-重复叠加字符串匹配（Repeated String Match）
问题该文章的最新版本已迁移至个人博客[比特飞],单击链接 https://www.byteflying.com/archives/3963 访问. 给定两个字符串 A 和 B, 寻找重复叠加字符串A ...
Linux学习日志——基本指令②
文章目录 Linux学习日志--基本指令② 前言 touch cp (copy) mv (move) rm vim 输出重定向(> 或 >>) cat df(disk free) f ...

从原理上理解MySQL的优化建议