前言

想象你是一家餐厅的服务员,面前有两个菜单:

  • 菜单A:按菜品分类排列(前菜、主菜、甜点)
  • 菜单B:按价格从低到高排列

当顾客说:"我要最便宜的川菜"。

你会:

  1. 先用菜单B找到所有低价菜
  2. 从中筛选川菜

或者:

  1. 先用菜单A找到所有川菜
  2. 再按价格排序

这就是MySQL优化器的日常决策

明明是同一条SQL,有时候走的索引a,而有时候走的索引b,就是它的锅。

今天这篇文章跟大家一起聊聊,MySQL选错索引的问题,希望对你会有所帮助。

1 一个让程序员崩溃的案例

现在有个需求:查询今年开始已付款的前100个订单。

给status字段创建了索引idx_status。

给create_time字段创建了索引idx_create_time。

查询订单的sql如下:

SELECT * FROM orders
WHERE status = 'paid' -- 状态条件
AND create_time > '2025-01-01' -- 时间条件
ORDER BY amount DESC
LIMIT 100;

周一执行计划如下

使用索引:idx_status(状态索引)
扫描行数:500行
耗时:0.1秒

周二执行计划如下

使用索引:idx_create_time(时间索引)
扫描行数:50万行
耗时:8秒

周一只扫描了500行数据,而周二却扫描了50万行数据。

周一耗时0.1秒,而周二耗时却又8秒。

同一SQL在不同时间性能差异80倍!

让我们拆解背后的原因。

2 揭秘优化器的"决策三步曲"

MySQL优化器的决策流程如下:

成本计算示例

索引名称 预估扫描行数 回表次数 排序成本 总成本
idx_status 50万 50万次 需要排序 1050分
idx_create_time 5万 5万次 无需排序 600分

根据扫描行数、回表次数、排序成本,计算一个总成本的分数。

优化器会选择总成本更低的idx_create_time索引。

3 导致索引切换的四大真凶

真凶1:数据分布变化

场景还原

  • 周一数据:已支付订单5万条,其中2025年的5万条
  • 周二数据:已支付订单50万条,其中2025年的50万条

这个例子中数据分布变化很大,周二的数据,比周一的数据一下子多了45万。

可能会影响总成本的分数。

我们可以通过下面的SQL查看数据分布:

SELECT
COUNT(*) AS total,
SUM(status='paid') AS paid_count,
SUM(create_time>'2023-01-01') AS new_orders
FROM orders;

真凶2:统计信息过期

统计信息过期,就像用去年的地图导航,新修的路不会出现在地图上。

MySQL的"地图"就是统计信息。

我们可以通过ANALYZE TABLE ... DELETE STATISTICS命令删除统计信息:

ANALYZE TABLE orders DELETE STATISTICS;

这时候查询可能变成全表扫描:

EXPLAIN SELECT...

显示type: ALL

那么,如何解决这个问题呢?

使用ANALYZE TABLE命令,刷新统计信息(相当于更新地图):

ANALYZE TABLE orders;

真凶3:索引覆盖度差异

点餐类比

  • 菜单A能直接看到菜品价格 → 无需问厨师(覆盖索引)
  • 菜单B只能看到菜品名 → 需要问厨师详情(回表查询)

下面的SQL会走idx_status(需要回表):

SELECT * FROM orders WHERE status='paid';

下面的SQL会走idx_create_time(覆盖索引):

SELECT create_time FROM
orders WHERE create_time>'2023-01-01';

真凶4:索引碎片化

索引碎片化就像书本的目录页被撕破,找内容变得困难。

检查方法

SHOW TABLE STATUS LIKE 'orders';

查看Data_free字段,值越大碎片越多。

优化方案

使用ALTER TABLE命令重建索引。

ALTER TABLE orders ENGINE=INNODB;

4 问题排查四步法

第一步:查看当前执行计划

使用EXPLAIN查看当前SQL的执行计划:

EXPLAIN
SELECT * FROM orders
WHERE status='paid'
AND create_time>'2023-01-01';

第二步:检查统计信息

使用SHOW INDEX命令检查索引的统计信息:

SHOW INDEX FROM orders;

关注Cardinality字段,值越接近真实数据越好。

第三步:分析数据分布

使用下面的SQL分析数据分布:

SELECT
COUNT(*) AS total,
AVG(LENGTH(status)) AS status_avg_len
FROM orders;

第四步:追踪优化器思考过程

SET optimizer_trace="enabled=on";
SELECT * FROM orders WHERE ...;
SELECT * FROM INFORMATION_SCHEMA.OPTIMIZER_TRACE;

开启optimizer_trace,然后通过INFORMATION_SCHEMA.OPTIMIZER_TRACE表查看追踪优化器思考过程。

5 三大终极解决方案

方案1:引导优化器选择

使用FORCE INDEX强制使用指定索引:

SELECT * FROM orders FORCE INDEX(idx_status) WHERE ...;

方案2:创建更优索引

创建更优的联合索引:

ALTER TABLE orders
ADD INDEX idx_status_create_time(status,create_time);

方案3:定期维护计划

  1. 定期统计信息更新
  2. 定期碎片率检查
  3. 定期索引重建

总结

六个必须检查的点

  1. WHERE条件字段是否有合适索引
  2. ORDER BY/GROUP BY是否利用索引排序
  3. 统计信息是否最新(尤其大表每天更新)
  4. 是否存在索引碎片(每月检查一次)
  5. 是否出现索引合并(INDEX_MERGE)
  6. 是否使用覆盖索引(减少回表)

三条黄金法则

  1. 二八定律:20%的索引满足80%的查询
  2. 数据驱动:定期分析查询模式调整索引
  3. 防御编程:核心查询明确指定索引

最后说一句(求关注,别白嫖我)

如果这篇文章对您有所帮助,或者有所启发的话,帮忙关注一下我的同名公众号:苏三说技术,我的所有文章都会在公众号上首发,您的支持是我坚持写作最大的动力。

求一键三连:点赞、转发、在看。

关注公众号:【苏三说技术】,在公众号中回复:进大厂,可以免费获取我最近整理的10万字的面试宝典,好多小伙伴靠这个宝典拿到了多家大厂的offer。

本文收录于我的技术网站:http://www.susan.net.cn

明明是同一条SQL,为什么有时候走索引a,有时候却走索引b ?的更多相关文章

  1. oracle里要查看一条sql的执行情况,有没有走到索引,怎么看?索引不能提高效率?

    index scan 索引扫描 full table scan是全表扫描 直接explain plan for 还有个set autotrace什么 索引一定能提高执行效率吗? 索引不能提高效率的情况 ...

  2. XPath注入跟SQL注入差不多,只不过这里的数据库走的xml格式

    SQL注入这块不想细聊了,相信很多朋友都听到耳朵长茧,不外乎是提交含有SQL操作语句的信息给后端,后端如果没有做好过滤就执行该语句,攻击者自然可以随意操纵该站点的数据库. 比如有一个图书馆站点book ...

  3. 腾讯面试:一条SQL语句执行得很慢的原因有哪些?---不看后悔系列

    说实话,这个问题可以涉及到 MySQL 的很多核心知识,可以扯出一大堆,就像要考你计算机网络的知识时,问你"输入URL回车之后,究竟发生了什么"一样,看看你能说出多少了. 之前腾讯 ...

  4. 一条SQL语句执行得很慢的原因有哪些?

    说实话,这个问题可以涉及到 MySQL 的很多核心知识,可以扯出一大堆,就像要考你计算机网络的知识时,问你“输入URL回车之后,究竟发生了什么”一样,看看你能说出多少了. 之前腾讯面试的实话,也问到这 ...

  5. 一条SQL语句在MySQL中如何执行的

    本篇文章会分析一个 sql 语句在 MySQL 中的执行流程,包括 sql 的查询在 MySQL 内部会怎么流转,sql 语句的更新是怎么完成的. 在分析之前我会先带着你看看 MySQL 的基础架构, ...

  6. 一条SQL语句执行得很慢的原因有哪些?(转)

    一条 SQL 语句执行的很慢,那是每次执行都很慢呢?还是大多数情况下是正常的,偶尔出现很慢呢?所以我觉得,我们还得分以下两种情况来讨论. 1.大多数情况是正常的,只是偶尔会出现很慢的情况. 2.在数据 ...

  7. 一条SQL语句在MySQL中是如何执行的

    概览 本篇文章会分析下一个sql语句在mysql中的执行流程,包括sql的查询在mysql内部会怎么流转,sql语句的更新是怎么完成的. 一.mysql架构分析 mysql主要分为Server层和存储 ...

  8. 一条 SQL 语句在 MySQL 中如何执行的

    一 MySQL 基础架构分析 1.1 MySQL 基本架构概览 下图是 MySQL 的一个简要架构图,从下图你可以很清晰的看到用户的 SQL 语句在 MySQL 内部是如何执行的. 先简单介绍一下下图 ...

  9. 一条SQL语句执行得很慢的原因有哪些

    说实话,这个问题可以涉及到 MySQL 的很多核心知识,可以扯出一大堆,就像要考你计算机网络的知识时,问你"输入URL回车之后,究竟发生了什么"一样,看看你能说出多少了. 之前腾讯 ...

  10. 一条SQL语句在MySQL中如何执行

    一条SQL语句在MySQL中如何执行 本篇文章会分析一个 sql 语句在 MySQL 中的执行流程,包括 sql 的查询在 MySQL 内部会怎么流转,sql 语句的更新是怎么完成的. 在分析之前我会 ...

随机推荐

  1. Manus的开源复刻OpenManus初探

    OpenManus介绍 Manus需要邀请码才能体验,目前大部分人都体验不到. 有几个大佬花3个小时就复现了一个简单的原型OpenManus,让我们体验体验吧!! 截至目前,该项目已经获得了25.9k ...

  2. Qt Qss 设置QPushButton图标和背景

    文章目录 Qt QSS 设置 QPushButton的图标叠加背景 前言 解决方法 background-repeat.background-position 最终样式 Qt QSS 设置 QPush ...

  3. mongodb 数据库操作——备份 还原 导出 导入

    mongodump备份数据库 命令格式 mongodump -h IP --port 端口 -u 用户名 -p 密码 -d 数据库 -o 文件存在路径 如果没有用户,可以去掉-u和-p. 如果导出本机 ...

  4. DCL(Double-checked Locking双重校验锁)实现单例模式的原理、问题与解决方案

    ​ 好的,要深入理解DCL(Double-Checked Locking)双重校验锁的原理.问题以及解决方法. 首先,我需要回忆一下单例模式的基本概念,因为DCL通常用于实现单例模式. 单例模式确保一 ...

  5. IvorySQL 4.4 发布

    IvorySQL 4.4 已于 2025 年 3 月 10 日正式发布.新版本全面支持 PostgreSQL 17.4,新增多项新功能,并修复了已知问题. 增强功能 PostgreSQL 17.3 增 ...

  6. elementui|dropdown|下拉菜单作为模态框使用

    elementui|dropdown|下拉菜单作为模态框使用 背景 场景:下拉菜单作为模态框使用: 操作:下拉菜单设置触发条件点击展示/隐藏:trigger="click" 目的: ...

  7. iis 固定回收问题

    项目背景:站点有一个计算业务场景,耗时较久.    偶发性发生:进度条过程中,发生卡死.日志没有然后记录.    查看windows 事件,问题时间 有was  自动回收 当前站点 ,如下图 后设置 ...

  8. 字符串成员方法:截取、替换、切割 及String成员方法小结

    1.截取 subString() subString()方法有两种使用方式: 1.第一种是在括号里只放入一个索引,这时将会从放入的索引为起点,一直截取到末尾 2.第二种是在括号里放入两个索引,分别对应 ...

  9. 【软件】Ubuntu下QT的安装和使用

    [软件]Ubuntu下QT的安装和使用 零.前言 QT是应用得比较广泛的程序框架,是因为其跨平台特性比较好,且用C/C++作为开发语言,性能也比较好,故本文介绍如何安装和使用QT,用的版本是QT 6. ...

  10. 【Guava】IO工具

    引言 Guava 使用术语 流来表示可关闭的,并且在底层资源中有位置状态的 I/O 数据流.字节流对应的工具类为 ByteSterams,字符流对应的工具类为 CharStreams. Guava 中 ...