MySQL Execution Plan--IN查询计划

对于IN查询，MySQL会根据当前表数据结构(索引)和数据分布(统计信息和预估)生成多种执行计划，并根据执行成本挑选出“最优执行计划”。

假设有查询

SELECT *

FROM student

WHERE class_id IN (1,2,3,4);

有下面三种执行计划：

1、对表student做表扫描
2、循环IN列表中每个值，对表student上class_id列做索引查找
3、计算IN列表中最大值和最小值，对表student上class_id列做索引范围扫描

方式1：对表student做表扫描

对表做全表扫描，遍历student表的每行数据，找出每行匹配IN条件的记录并返回。查询效率与表数据量成正比。

伪代码：

def get_students_01():

    class_id_list=(1,2,3,4)

    matched_rows=[]

    for student_row in (table scan in table student):

        if student_row.class_id in class_id_list:

            matched_rows.append(student_row)

    return matched_rows

适用场景：

1、列class_id上无索引，导致只能全表扫描

2、满足IN条件的数据占整表数据比重较大时，如表中班级ID仅有(1,2,3,4,5),需要查询满足(1,2,3,4)的记录，表中大部分数据都满足该条件，如果使用列class_id做索引查找+PRIMARY KEY LOOKUP操作，PRIMARY KEY LOOKUP操作会产生大量随机IO，执行成本远超过全表扫描产生的顺序IO。

性能问题:

当列class_id上存在索引且满足IN条件的数据占整表数据比重较小时，全表扫描会访问大量“无用数据”，浪费IO和CPU资源，导致性能问题。如全表数据有1000W，满足IN条件的数据仅有10行，此时使用INDEX SEEK+KEY LOOPUP会效率更高。

方式2：循环IN列表中每个值，对表student上class_id列做索引查找

循环取出IN列表中每个值，并使用该值去表student中根据class_id做等值查询，然后做PRIMARY KEY LOOPUP,最后将每个IN列表值查询结果汇总后返回

伪代码：

def get_students_02():

    class_id_list=(1,2,3,4)

    matched_rows=[]

    for tmp_class_id in class_id_list:

        for tmp_student_id in (index seek in table student with index idx_class_id where class_id = tmp_class_id):

            student_row = (index seek in table student with primary key where student_id = tmp_student_id)

            if student_row is not null:

                matched_rows.append(student_row)

    return matched_rows

适用场景：

1、列class_id上有索引，且列class_id选择性较高，IN列表数据量较少

性能问题：

1、列class_id上有索引，但列class_id选择性较差，需要进行大量KEY LOOPUP操作，产生大量随机IO导致性能问题

2、列class_id上有索引，但IN列表包含值太多，需要进行多次循环，MySQL Server层和存储引擎层需要进行多次交互，引发性能问题。

方式3：计算IN列表中最大值和最小值，对表student上class_id列做索引范围扫描

获取IN列表中最大值和最小值，并使用这两值去表student中根据class_id做范围扫描(顺序IO),对扫描后的结果按照IN列表进行过滤，然后做PRIMARY KEY LOOPUP,最后将所有满足条件的数据汇总返回。

伪代码：

def get_students_02()

    class_id_list=(1,2,3,4)

    matched_rows=[]

    max_class_id=max(class_id_list)

    min_class_id=min(class_id_list)

    for tmp_student_id in (index seek in table student with index idx_class_id where class_id >=min_class_id and class_id<=max_class_id):

        student_row = (index seek in table student with primary key where student_id = tmp_student_id)

        if student_row is not null:

            if student_row.class_id in class_id_list:

                matched_rows.append(student_row)

    return matched_rows

方式3是对方式2的优化，通过一次范围扫描来替换循环索引查找。

适用场景：

1、列class_id上有索引，IN列表包含大量值，且值集中在特定范围，如class_id的值分布在0-99999范围，而IN列表的值集中在1000-2000范围，扫描该范围数据可获得所有满足条件的数据。

性能问题：

1、列class_id上有索引，IN列表包含大量值，且值分散在整表范围，如class_id的值分布在0-99999范围，而IN列表的值为(1000,5000,10000,90000),取值在1000-90000范围，需要扫描范围过大，其扫描结果中大量数据不满足IN条件，访问过多“无用数据”，造成性能问题。

扩展知识：

对于IN列表中的值进行预估时，受参数eq_range_index_dive_limit影响，超过阈值后，会导致预估准确率问题。

https://www.cnblogs.com/TeyGao/p/6585879.html

MySQL Execution Plan--IN查询计划的更多相关文章

MySQL Execution Plan--IN子查询包含超多值引发的查询异常
问题描述版本:MySQL 5.7.24 SQL语句: SELECT wave_no, SUM(IF(picking_qty IS NULL, 0, picking_qty)) AS PICKED_Q ...
MySQL Execution Plan--NOT IN查询
在某系统中想使用NOT IN子查询进行数据过滤,SQL为: SELECT * FROM TB001 AS T1 DAY) AND T1.BATCH_NO NOT IN(SELECT BATCH_NO ...
Mysql优化之Explain查询计划查看
我们经常说到mysql优化,优化中一种常见的方式就是对于经常查询的字段创建索引.那么mysql中有哪些索引类型呢? 一.索引分类1.普通索引:即一个索引只包含单个列,一个表可以有多个单列索引 2.唯一 ...
MySQL Execution Plan--IN子查询对UPDATE语句影响
问题描述在系统中发现一条执行时间为为44652.060734秒(12.5小时)的慢SQL,SQL语句为: UPDATE ob_internal_task SET OPERATE_STATUS WHE ...
MySQL Execution Plan--IN子查询包含超多值引发的查询异常1
======================================================================= SQL语句: SELECT wave_no, SUM(I ...
Execution Plan 执行计划介绍
后面的练习中需要下载 Demo 数据库, 有很多不同的版本, 可以根据个人需要下载. 下载地址 -http://msftdbprodsamples.codeplex.com/ 1. 什么是执行计划 ...
SQLServer查询计划
参考:http://blog.csdn.net/luoyanqing119/article/details/17022649 1. 开启方式菜单栏:query---Display Estimated ...
sql server 执行计划(execution plan)介绍
大纲:目的介绍sql server 中执行计划的大致使用,当遇到查询性能瓶颈时,可以发挥用处,而且带有比较详细的学习文档和计划,阅读者可以按照我计划进行,从而达到对执行计划一个比较系统的学习. 什么是 ...
MySQL的查询计划中ken_len的值计算
本文首先介绍了MySQL的查询计划中ken_len的含义:然后介绍了key_len的计算方法:最后通过一个伪造的例子,来说明如何通过key_len来查看联合索引有多少列被使用. key_len的含义 ...
MYSQL查询计划KEY_LEN
http://www.innomysql.com/article/25241.html 1 key_len的含义 2 MySQL中key_len计算规则 3 通过key_len分析联合索引本文首先介 ...

随机推荐

NodeJS：（二）基础常用API
node.js中文网:http://nodejs.cn/api/ (path.Buffer.events.fs) ①path路径-----const {resolve} = require('path ...
get函数
dict={"name":"jary","age":22}print(dict.get("age")) # 通过键值找到 ...
SpringBoot之依赖注入DI
相关注解: @Component @Service @Controller @Repository --------------------------------------------- @Inj ...
php同curl post 发送json并返回json数据实例
<?php $arr = array( 'subject'=>'课程', 'loginName'=>'Durriya', 'password'=>'123' ); //json ...
下载配置nodeJs,cnpm,webpack,vue-cli等，刚装的系统，所有东西重新配置
最近重新装了系统,所有的环境都要重新配置了,做个笔记. 安装nodeJs: 可以参照教程:https://www.runoob.com/nodejs/nodejs-install-setup.html ...
vue2.0s中eventBus实现兄弟组件通信
在vue1.0中,组件之间的通信主要通过vm.$dispatch沿着父链向上传播和用vm.$broadcast向下广播来实现.然而在vue2.0中,已经废除了这种用法. vuex加入后,对组件之间的通 ...
JavaScript基础知识点总结
JavaScript----js 全栈课程-------全栈工程师前端:信息展示,普通用户浏览---前端工程师(html+css:静态页面 js:页面的交互效果) 后台:信息管理,管理员,数据库-- ...
OSSIM安装使用教程（OSSIM-5.6.5）
一.说明 1.1 相关概念说明 SEM,security event management,安全事件管理,指对事件进行实时监控,收集信息差展生通知和告警的行为. SIM,security inform ...
Win10系列：C#应用控件基础17
Popup控件在应用程序中使用Popup控件时,通常会先将其设置为隐藏状态,当用户触发应用中已定义的事件时,Popup控件将以弹出窗口的方式显示相关信息来提示用户操作. 在XAML文件中,Popup ...
LeetCode刷题 fIRST MISSING POSITIVE
Given an unsorted integer array,find missing postive integer. For example , Given [1,2,0]return 3, a ...

MySQL Execution Plan--IN查询计划

MySQL Execution Plan--IN查询计划的更多相关文章

随机推荐

热门专题