查询优化--小表驱动大表（In，Exists区别）

Mysql 系列文章主页

===============

本文将以真实例子来讲解小表驱动大表（In，Exists区别）

1 准备数据

1.1 创建表、函数、存储过程

参照这篇（调用函数和存储过程批量插入数据）文章中的第 1-7 步，注意，不要执行第8步

1.2 插入数据

现在来执行第8步。

1.2.1 向 Department 表中插入 100 条记录

CALL insert_dept(1000, 100)

1.2.2 向 Employee 表中插入 100000 条记录

CALL insert_employee(100000000, 100000);

2 测试

2.1 查询所有 Employee 信息，要求是：Employee 的 dept_id 存在于 Department 表中

Case#1：用 IN

SELECT * FROM employee WHERE dept_id IN (SELECT id FROM department);

结果：在我本机测试了数十次，耗时大概是 120--130 ms

Case#2：用 EXISTS

SELECT * FROM employee e WHERE EXISTS (SELECT 1 FROM department d WHERE e.dept_id = d.id);

结果：在我本机测试了数十次，耗时大概是 350--370 ms

2.2 查询所有 Department 信息，要求是：至少有一条 Employee 记录的 dept_id 对应 Department（或者说：此部门下至少有一条员工记录）

Case#3：用 EXISTS

SELECT * FROM department d WHERE EXISTS (SELECT 1 FROM employee e WHERE d.id = e.dept_id);

结果：在我本机测试了数十次，耗时大概是 4--6 ms

Case#4：用 IN

SELECT * FROM department WHERE id IN (SELECT dept_id FROM employee);

结果：在我本机测试了数十次，耗时大概是 50--55 ms

2.3 分析并总结

在 Case#1，#2 中，Employee 是大表，Department 是小表，用 IN(Department) 的效果较好（大概是用 EXISTS 时间的三分之一）====> IN 后面跟小表~

在 Case#3，#4 中，Employee 是大表，Department 是小表，用 EXISTS(Employee) 的效果较好（大概是用 IN 时间的十分之一）====> EXISTS 后面跟大表~

记忆：IN 后面跟小表~EXISTS 后面跟大表~~~因为 IN 这个单词比 EXISTS 单词更短（更小），EXISTS 这个单词比 IN 更长（更大）

2.4 进一步分析

至于为什么 Case#1 优于 Case#2，Case#3 优于 Case#4，还没搞清楚到底是为什么，，，，，TODO

一篇文章可供参考：https://www.cnblogs.com/beijingstruggle/p/5885137.html

3 结论

小表驱动大表

IN 小 EXISTS 大

查询优化--小表驱动大表（In，Exists区别）的更多相关文章

6.2 小表驱动大表（exists的应用）
1. 优化原则:小表驱动大表,即小数据集驱动大数据集. select * from A where id in (select id from B) 等价于: for select id from B ...
Mysql优化原则_小表驱动大表IN和EXISTS的合理利用
//假设一个for循环 ; $i < ; $i++) { ; $i < ; $j++) { } } ; $i < ; $i++) { ; $i < ; $j++) { } } ...
MySQL高级知识（十六）——小表驱动大表
前言:本来小表驱动大表的知识应该在前面就讲解的,但是由于之前并没有学习数据批量插入,因此将其放在这里.在查询的优化中永远小表驱动大表. 1.为什么要小表驱动大表呢类似循环嵌套 for(int i=5 ...
MySql 小表驱动大表
在了解之前要先了解对应语法 in 与 exist. IN: select * from A where A.id in (select B.id from B) in后的括号的表达式结果要求之输出一列 ...
了解MySQL联表查询中的驱动表，优化查询，以小表驱动大表
一.为什么要用小表驱动大表 1.驱动表的定义当进行多表连接查询时, [驱动表] 的定义为: 1)指定了联接条件时,满足查询条件的记录行数少的表为[驱动表] 2)未指定联接条件时,行数少的表为[驱动表 ...
3.mysql小表驱动大表的4种表连接算法
小表驱动大表 1.概念驱动表的概念是指多表关联查询时,第一个被处理的表,使用此表的记录去关联其他表.驱动表的确定很关键,会直接影响多表连接的关联顺序,也决定了后续关联时的查询性能. 2.原则驱动表 ...
小表驱动大表, 兼论exists和in
给出两个表,A和B,A和B表的数据量, 当A小于B时,用exists select * from A where exists (select * from B where A.id=B.id) ex ...
【Spark调优】小表join大表数据倾斜解决方案
[使用场景] 对RDD使用join类操作,或者是在Spark SQL中使用join语句时,而且join操作中的一个RDD或表的数据量比较小(例如几百MB或者1~2GB),比较适用此方案. [解决方案] ...
hive join 优化 --小表join大表
1.小.大表 join 在小表和大表进行join时,将小表放在前边,效率会高.hive会将小表进行缓存. 2.mapjoin 使用mapjoin将小表放入内存,在map端和大表逐一匹配.从而省去red ...

随机推荐

第一章 jQuery基础
第一章jQuery基础一.jQuert简介 1.什么是jQuery jQuery是javaScript的程序库之一,它是javaScript对象和实用函数的封装. jQuery是继Prototype ...
搭建一个web服务下载HDFS的文件
需求描述为了能方便快速的获取HDFS中的文件,简单的搭建一个web服务提供下载很方便快速,而且在web服务器端不留临时文件,只做stream中转,效率相当高! 使用的框架是SpringMVC+HDF ...
bad interpreter:No such file or directory 解决方法
今天在执行一个从网上考下来的脚本的时候,出现了下面的错误: Linux下面一个脚本死活也运行不了, 我检查了数遍,不可能有错. 提示:bad interpreter:No such file or d ...
移动端登录页面input获取焦点后页面布局及输入框上移的问题
最近切微信页面的时候,发现移动端的登录页面,带输入框的那种,如图: 从页面本身来看没有什么问题,上传至测试服务器,用iphone访问也没有什么问题,但是当同事用Android手机获取焦点后,问题来了, ...
mysql导出与导入
环境 centos6.5 32位 Mysql 5.7.19 导出 mysqldump用法导出整个数据库 [root@mini2 mysql]# mysqldump -p123456 --databa ...
【原创】自己动手实现RPC服务调用框架
自己动手实现rpc服务调用框架本文利用java自带的socket编程实现了一个简单的rpc调用框架,由两个工程组成分别名为battercake-provider(服务提供者).battercake- ...
安卓手机USB共享网络给PC上网
开端哈哈,最近我又发现了一个校园网的漏洞,但是只能手机连接,于是就想手机连接之后通过usb共享给电脑上网. 在手机上连接校园网WiFi,开启USB网络共享并且连接电脑之后,却发现电脑十分的卡顿!CP ...
Hibernate（八）：基于外键映射的1-1关联关系
背景: 一个部门只有一个一把手,这在程序开发中就会设计数据映射应该设置为一对一关联. 在hibernate代码开发中,实现这个业务有两种方案: 1)基于外键映射的1-1关联: 2)基于主键映射的1-1 ...
iOS 私有API调用
最近自己在做一个小程序,想实现一个一键设置手机壁纸的功能.但在iOS公开的API里找不到相关的方法,只能从私有API入手. 网上有不少教程,不过都不是很详细.从google和https://stack ...
[ABP]浅谈模块系统与 ABP 框架初始化
在 ABP 框架当中所有库以及项目都是以模块的形式存在,所有模块都是继承自AbpModule 这个抽象基类,每个模块都拥有四个生命周期.分别是: PreInitialze(); Initialize( ...

查询优化--小表驱动大表（In，Exists区别）

查询优化--小表驱动大表（In，Exists区别）的更多相关文章

随机推荐

热门专题