semi-join子查询优化 -- FirstMatch策略

FirstMatch执行semi-join子查询的一种策略。

类似于MySQL 5.x中如何执行in、exists子查询。

让我们以搜索拥有大城市的国家为例：

select * from Country

where Country.code IN (select City.Country

                       from City

                       where City.Population > 1*1000*1000)

      and Country.continent='Europe';

假设，我们的执行计划是找到欧洲的国家，然后，对于每个找到的国家，检查它是否有大城市。常规的inner join执行将如下所示：

由于德国有两个大城市(在该图中)，所以它将被两次放入查询输出中。这是不正确的，select … from country不应产生相同的国家记录两次。First Match策略在找到第一个真正的匹配后，通过缩短执行来避免产生重复:

注意，在应用了“Using where”之后，才进行short-cutting操作。在找到Tirer之后就进行short-cutting操作肯定是错误的。

上面的查询使用First Match之后，执行计划类似如下：

MariaDB [world]> explain select * from Country  where Country.code IN (select City.Country from City where City.Population > 1*1000*1000) and Country.continent='Europe';

+----+-------------+---------+------+--------------------+-----------+---------+--------------------+------+----------------------------------+

| id | select_type | table   | type | possible_keys      | key       | key_len | ref                | rows | Extra                            |

+----+-------------+---------+------+--------------------+-----------+---------+--------------------+------+----------------------------------+

|  1 | PRIMARY     | Country | ref  | PRIMARY,continent  | continent | 17      | const              |   60 | Using index condition            |

|  1 | PRIMARY     | City    | ref  | Population,Country | Country   | 3       | world.Country.Code |   18 | Using where; FirstMatch(Country) |

+----+-------------+---------+------+--------------------+-----------+---------+--------------------+------+----------------------------------+

2 rows in set (0.00 sec)

extra列中的FirstMatch(Country)表示，一旦生成了一个匹配的记录组合，就可以short-cutting过程就执行并跳转回Country表。

FirstMatch的查询计划与MySQL中的非常相似:

MySQL [world]> explain select * from Country  where Country.code IN (select City.Country from City where City.Population > 1*1000*1000) and Country.continent='Europe';

+----+--------------------+---------+----------------+--------------------+-----------+---------+-------+------+------------------------------------+

| id | select_type        | table   | type           | possible_keys      | key       | key_len | ref   | rows | Extra                              |

+----+--------------------+---------+----------------+--------------------+-----------+---------+-------+------+------------------------------------+

|  1 | PRIMARY            | Country | ref            | continent          | continent | 17      | const |   60 | Using index condition; Using where |

|  2 | DEPENDENT SUBQUERY | City    | index_subquery | Population,Country | Country   | 3       | func  |   18 | Using where                        |

+----+--------------------+---------+----------------+--------------------+-----------+---------+-------+------+------------------------------------+

2 rows in set (0.01 sec)

FirstMatch策略背后的思想和in->exists转换思想相同。然而，FirstMatch有以下的优点：
1.等价传播可以跨越semi-join边界，但是不能跨越子查询边界。因此，使用FirstMatch将子查询转换成semi-join可以提供一个更好的执行计划
2.只有一种方式使用in->exists策略，mysql会无条件地使用。对于FirstMatch策略，优化器可以选择是否应该在子查询中使用的所有表都位于join前缀时运行FirstMatch策略，或者在稍后的某个时间点运行FirstMatch策略

FirstMatch策略意味着子查询的表必须在父查询中的表之后被引用；
FirstMatch支持相关子查询；
不能应用于子查询带有group by或聚合函数的场景；
是否开启FirstMatch是由系统变量optimizer_switch中的firstmatch=on|off设置的。

https://mariadb.com/kb/en/library/firstmatch-strategy/

semi-join子查询优化 -- FirstMatch策略的更多相关文章

semi-join子查询优化 -- LooseScan策略
LooseScan执行semi-join子查询的一种策略. 我们将通过示例来演示这种松散(LooseScan)策略.假设,我们正在查找拥有卫星的国家.我们可以通过以下查询获得它们(为了简单起见,我们忽 ...
MySQL 通过semi join 优化子查询
半连接是MySQL 5.6.5引入的,多在子查询exists中使用,对外部row source的每个键值,查找到内部row source匹配的第一个键值后就返回,如果找到就不用再查找内部row sou ...
semi-join子查询优化 -- semi-join Materialization策略
semi-join Materialization 是用于semi-join的一种特殊的子查询物化技术.通常包含两种策略:1.Materialization/lookup2.Materializati ...
postgresql子查询优化(提升子查询)
问题背景在开发项目过程中,客户要求使用gbase8s数据库(基于informix),简单的分页页面响应很慢.排查发现分页sql是先查询出数据在外面套一层后再取多少条,如果去掉嵌套的一层,直接获取则很 ...
Mysql单表访问方法，索引合并，多表连接原理，基于规则的优化，子查询优化
参考书籍<mysql是怎样运行的> 非常推荐这本书,通俗易懂,但是没有讲mysql主从等内容书中还讲解了本文没有提到的子查询优化内容, 本文只总结了常见的子查询是如何优化的系列文章目录 ...
【MySQL】MySQL中针对大数据量常用技术_创建索引+缓存配置+分库分表+子查询优化（转载）
原文地址:http://blog.csdn.net/zwan0518/article/details/11972853 目录(?)[-] 一查询优化 1创建索引 2缓存的配置 3slow_query_ ...
标量子查询优化（用group by 代替distinct）
标量子查询优化当使用另外一个SELECT 语句来产生结果中的一列的值的时候,这个查询必须只能返回一行一列的值.这种类型的子查询被称为标量子查询在某些情况下可以进行优化以减少标量子查询的重复执行,但 ...
PostgreSQL查询优化之子查询优化
子查询优化上拉子连接上拉子连接主要是把ANY和EXIST子句转换为半连接 void pull_up_sublinks(PlannerInfo *root) { Node *jtnode; //子连 ...
转载:left join和left semi join的联系和区别
1.联系他们都是 hive join 方式的一种,join on 属于 common join(shuffle join/reduce join),而 left semi join 则属于 map ...

随机推荐

H3C 802.11n的频宽模式
pandas之数据处理
首先,数据加载 pandas提供了一些用于将表格型数据读取为DataFrame对象的函数,期中read_csv和read_table这两个使用最多. 1.删除重复元素使用duplicated()函数 ...
如何使用anaconda安装pygame
超级方便!!! 打开Anaconda, 输入: pip install pygame 等待下载安装完成. 如图: 显示成功安装:
Python的路径操作（os模块与pathlib模块）
Python的路径操作(os模块与pathlib模块) 作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.os.path模块(Python 3.4版本之前推荐使用该模块) #!/u ...
Linux常用命令学习一
rpm -qa |grep jdk:查询系统中是否有存在jdk的rpm已安装程序: rpm -e --nodeps jdk1.8:卸载jdk1.8的程序: rpm -ivh rpm文件:安装rpm文件 ...
编程小白入门分享一：git的最基本使用
git简介引用了网上的一张图,这张图清晰表达git的架构.workspace是工作区,可以用编辑器直接编辑其中的文件:Index/Stage是暂存区,编辑后的文件可以添加到(add)暂存区:Repo ...
faster-rcnn系列原理介绍及概念讲解
faster-rcnn系列原理介绍及概念讲解 faster-rcnn系列原理介绍及概念讲解2 转:作者:马塔链接:https://www.zhihu.com/question/42205480/an ...
c#——ref 和 out 的区别
一个用关键字 ref 标示,一个用 out 标示. 牵扯到数据是引用类型还是值类型. 一般用这两个关键字你是想调用一个函数将某个值类型的数据通过一个函数后进行更改.传 out 定义的参数进去的时候这个 ...
selenium模块及类组织关系
问题:webdriver子模块中为什么可以直接使用类Chrome.ChromeOptions.Firefox.FirefoxProfile... 在webdriver的__init__.py文件中已经 ...
全局异常捕获处理-@ControllerAdvice+@HandleException
涂涂影院管理系统这个demo中有个异常管理的标签,用于捕获涂涂影院APP用户异常信息 ,有小伙伴好奇,排除APP,后台端的是如何处理全局异常的,故项目中的实际应用已记之. 关于目前的异常处理在使用 ...

semi-join子查询优化 -- FirstMatch策略

semi-join子查询优化 -- FirstMatch策略的更多相关文章

随机推荐

热门专题