MySQL Join算法与调优白皮书（三）

Batched Key Access Join

Index Nested-Loop Join虽好，但是通过辅助索引进行链接后需要回表，这里需要大量的随机I/O操作。若能优化随机I/O，那么就能极大的提升Join的性能。为此，MySQL 5.6推出了Batched Key Access Join，该算法通过常见的空间换时间，随机I/O转顺序I/O，以此来极大的提升Join的性能。

MRR

在说明Batched Key Access Join前，首先介绍下MySQL 5.6的新特性mrr——multi range read。这个特性根据rowid顺序地，批量地读取记录，从而提升数据库的整体性能。看下面的SQL语句的执行计划：

mysql> explain select * from orders

-> where o_orderdate >= '1993-08-01'

-> and o_orderdate < date_add( '1993-08-01' ,interval '3' month)\G

*************************** 1. row ***************************

id: 1

select_type: SIMPLE

table: orders

partitions: NULL

type: range

possible_keys: i_o_orderdate

key: i_o_orderdate

key_len: 4

ref: NULL

rows: 143210

filtered: 100.00

Extra: Using index condition

1 row in set, 1 warning (0.00 sec)

上述的SQL语句需要根据辅助索引i_o_orderdate进行查询，但是由于要求得到的是表中所有的列，因此需要回表进行读取。而这里就可能伴随着大量的随机I/O。这个过程如下图所示：

而mrr的优化在于，并不是每次通过辅助索引读取到数据就回表去取记录，而是将其rowid给缓存起来，然后对rowid进行排序后，再去访问记录，这样就能将随机I/O转化为顺序I/O，从而大幅地提升性能。这个过程如下所示：

从上图可以发现mrr通过一个额外的内存来对rowid进行排序，然后再顺序地，批量地访问表。这个进行rowid排序的内存大小由参数read_rnd_buffer_size控制，默认256K。

要开启mrr还有一个比较重的参数是在变量optimizer_switch中的mrr和mrr_cost_based选项。mrr选项默认为on，mrr_cost_based选项默认为off。mrr_cost_based选项表示通过基于成本的算法来确定是否需要开启mrr特性。然而，在MySQL当前版本中，基于成本的算法过于保守，导致大部分情况下优化器都不会选择mrr特性。为了确保优化器使用mrr特性，请执行下面的SQL语句：

mysql>set optimizer_switch='mrr=on,mrr_cost_based=off';

同样执行前面的SQL语句，可以发现这时优化的执行计划为：

mysql> explain select * from orders where

-> o_orderdate >= '1993-08-01'

-> and o_orderdate < date_add('1993-08-01' ,interval '3' month)\G

*************************** 1. row***************************

id: 1

select_type: SIMPLE

table: orders

partitions: NULL

type: range

possible_keys: i_o_orderdate

key: i_o_orderdate

key_len: 4

ref: NULL

rows: 143210

filtered: 100.00

Extra: Using index condition; Using MRR

1row in set, 1 warning (0.00 sec)

最后来对比一下关闭和开启mrr特性后上述SQL的执行时间：

在讲述完mrr特性后，再来看BKA Join就非常清晰明了了。通过mrr特性优化Join的回表操作，从而提升Join的性能。这时BKA Join的整个过程如下所示：

然而，这么好的特性，却是在MySQL中默认关闭的！！！这可能是导致用户认为MySQL Join性能比较差的一个原因。若要使用BKA Join，务必执行下列的SQL语句：

mysql> SET optimizer_switch='mrr=on,mrr_cost_based=off,batched_key_access=on';

Query OK, 0 rows affected (0.00 sec)

若开启了BKA Join，则通过EXPLAIN命令，可以发现优化器的执行结果选项会有Using join buffer (Batched Key Access)的提示，如：

mysql> explain SELECT

-> COUNT(*)

-> FROM

-> part,

-> lineitem

-> WHERE

-> l_partkey， = p_partkey

-> AND p_retailprice > 2050 AND p_size < 100

-> AND l_discount > 0.04\G

*************************** 1. row ***************************

id: 1

select_type: SIMPLE

table: part

partitions: NULL

type: ALL

possible_keys: PRIMARY

key: NULL

key_len: NULL

ref: NULL

rows: 196810

filtered: 11.11

Extra: Using where

*************************** 2. row ***************************

id: 1

select_type: SIMPLE

table: lineitem

partitions: NULL

type: ref

possible_keys: i_l_suppkey_partkey,i_l_partkey

key: i_l_suppkey_partkey

key_len: 5

ref: dbt3_s1.part.p_partkey

rows: 28

filtered: 33.33

Extra: Using where; Using join buffer (Batched Key Access)

2 rows in set, 1 warning (0.00 sec)

最后来看下执行速度，可以发现BKA的提升非常明显：

未完待续

MySQL Join算法与调优白皮书（三）的更多相关文章

MySQL Join算法与调优白皮书（一）
正文 Inside君发现很少有人能够完成讲明白MySQL的Join类型与算法,网上流传着的要提升Join性能,加大变量join_buffer_size的谬论更是随处可见.当然,也有一些无知的PGer攻 ...
MySQL Join算法与调优白皮书（二）
Index Nested-Loop Join (接上篇)由于访问的是辅助索引,如果查询需要访问聚集索引上的列,那么必要需要进行回表取数据,看似每条记录只是多了一次回表操作,但这才是INLJ算法最大 ...
mysql监控、性能调优及三范式理解
原文:mysql监控.性能调优及三范式理解 1监控工具:sp on mysql sp系列可监控各种数据库 2调优 2.1 DB层操作与调优 2.1.1.开启慢查询在My.cnf文件中添加如 ...
【叶问】 MySQL常用的sql调优手段或工具有哪些
MySQL常用的sql调优手段或工具有哪些1.根据执行计划优化通常使用desc或explain,另外可以添加format=json来输出更详细的json格式的执行计划,主要注意点如下: ...
MySQL性能诊断与调优转
http://www.cnblogs.com/preftest/ http://www.highperfmysql.com/ BOOK LAMP 系统性能调优,第 3 部分: MySQL 服务 ...
MySQL插入数据性能调优
插入数据性能调优总结: 1.SQL插入语句调优 2.如果是InnoDB引擎的话,尝试开启事务,批量提交 3.调整MySQl数据库配置参考: 百度空间 - MySQL插入数据性能调优 CSDN ...
MySQL性能诊断与调优
LAMP 系统性能调优,第 3 部分: MySQL 服务器调优http://www.ibm.com/developerworks/cn/linux/l-tune-lamp-3.html LoadRun ...
JVM调优（三）——基于Btrace的监控调试
JVM调优(三)--基于Btrace的监控调试简介 Btrace可以动态地向目标应用程序的字节码注入追踪代码用到的技术: JavaComplierApi.JVMTI.Agent.Instrumen ...
MySQL索引和SQL调优手册
MySQL索引 MySQL支持诸多存储引擎,而各种存储引擎对索引的支持也各不相同,因此MySQL数据库支持多种索引类型,如BTree索引,哈希索引,全文索引等等.为了避免混乱,本文将只关注于BTree ...

随机推荐

nodejs之log4js日志记录模块简单配置使用
在我的一个node express项目中,使用了log4js来生成日志并且保存到文件里,生成的文件如下: 文件名字叫:access.log 如果在配置log4js的时候允许了同时存在多个备份log文件 ...
is7.0中发布mvc网站,一直无法正常执行路由的解决办法
在config中加一句话: <system.webServer> <validation validateIntegratedModeConfiguration="fals ...
Go语言打印调用堆栈
Go语言打印调用堆栈这两天看Go的代码,呃,协程太多,无数个携程调用了一个方法,彻底看不清了,所以就想到是不是可以把调用堆栈打印出来. 查了一下,发现Go的 runtime/debug 库可以把调用 ...
C#中PadLeft和PadRight小知识点
当我们显示字符串数据时,有时候我们需要考虑数据的排列美观. 比如一些人名和一些编号,我们想让他们整齐对齐显示等. C# String类提供了2种操作方法: String.PadLeft(int tot ...
理解Scala中的Extractor
引言最近抱着<Programming in Scala>(英文第二版)在死啃Scala.在阅读第26章Extractor时,偶然在Stack Overflow上搜到一个帖子<Sca ...
python sys.path.append()和sys.path.insert()
python程序中使用 import XXX 时,python解析器会在当前目录.已安装和第三方模块中搜索 xxx,如果都搜索不到就会报错. 使用sys.path.append()方法可以临时添加搜索 ...
base64 和 Blob 相互转换
Base64 to Blob function dataURLtoBlob(dataurl) { var arr = dataurl.split(','), mime = arr[0].match(/ ...
sha1的加密
from hashlib import sha1 #给password加密s1 = sha1() #创建sha1加密对象s1.update(password.encode("utf-8&qu ...
a链接嵌套无效，嵌套链接最优解决办法
<a>不支持嵌套.例如: <a href="#1">11111111111<a href="#2">22222222222& ...
asp.net core microservices 架构之分布式自动计算（一）
一:简介自动计算都是常驻内存的,没有人机交互.我们经常用到的就是console job和sql job了.sqljob有自己的宿主,与数据库产品有很关联,暂时不提.console job使 ...

MySQL Join算法与调优白皮书（三）

MySQL Join算法与调优白皮书（三）的更多相关文章

随机推荐

热门专题