mysql explain预估剖析

http://www.cnblogs.com/LBSer/p/3333881.html

引子：

　　使用MySQL建立了一张表country，总共有才3121行记录。

　　但是使用explain select count(*) from country;的时候，发现行数rows达到6897，让我大吃一惊。

mysql> explain select count(*) from country;

+----+-------------+---------+------+---------------+------+---------+------+------+-------+

| id | select_type | table   | type | possible_keys | key  | key_len | ref  | rows | Extra |

+----+-------------+---------+------+---------------+------+---------+------+------+-------+

|  1 | SIMPLE      | country | ALL  | NULL          | NULL | NULL    | NULL | 6897 | NULL  |

+----+-------------+---------+------+---------------+------+---------+------+------+-------+

问题：为什么explain的结果和真实的结果运行不一致，并且产生这么大的误差？

　　针对这个问题，上网查了些资料，特此发博文总结下，当然自己也是刚刚使用mysql，有很多不了解的地方，希望多多指正。

一、explain是什么？

　　通过explain可以查看MySQL的执行计划，从而知道MySQL是如何处理我们的SQL语句。具体来说通过explain我们能得到一系列的关键信息，比如哪些索引被实际使用，查询了多少行等等。

　　explain使用Rows来告知我们数据库即将要阅读的行数，但是实际将要阅读的行数和explain所记载的将要阅读的行数可能会有差异，这是因为explain并没有真的去执行sql语句从而得出行数，而是进行了某种预估。

二、explain怎么预估行数

　　找了半天得知真相的我眼泪掉下来：http://lists.mysql.com/commits/115810

1）mysql-5.5之前

　　首先找到查询第一个记录所在的page（记为PLeft），统计PLeft里的记录数（记为Records_PLeft），之后找到最后一个记录所在的page（记为PRight），统计PRight的记录数（Records_PRight），之后将Records_PLeft与Records_PRight取平均，最后乘以总共的page数目（记为Page_Num）。公式如下：

Rows = ((Records_PLeft + Records_PRight)/)*Page_Num

　　统计上讲这个预估方法是很有偏的。比如总共4个page：page1(999 records), page2(1 record), page3(1 record), page4(1 record)，这样预估出来的Rows=((999+1)/2)*4 = 2000，然而实际上才总共才有1002个记录。

2）mysql-5.5之后

　　上述预估偏差大的关键在于有偏，而有偏的关键在于采样的page数太少了，事实上只采样了边界2个，新算法的思路很简单，增加采样数目，比如采样10个page，这样可以在一定程度上降低偏差。

　　具体来说，mysql除了边界2个外，还沿着左侧page往右连续查找8个page，如果总的page数目小于等于10个，那么预估的Rows和真实的Rows一致。

Rows = ((Records_PLeft +  Records_P1 + Records_P2 + ... + Records_P8 + Records_PRight)/)*Page_Num

　　上述方法只是在一定程度上缓解了有偏的问题，但是不准确还是存在的，事实上楼主的mysql版本是5.6版本，可见还是没有解决的很好。

三、思考

　　为什么是从左往右连续选8个page，而不是在首尾之间随机选择8个page，既然要缓解采样有偏的问题，那么随机选应该更好。猜想可能有两个原因：1）随机选择每次explain得到的Rows不一样，不方便应用；2）随机选会造成I/O开销，尤其是数据量大的时候，毕竟explain是希望能快速得到预估结果。

　　我觉得应该还有更好的算法，能实现explain效率与精度的tradeoff，希望大家能给出建议。

mysql explain预估剖析的更多相关文章

【转载】 mysql explain用法
转载链接: mysql explain用法官网说明: http://dev.mysql.com/doc/refman/5.7/en/explain-output.html 参数: htt ...
Mysql Explain 详解（转）
原文:http://www.cnitblog.com/aliyiyi08/archive/2008/09/09/48878.html 一.语法 explain < table_name > ...
mysql explain详解
对于经常使用mysql的兄弟们,对explain一定不会陌生.当你在一条SELECT语句前放上关键词EXPLAIN,MySQL解释它将如何处理SELECT,提供有关表如何联合和以什么次序的信息.借助于 ...
mysql explain用法和结果的含义
重点是第二种用法,需要深入的了解. 先看一个例子: mysql> explain select * from t_order; +----+-------------+---------+--- ...
MYSQL EXPLAIN 很慢的原因
今天同事在查看一个SQL的执行计划的时候,EXPLAIN语句跑了2分钟.SQL命令类似: SELECT * FROM (SELECT USERID,COUNT(*) FROM TBNAME GROUP ...
[转]MySQL Explain详解
在日常工作中,我们会有时会开慢查询去记录一些执行时间比较久的SQL语句,找出这些SQL语句并不意味着完事了,些时我们常常用到explain这个命令来查看一个这些SQL语句的执行计划,查看该SQL语句有 ...
mysql explain 命令讲解
explian命令可以显示select语句的执行计划 explain的结果中每行对应select语句中的一个表,输出结果中的顺序是按照语句处理表的顺序. mysql使用嵌套循环来处理所有的join连接 ...
mysql explain输出中type的取值说明
原文: http://www.cnitblog.com/aliyiyi08/archive/2008/09/09/48878.html 这列很重要,显示了连接使用了哪种连接类别,有无使用索引. 从最好 ...
mysql explain用法和结果的含义(转)
重点是第二种用法,需要深入的了解. 先看一个例子: mysql> explain select * from t_order; +----+-------------+---------+--- ...

随机推荐

浏览器兼容java小程序配置说明
最近在使用的一个web应用系统是内嵌了java小程序,遇到了各种浏览器兼容性问题,现梳理如下: 1.通过以下链接检测当前电脑是否已经安装有java https://java.com/zh_CN/dow ...
[电脑知识点]Excel取消受保护视图
ZooKeeper系列(10)：ZooKeeper与Dubbo的结合
1. Dubbo的快速讲解以防有人对Dubbo不了解,快速过一下Dubbo的基本概念,下面简单引用一下官方的介绍 1.1 架构 1.2.角色说明 Provider:暴露服务的提供方 Consumer ...
Java——word分词·自定义词库
word: https://github.com/ysc/word word-1.3.1.jar 需要JDK8word-1.2.jar c语言给解析成了“语言”,自定义词库必须为UTF-8 程序一旦运 ...
ping -c 3 localhost
linux指令,ping -c count ip,向指定IP发送指定数量的ping包
VS2015 无法启动 IIS服务器
打开VS2012解决方案资源管理器 -> 点选 Web 项目选择 -> 属性 -> Web ->创建虚拟目录. 再次运行Web项目,成功.
c# 值类型与引用类型的传参(形参与实参)
形参是指被调用方法中的参数实参是指传递给方法的参数 (1)值类型传参是按值传递值类型传参,形参接受到的是实参的一个副本,即形参发生变化,实参不会发生任何变化 (2)引用类型参数按值传递当参数传递 ...
git openssl 模块生成 https 请求的 ssl 测试证书
1,请先确定安装了相关模块 1.1,git --version 1.2,openssl version -a 2,创建一个目录, cd 到该目录下 3,生成私钥 key 文件 openssl g ...
hasattr getattr setattr delattr --> (反射)
class Room: def __init__(self,name): self.name = name def big_room(self): print('bigroot') R = Room( ...
Oracle 表复杂查询之多表合并查询
转自:https://www.cnblogs.com/GreenLeaves/p/6635887.html 本文使用到的是oracle数据库scott方案所带的表,scott是oracle数据库自带的 ...

mysql explain预估剖析

mysql explain预估剖析的更多相关文章

随机推荐

热门专题