SQL优化(3):使用explain了解SQL性能-part2
接上文,上文对type列用实例做了说明,本文对Extra列进行一些说明。
Extra列
Using filesort
前文说,需要对所有的查询结果进行一次排序,例如当使用order by时。但是若查询时用到了index,那么对于order by来说可能就不需要排序了,因为index数据就是按照有序的方式存储的,即按照index的方式进行排列即可。
- 按照某一列(非主键)进行排序
mysql> EXPLAIN SELECT * FROM t1 ORDER BY c_str_value;
+----+-------------+-------+------+---------------+------+---------+------+------+----------------+
| id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra |
+----+-------------+-------+------+---------------+------+---------+------+------+----------------+
| 1 | SIMPLE | t1 | ALL | NULL | NULL | NULL | NULL | 4915 | Using filesort |
+----+-------------+-------+------+---------------+------+---------+------+------+----------------+
- 按照主键进行排序,可以看到这种情况下并没有filesort。因为InnoDB中,数据项在主键索引的叶节点上,所以等于说所有的数据是按照主键次序存储的,所以不用排序。
mysql> EXPLAIN SELECT * FROM t1 order by c_primary_key;
+----+-------------+-------+-------+---------------+---------+---------+------+-------+-------+
| id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra |
+----+-------------+-------+-------+---------------+---------+---------+------+-------+-------+
| 1 | SIMPLE | t1 | index | NULL | PRIMARY | 4 | NULL | 10034 | NULL |
+----+-------------+-------+-------+---------------+---------+---------+------+-------+-------+
- 如果我们在c_str_value上建立索引,那么索引数据就会多出一个二级索引(存的是 当前column+对应的主键)。那么我们再次执行EXPLAIN,如下。结果显示同样需要filesort,为什么mysql不按照c_str_value的索引顺序读记录?偏偏还要进行一次排序呢。这是因为如果从索引读数据的话,是按照索引值->主键值->一行记录。那么我们可以知道在主键->一行记录的过程中,磁盘是随机读取,这样反而不如filesort来的快。
mysql> CREATE INDEX c_str_value_idx ON t1(c_str_value);
mysql> EXPLAIN SELECT * FROM t1 order by c_str_value;
+----+-------------+-------+------+---------------+------+---------+------+-------+----------------+
| id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra |
+----+-------------+-------+------+---------------+------+---------+------+-------+----------------+
| 1 | SIMPLE | t1 | ALL | NULL | NULL | NULL | NULL | 10034 | Using filesort |
+----+-------------+-------+------+---------------+------+---------+------+-------+----------------+
那么假如查询的列只是(主键,c_str_value)两个列时,不需要filesort,因为c_str_value的索引数据足够应对。
mysql> EXPLAIN SELECT c_primary_key,c_str_value FROM t1 order by c_str_value;
+----+-------------+-------+-------+---------------+-----------------+---------+------+-------+-------------+
| id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra |
+----+-------------+-------+-------+---------------+-----------------+---------+------+-------+-------------+
| 1 | SIMPLE | t1 | index | NULL | c_str_value_idx | 65 | NULL | 10034 | Using index |
+----+-------------+-------+-------+---------------+-----------------+---------+------+-------+-------------+
mysql> DROP INDEX c_str_value_idx ON t1;
- 如果仅仅是 主键列+index列 不满足需求!那么可以考虑加复合索引,例如需要查询(c_primary_key,c_multi_key_part1,c_multi_key_part2)这三列的话,那么可以给(c_multi_key_part1,c_multi_key_part2)加上index,那么这个索引数据足以应对这次排序,所以不用filesort了。
mysql> explain select c_primary_key,c_multi_key_part1,c_multi_key_part2 from t2 order by c_multi_key_part1;
+----+-------------+-------+-------+---------------+-------------------+---------+------+---------+-------------+
| id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra |
+----+-------------+-------+-------+---------------+-------------------+---------+------+---------+-------------+
| 1 | SIMPLE | t2 | index | NULL | c_multi_key_part1 | 130 | NULL | 1179542 | Using index |
+----+-------------+-------+-------+---------------+-------------------+---------+------+---------+-------------+
mysql> explain select c_primary_key,c_multi_key_part1,c_multi_key_part2 from t2 where c_multi_key_part1='1' order by c_multi_key_part2;
+----+-------------+-------+------+-------------------+-------------------+---------+-------+------+--------------------------+
| id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra |
+----+-------------+-------+------+-------------------+-------------------+---------+-------+------+--------------------------+
| 1 | SIMPLE | t2 | ref | c_multi_key_part1 | c_multi_key_part1 | 65 | const | 1 | Using where; Using index |
+----+-------------+-------+------+-------------------+-------------------+---------+-------+------+--------------------------+
在使用复合索引时,要注意复合索引的次序,若是上面SQL中的where条件改为(where c_multi_key_part2=’1’ order by c_multi_key_part1)那么就用不到这个复合索引了。
使用适当的index,来把排序工作放在Insert时完成!
Using index
若是用到了索引数据,那么Extra就会有Using index。
同时需要注意是否有Using where,若是没有,意味着index的所有数据将会被遍历,那么很可能性能也不是太高。
具体实例,可以参考前面的例子。
Using temporary
如字面意思使用临时表。
t1左关联t2表,并按照t2表进行排序,可以看到用了临时表+排序。从输出的字面解读来说,对于来自t1的每一行记录,都有t2的唯一一条(eq_fef)对应。但是t1并不知道t2表的字段c_primary_key是索引(有序的),所以最终到t1查完之后得到result时,仍然需要进行filesort。
mysql> explain select t1.c_primary_key, t1.c_unique_key, t2.c_primary_key from t1 left join t2 on t1.c_primary_key=t2.c_primary_key order by t2.c_primary_key;
+----+-------------+-------+--------+---------------+--------------+---------+-------------------------+---------+----------------------------------------------+
| id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra |
+----+-------------+-------+--------+---------------+--------------+---------+-------------------------+---------+----------------------------------------------+
| 1 | SIMPLE | t1 | index | NULL | c_unique_key | 65 | NULL | 1181681 | Using index; Using temporary; Using filesort |
| 1 | SIMPLE | t2 | eq_ref | PRIMARY | PRIMARY | 4 | dbTest.t1.c_primary_key | 1 | Using index |
+----+-------------+-------+--------+---------------+--------------+---------+-------------------------+---------+----------------------------------------------+
对于以上sql,可以把t1和t2调整一下次序,可以看到,对于t2的每一行记录,t1都有唯一一行与之对应。对于匹配的每一行结果,t2表知道这已经是按照我的t2.c_primary_key的次序进行排序的了,所以即不用存储临时结果,又不用再做排序了。
mysql> explain select t1.c_primary_key, t1.c_unique_key, t2.c_primary_key from t2 left join t1 on t1.c_primary_key=t2.c_primary_key order by t2.c_primary_key;
+----+-------------+-------+--------+---------------+---------+---------+-------------------------+---------+-------------+
| id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra |
+----+-------------+-------+--------+---------------+---------+---------+-------------------------+---------+-------------+
| 1 | SIMPLE | t2 | index | NULL | PRIMARY | 4 | NULL | 1179542 | Using index |
| 1 | SIMPLE | t1 | eq_ref | PRIMARY | PRIMARY | 4 | dbTest.t2.c_primary_key | 1 | NULL |
+----+-------------+-------+--------+---------------+---------+---------+-------------------------+---------+-------------+
right join跟left join相反,left join看左边的表,而right join看右边的表!
实际上看explain输出的第一个表示谁!
Group By子句:
- Group By可以使用index进行分组统计,这里索引(c_multi_key_part1,c_multi_key_part2)满足查询需求。
mysql> explain select max(c_multi_key_part2),c_multi_key_part1 from t1 group by c_multi_key_part1;
+----+-------------+-------+-------+-------------------+-------------------+---------+------+---------+-------------+
| id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra |
+----+-------------+-------+-------+-------------------+-------------------+---------+------+---------+-------------+
| 1 | SIMPLE | t1 | index | c_multi_key_part1 | c_multi_key_part1 | 130 | NULL | 1181681 | Using index |
+----+-------------+-------+-------+-------------------+-------------------+---------+------+---------+-------------+
- Group By中对索引的使用有两种,松散索引扫描和紧凑索引扫描。松散索引扫描需要读取的键值数量和分组的组的数量一样多,也就是比实际存在的键值数目少很多。而紧凑型扫描将读取所有满足条件的索引值。如下,统计c_key不同值的个数,Extra中Using index for group-by表示使用松散扫描。
mysql> explain select count(distinct c_key) from t1;
+----+-------------+-------+-------+---------------+-------+---------+------+---------+-------------------------------------+
| id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra |
+----+-------------+-------+-------+---------------+-------+---------+------+---------+-------------------------------------+
| 1 | SIMPLE | t1 | range | c_key | c_key | 65 | NULL | 1181682 | Using index for group-by (scanning) |
+----+-------------+-------+-------+---------------+-------+---------+------+---------+-------------------------------------+
紧凑扫描的例子这里不再给出。
- Group By在没有合适索引的情况下,会使用临时表存储结果,然后对临时表进行排序操作,才最终得到结果。
mysql> explain select c_str_value from t1 group by c_str_value;
+----+-------------+-------+------+---------------+------+---------+------+---------+---------------------------------+
| id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra |
+----+-------------+-------+------+---------------+------+---------+------+---------+---------------------------------+
| 1 | SIMPLE | t1 | ALL | NULL | NULL | NULL | NULL | 1181681 | Using temporary; Using filesort |
+----+-------------+-------+------+---------------+------+---------+------+---------+---------------------------------+
而事实上,若是只要分组而不需要排序的情况下,那么可以使用oder by null,告诉服务器不需要对进过进行排序,如下,这样就没有了Using filesort。
mysql> explain select c_str_value from t1 group by c_str_value order by null;
+----+-------------+-------+------+---------------+------+---------+------+---------+-----------------+
| id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra |
+----+-------------+-------+------+---------------+------+---------+------+---------+-----------------+
| 1 | SIMPLE | t1 | ALL | NULL | NULL | NULL | NULL | 1181681 | Using temporary |
+----+-------------+-------+------+---------------+------+---------+------+---------+-----------------+
- Group By可以使用index进行分组统计,这里索引(c_multi_key_part1,c_multi_key_part2)满足查询需求。
小结
在Extra,如果有Using temporary和Using filesort,一般来说性能都不会太好,所以需要重点考虑。想在短期或者几篇文档中把所有方面都搞清楚,看来也不现实,还是多在实践中积累吧。
SQL优化(3):使用explain了解SQL性能-part2的更多相关文章
- SQL优化:使用explain
前文说了EXPLAIN的输出的含义,本文实战一下. Database Schema DROP DATABASE dbTest; CREATE DATABASE dbTest; USE dbTest; ...
- SQL 优化总结(三) SQL子句
SQL子句 尽可能编写优化器可以优化的语句. 1. SELECT子句 (1) 在查询Select语句中用Where字句限制返回的行数,避免表扫描,如果返回不必要的数据,浪费了服务器的I/O资源,加重了 ...
- SQL优化技术分析-2:SQL书写的影响
1.同一功能同一性能不同写法SQL的影响. 如一个SQL在A程序员写的为 Select * from zl_yhjbqk B程序员写的为 Select * from dlyx.zl_yhjbqk(带表 ...
- SQL优化技术分析-3:SQL语句索引的利用
使用索引来更快地遍历表.默认情况下建立的索引是非聚集索引,但有时它并不是最佳的.在非聚集索引下,数据 在物理上随机存放在数据页上.合理的索引设计要建立在对各种查询的分析和预测上.一般来说: 有大量重复 ...
- 浅谈SQL优化入门:1、SQL查询语句的执行顺序
1.SQL查询语句的执行顺序 (7) SELECT (8) DISTINCT <select_list> (1) FROM <left_table> (3) <join_ ...
- 浅谈SQL优化入门:2、等值连接和EXPLAIN(MySQL)
1.等值连接:显性连接和隐性连接 在<MySQL必知必会>中对于等值连接有提到两种方式,第一种是直接在WHERE子句中规定如何关联即可,那么第二种则是使用INNER JOIN关键字.如下例 ...
- 对SQL 优化,提升性能!
对SQL 进行优化能够有效提高SQL 语句的执行效率,降低系统资源开销,是开发者提高后端系统处理能力的首选方案. 新产品上线后,随着运营推广活动的开始,业务进入快速增长期,数据库作为后端系统唯一或者主 ...
- 基于Oracle的SQL优化(社区万众期待 数据库优化扛鼎巨著)
基于Oracle的SQL优化(社区万众期待数据库优化扛鼎巨著) 崔华 编 ISBN 978-7-121-21758-6 2014年1月出版 定价:128.00元 856页 16开 编辑推荐 本土O ...
- 转://从一条巨慢SQL看基于Oracle的SQL优化
http://mp.weixin.qq.com/s/DkIPwbDKIjH2FMN13GkT4w 本次分享的内容是基于Oracle的SQL优化,以一条巨慢的SQL为例,从快速解读SQL执行计划.如何从 ...
- 从一条巨慢SQL看基于Oracle的SQL优化(重磅彩蛋+PPT)
本文根据DBAplus社群第110期线上分享整理而成,文末还有好书送哦~ 讲师介绍 丁俊 新炬网络首席性能优化专家 SQL审核产品经理 DBAplus社群联合发起人.<剑破冰山-Oracle开发 ...
随机推荐
- tar 压缩解压命令详解
tar -c: 建立压缩档案-x:解压-t:查看内容-r:向压缩归档文件末尾追加文件-u:更新原压缩包中的文件 这五个是独立的命令,压缩解压都要用到其中一个,可以和别的命令连用但只能用其中一个.下面的 ...
- android ReactNative之Cannot find entry file index.android.js in any of the roots
android ReactNative之Cannot find entry file index.android.js in any of the roots 2018年04月02日 14:53:12 ...
- CCPC-Wannafly Winter Camp Day7 (Div2, onsite)
Replay Dup4: 啥都不会? 只能看着两位聚聚A题? X: 模拟题不会写, 日常摔锅 u, v分不清, 日常演员 又是自己没理清楚就抢键盘上机导致送了一万个罚时, 日常背锅 A:迷宫 Solv ...
- C#——文件上传(一般处理程序ashx)
Framework版本:.Net Framework 4 1.FileInfo实体 using System; using System.Collections.Generic; using Syst ...
- DB开发之大数据量高并发的数据库优化
一.数据库结构的设计 如果不能设计一个合理的数据库模型,不仅会增加客户端和服务器段程序的编程和维护的难度,而且将会影响系统实际运行的性能.所以,在一个系统开始实施之前,完备的数据库模型的设计是必须的. ...
- AVAudioFoundation(6):时间和媒体表示
本文转自:AVAudioFoundation(6):时间和媒体表示 | www.samirchen.com 本文主要内容来自 AVFoundation Programming Guide. 基于时间的 ...
- GPS数据解析
1.摘要 GPS模块使用串口通信,那么它的的数据处理本质上还是串口通信处理,只是GPS模块的输出的有其特定的格式,需要字符串处理逻辑来解析其含义.如何高效的处理从GPS模块接收到的数据帧,是GPS驱动 ...
- 20145221 《Java程序设计》第一周学习总结
20145221 <Java程序设计>第一周学习总结 教材学习内容总结 第一周内容已在假期完成,详见博客: Hello Java! 开源中国的代码托管 代码调试中的问题和解决过程 第一周内 ...
- Java的初始化与清理
大家都知道,Java是站在巨人的肩上成功的,它是在C&C++的基础上进一步的开发,投入面向对象开发的怀抱.Java吸取了很多以前的教训,加入自己很多独创的方式.在程序语言发展初期,许多C程序员 ...
- windows下利用批处理脚本监控程序
1.要监控的程序为使用cygwin环境编译的exe可执行文件hello.exe,源码如下: #include <stdio.h> #include <unistd.h> voi ...