MySQL实验子查询优化双参数limit

没想到双参数limit还有优化的余地，为了亲眼见到，今天来亲自实验一下。

实验准备

使用MySQL官方的大数据库employees进行实验，导入该示例库见此

准备使用其中的employees表，先查看一下表结构和表内的记录数量

mysql> desc employees;

+------------+---------------+------+-----+---------+-------+

| Field      | Type          | Null | Key | Default | Extra |

+------------+---------------+------+-----+---------+-------+

| emp_no     | int(11)       | NO   | PRI | NULL    |       |

| birth_date | date          | NO   |     | NULL    |       |

| first_name | varchar(14)   | NO   |     | NULL    |       |

| last_name  | varchar(16)   | NO   |     | NULL    |       |

| gender     | enum('M','F') | NO   |     | NULL    |       |

| hire_date  | date          | NO   |     | NULL    |       |

+------------+---------------+------+-----+---------+-------+

6 rows in set (0.00 sec)

mysql> select count(*) from employeed;

ERROR 1146 (42S02): Table 'employees.employeed' doesn't exist

mysql> select count(*) from employees;

+----------+

| count(*) |

+----------+

|   300024 |

+----------+

1 row in set (0.05 sec)

我们可以看到，只有主键emp_no有索引

实验过程

MySQL5.7官网对Explain各项参数的解释

explain参数5.7版本推荐参考博客

老版本explain推荐参考博客（即新版本默认explain extended）

关于explain参数的拓展链接

MySQL explain key值的解释

使用未优化双参数limit

运行一般情况下的双参数limit并explain：

mysql> select * from employees limit 200000,10;

+--------+------------+------------+------------+--------+------------+

| emp_no | birth_date | first_name | last_name  | gender | hire_date  |

+--------+------------+------------+------------+--------+------------+

| 299976 | 1952-12-08 | Kristian   | Kampfer    | M      | 1994-12-28 |

| 299977 | 1956-09-30 | Zsolt      | Benveniste | M      | 1994-08-15 |

| 299978 | 1956-08-08 | Anneli     | Kitai      | F      | 1994-08-09 |

| 299979 | 1953-03-18 | Satoru     | Kornyak    | F      | 1991-06-16 |

| 299980 | 1953-05-26 | Marsal     | Lovengreen | M      | 1988-05-09 |

| 299981 | 1960-06-22 | Claudi     | Mamelak    | M      | 1986-07-13 |

| 299982 | 1955-06-21 | Juichirou  | Hiraishi   | M      | 1989-12-17 |

| 299983 | 1964-11-19 | Bezalel    | Iacovou    | M      | 1998-02-22 |

| 299984 | 1961-11-03 | Frazer     | Birch      | M      | 1986-12-31 |

| 299985 | 1961-01-04 | Miomir     | Nergos     | F      | 1996-07-07 |

+--------+------------+------------+------------+--------+------------+

10 rows in set (0.06 sec)

mysql> explain select * from employees limit 200000,10;

+----+-------------+-----------+------------+------+---------------+------+---------+------+--------+----------+-------+

| id | select_type | table     | partitions | type | possible_keys | key  | key_len | ref  | rows   | filtered | Extra |

+----+-------------+-----------+------------+------+---------------+------+---------+------+--------+----------+-------+

|  1 | SIMPLE      | employees | NULL       | ALL  | NULL          | NULL | NULL    | NULL | 299468 |   100.00 | NULL  |

+----+-------------+-----------+------------+------+---------------+------+---------+------+--------+----------+-------+

1 row in set, 1 warning (0.00 sec)

我们对explain进行分析：

type为ALL，全表扫描，也就是说没有用索引，因此key和key_len都为NULL
表之间没有引用因此ref为NULL，这里是单表查询
partition为null说明没有使用/访问分区表
扫描了299468行（limit不会过滤null和空值，为什么是这个数据还望看官解答）
这里的filtered指，从存储引擎经过server层过滤后剩下有N%的数据满足查询条件，100%表示未对行进行筛选。
EXTRA额外解释：Using filesort，排序时无法使用到索引时

说明双参数limit就是在排序后一直扫描到偏移量的所指的地方（这里是第100001行），然后读取10行再扔掉前100000行。

子查询优化limit

优化思路：先在子查询中利用“覆盖索引”的方式先找出要选取的第一行数据的主键值，然后再从这里根据主键值选取10条数据

mysql> select * from employees where emp_no >= (select emp_no from employees limit 200000,1) limit 10;

+--------+------------+------------+------------+--------+------------+

| emp_no | birth_date | first_name | last_name  | gender | hire_date  |

+--------+------------+------------+------------+--------+------------+

| 299976 | 1952-12-08 | Kristian   | Kampfer    | M      | 1994-12-28 |

| 299977 | 1956-09-30 | Zsolt      | Benveniste | M      | 1994-08-15 |

| 299978 | 1956-08-08 | Anneli     | Kitai      | F      | 1994-08-09 |

| 299979 | 1953-03-18 | Satoru     | Kornyak    | F      | 1991-06-16 |

| 299980 | 1953-05-26 | Marsal     | Lovengreen | M      | 1988-05-09 |

| 299981 | 1960-06-22 | Claudi     | Mamelak    | M      | 1986-07-13 |

| 299982 | 1955-06-21 | Juichirou  | Hiraishi   | M      | 1989-12-17 |

| 299983 | 1964-11-19 | Bezalel    | Iacovou    | M      | 1998-02-22 |

| 299984 | 1961-11-03 | Frazer     | Birch      | M      | 1986-12-31 |

| 299985 | 1961-01-04 | Miomir     | Nergos     | F      | 1996-07-07 |

+--------+------------+------------+------------+--------+------------+

10 rows in set (0.03 sec)

可以看到，查询速度提高了一倍

mysql> explain select * from employees where emp_no >= (select emp_no from employees limit 200000,1) limit 10;

+----+-------------+-----------+------------+-------+---------------+---------+---------+------+--------+----------+-------------+

| id | select_type | table     | partitions | type  | possible_keys | key     | key_len | ref  | rows   | filtered | Extra       |

+----+-------------+-----------+------------+-------+---------------+---------+---------+------+--------+----------+-------------+

|  1 | PRIMARY     | employees | NULL       | range | PRIMARY       | PRIMARY | 4       | NULL | 149734 |   100.00 | Using where |

|  2 | SUBQUERY    | employees | NULL       | index | NULL          | PRIMARY | 4       | NULL | 299468 |   100.00 | Using index |

+----+-------------+-----------+------------+-------+---------------+---------+---------+------+--------+----------+-------------+

2 rows in set, 1 warning (0.03 sec)

分析explain：

第二行subquery指的是子查询，那么我们先从子查询看起

type为index，说明我们使用了索引树加速查询

key为primary key，说明我们使用了主键索引，子查询直接在主键索引树上进行了查询，避免了回表，减少了磁盘I/O
第一行则是外部的查询

type为range说明是范围查询，然后也使用了主键索引树

而Using index是指，仅使用索引树中的信息从表中检索列信息，而无需执行其他查找即可读取实际行。

小结

对于不需要order by的直接的双参数limit，我们可以借助覆盖索引的方式优化查询效率。

优化order by+limit见此处

最后的补充

仅对于双参数limit的优化，除了子查询外还有以下方法：

倒排表优化法

倒排表法类似建立索引，用一张表来维护页数，然后通过高效的连接得到数据。缺点：只适合数据数固定的情况，数据不能删除，维护页表困难
反向查找优化法

当偏移超过一半记录数的时候，先用排序，这样偏移就反转了

缺点：order by优化比较麻烦，要增加索引，索引影响数据的修改效率，并且要知道总记录数

偏移大于数据的一半

limit偏移算法：

正向查找： (当前页 – 1) * 页长度

反向查找：总记录 – 当前页 * 页长度

有时间在进行实验

MySQL实验子查询优化双参数limit的更多相关文章

Mysql in子查询中加limit报错
Mysql in子查询中加limit报错 select id from aa where id in ( select id from bb limit 10 ); 改写成 SELECT id FRO ...
MySQL实验内连接优化order by+limit 以及添加索引再次改进
MySQL实验内连接优化order by+limit 以及添加索引再次改进在进行子查询优化双参数limit时我萌生了测试更加符合实际生产需要的ORDER BY + LIMIT的想法,或许我们也可以 ...
centos MySQL主从配置 ntsysv chkconfig setup命令配置MySQL 主从子shell MySQL备份 kill命令 pid文件 discuz!论坛数据库读写分离双主搭建 mysql.history 第二十九节课
centos MySQL主从配置 ntsysv chkconfig setup命令配置MySQL 主从子shell MySQL备份 kill命令 pid文件 discuz!论坛数 ...
Mysql单表访问方法，索引合并，多表连接原理，基于规则的优化，子查询优化
参考书籍<mysql是怎样运行的> 非常推荐这本书,通俗易懂,但是没有讲mysql主从等内容书中还讲解了本文没有提到的子查询优化内容, 本文只总结了常见的子查询是如何优化的系列文章目录 ...
【MySQL】MySQL中针对大数据量常用技术_创建索引+缓存配置+分库分表+子查询优化（转载）
原文地址:http://blog.csdn.net/zwan0518/article/details/11972853 目录(?)[-] 一查询优化 1创建索引 2缓存的配置 3slow_query_ ...
mysql数据库sql优化——子查询优化
1.什么是子查询.表关联查询: 子查询:是指在主sql语句中的select或where子句中使用select查询语句:select a.name,(select b.name from b where ...
浅谈MySQL中的查询优化
mysql的性能优化包罗甚广: 索引优化,查询优化,查询缓存,服务器设置优化,操作系统和硬件优化,应用层面优化(web服务器,缓存)等等.这里的记录的优化技巧更适用于开发人员,都是从网络上收集和自己整 ...
聊聊MySQL的子查询
1. 背景在之前介绍MySQL执行计划的博文中已经谈及了一些关于子查询相关的执行计划与优化.本文将重点介绍MySQL中与子查询相关的内容,设计子查询优化策略,包含半连接子查询的优化与非半连接子查询的 ...
postgresql子查询优化(提升子查询)
问题背景在开发项目过程中,客户要求使用gbase8s数据库(基于informix),简单的分页页面响应很慢.排查发现分页sql是先查询出数据在外面套一层后再取多少条,如果去掉嵌套的一层,直接获取则很 ...

随机推荐

Nginx跨域及Https配置
一.跨域 1. 什么是跨域? 跨域:指的是浏览器不能执行其他网站的脚本.它是由浏览器的同源策略造成的,是浏览器对javascript施加的安全限制(指一个域下的文档或脚本试图去请求另一个域下的资源,这 ...
带你轻松了解C# Lock 关键字
相信绝大多数.NET玩家和我一样,常常使用Timer这个对象,而在WPF中使用DispatcherTimer的人也是很多,DispatcherTimer是在UI线程跑的.我们的程序中大多数都会充斥很多 ...
00-04.kaliLinux-手动配置IP地址
在KaliLinux中手动配置网卡用vim打开网卡的配置文件,配置各个网卡信息 root@kali:~# cd /etc/network root@kali:/etc/network# ------ ...
Centos6,Centos7防火墙设置与端口开放的方法
Centos升级到7之后,内置的防火墙已经从iptables变成了firewalld.端口的开启还是要从两种情况来说明的,即iptables和firewalld. 一.iptables 1.打开/关闭 ...
将pycharm中的代码上传到远程Ubuntu中
no bb...下面直接放图开干...^_^
java中的引用类型：强软弱虚
java中的引用类型共4种:强软弱虚,具体每种类型的特点和应用场景.记录下.本文是看了马士兵老师的视频后记录整理的.加深印象. 基本概念 1. 强引用强引用是使用最普遍的引用.如果一个对象具有强引用 ...
Spark原始码系列（五）分布式缓存
问题导读:spark缓存是如何实现的?BlockManager与BlockManagerMaster的关系是什么? 这个persist方法是在RDD里面的,所以我们直接打开RDD这个类. def pe ...
c常用函数-strchr和strrchr
strchr和strrchr strrchr函数用于查找指定字符在一个字符串中最后一次出现的位置,然后返回指向该位置的指针 strchr函数用于查找指定字符在一个字符串中第一次出现的位置,然后返回指向 ...
skfpdb.db、cc3268.dll、system_V2.dat、JI60JS.dat文件内容、发票数据查询
cc3268.dll.skfpdb.db.xxxxx_V2.dat,system.dat,JI60JS.dat,log.dat,system_V2.dat,JI60JS_V2.dat,log_V2.d ...
学习 SQL Server （5）：视图，索引，事务和锁+T_SQL
--=============== 视图的创建 =================. --create view 视图名 as 查询语句--注意:视图查询中的字段不能重名-- 视图中的数据是‘假数据’ ...

MySQL实验 子查询优化双参数limit

MySQL实验 子查询优化双参数limit

实验准备

实验过程

使用未优化双参数limit

子查询优化limit

小结

最后的补充

MySQL实验 子查询优化双参数limit的更多相关文章

随机推荐

热门专题

MySQL实验子查询优化双参数limit

MySQL实验子查询优化双参数limit

MySQL实验子查询优化双参数limit的更多相关文章