Mysql大范围分页优化案例

在BBS线上业务抓到如下分页SQL：

142597301   meizu_bbs   192.168.17.72:39096 meizu_bbs   Query   217 Sending data    SELECT * FROM pre_forum_thread  WHERE fid=22 AND displayorder>=0 ORDER BY lastpost DESC  LIMIT 1933100, 50

142597338   meizu_bbs   192.168.17.72:39128 meizu_bbs   Query   216 Sending data    SELECT * FROM pre_forum_thread  WHERE fid=22 AND displayorder>=0 ORDER BY lastpost DESC  LIMIT 1933100, 50

142604367   nagiosuser  127.0.0.1:39893 NULL    Query   0   NULL    show full processlist

这个SQL一共有3个问题：

1：select * 这种写法不符合SQL编写规范，任何时候都不要用*来代替具体的列名称，需要什么列就取什么列。如果表里有个text/blob等大字段，影响就更加明显。

2：pre_forum_thread 表在tid字段做了分区，但是查询里面没有用到分区字段，这样就需要扫描全部分区，性能比不分区更差。

3：在这个分页SQL里，偏移量高到193万。

LIMIT语法：

[LIMIT {[offset,] row_count | row_count OFFSET offset}]

MYSQL是处理LIMIT语句的方式是：取出全部offset+rowcount,然后丢弃掉前面所有行，只返回row_count行。

在这个案例里，在mysql server端需要查询的行数为1933100+50，217S还未得出结果。

优化方案：最终需要的只是50行记录，如果先取出这50行记录的主键ID，这样是不是会很快？执行计划和执行时间：

mysql> explain partitions SELECT tid FROM pre_forum_thread  WHERE fid=22 AND displayorder>=0 ORDER BY lastpost DESC  LIMIT 1933100, 50;

+----+-------------+------------------+-----------------------------------------------------------------------------------------------------------+-------+-------------------------------------------------------------------------------+--------------+---------+------+---------+------------------------------------------+

| id | select_type | table            | partitions                                                                                                | type  | possible_keys                                                                 | key          | key_len | ref  | rows    | Extra                                    |

+----+-------------+------------------+-----------------------------------------------------------------------------------------------------------+-------+-------------------------------------------------------------------------------+--------------+---------+------+---------+------------------------------------------+

|  1 | SIMPLE      | pre_forum_thread | p0,p1,p2,p3,p4,p5,p6,p7,p8,p9,p10,p11,p12,p13,p14,p15,p16,p17,p18,p19,p20,p21,p22,p23,p24,p25,p26,p27,p28 | range | displayorder,rate,lastpost,fd,fdd,idx_fid_displayorder_heats,idx_displayorder | displayorder | 4       | NULL | 2673718 | Using where; Using index; Using filesort |

+----+-------------+------------------+-----------------------------------------------------------------------------------------------------------+-------+-------------------------------------------------------------------------------+--------------+---------+------+---------+------------------------------------------+

1 row in set (0.00 sec)

mysql> SELECT sql_no_cache tid FROM pre_forum_thread  WHERE fid=22 AND displayorder>=0 ORDER BY lastpost DESC  LIMIT 1933100, 50;

+--------+

| tid    |

+--------+

| 795442 |

.........

| 795387 |

| 795168 |

+--------+

50 rows in set (1.02 sec)

分析一下为什么只取出PK值会很快。在INNODB索引树里面，每个二级索引的叶子节点都会保存一份PK值，通过二级索引查找数据的过程是：从索引树的根节点开始比较索引值是否和查询值匹配，如果不匹配，根据情况进入左或右分支，再比较，直到在找到符合要求的节点，然后从叶节点里取出PK值，再回表根据主键得到全部数据。如果只是查找主键，那么就少了”然后从叶节点里取出PK值，再回表根据主键得到全部数据“这一部分，而这一部分正是最耗时的。在执行计划里可以看到”Using index“，这就说明优化器使用了”覆盖索引“，只需要扫描索引数据就可以得到最终数据，索引一般情况下比数据要小，往往常驻内存，所以虽然偏移量193万，也能给在1.02秒内返回结果。

得到这50个主键ID值之后，用这50条记录再关联原表查询：

mysql> explain select sql_no_cache * from pre_forum_thread A inner join (SELECT tid FROM pre_forum_thread  WHERE fid=22 AND displayorder>=0 ORDER BY lastpost DESC  LIMIT 1933100, 50) B on A.tid=B.tid;

+----+-------------+------------------+--------+-------------------------------------------------------------------------------+---------+---------+-------+---------+----------------+

| id | select_type | table            | type   | possible_keys                                                                 | key     | key_len | ref   | rows    | Extra          |

+----+-------------+------------------+--------+-------------------------------------------------------------------------------+---------+---------+-------+---------+----------------+

|  1 | PRIMARY     | <derived2>       | ALL    | NULL                                                                          | NULL    | NULL    | NULL  |      50 |                |

|  1 | PRIMARY     | A                | eq_ref | PRIMARY                                                                       | PRIMARY | 4       | B.tid |       1 |                |

|  2 | DERIVED     | pre_forum_thread | ALL    | displayorder,rate,lastpost,fd,fdd,idx_fid_displayorder_heats,idx_displayorder | NULL    | NULL    | NULL  | 3307262 | Using filesort |

+----+-------------+------------------+--------+-------------------------------------------------------------------------------+---------+---------+-------+---------+----------------+

3 rows in set (1.03 sec)

#执行时间

50 rows in set (1.06 sec)

处理分页的方法有很多种，在业务层面可以限制翻页的起始位置，不允许直接定位到10000页。在数据库查询方面也有别的方法来处理，根据相应的业务需要寻找最佳的处理方法。本案例里的 LIMIT 1933100, 50 需要规避。

Mysql大范围分页优化案例的更多相关文章

mysql 大数据分页优化
一.mysql大数据量使用limit分页,随着页码的增大,查询效率越低下. 1. 直接用limit start, count分页语句, 也是我程序中用的方法: select * from prod ...
MySQL 百万级分页优化
MySQL 百万级分页优化 http://www.jb51.net/article/31868.htm 一般刚开始学SQL的时候,会这样写 : , ; 但在数据达到百万级的时候,这样写会慢死 : , ...
mysql大内存高性能优化方案
mysql优化是一个相对来说比较重要的事情了,特别像对mysql读写比较多的网站就显得非常重要了,下面我们来介绍mysql大内存高性能优化方案 8G内存下MySQL的优化按照下面的设置试试看:key ...
MySQL大数据分页的优化思路和索引延迟关联
之前上次在部门的分享会上,听了关于MySQL大数据的分页,即怎样使用limit offset,N来进行大数据的分页,现在做一个记录: 首先我们知道,limit offset,N的时候,MySQL的查询 ...
MySql大表分页(附独门秘技)
问题背景 MySql(InnoDB)中的订单表需要按时间顺序分页查询,且主键不是时间维度递增,订单表在百万以上规模,此时如何高效地实现该需求? 注:本文并非主要讲解如何建立索引,以下的分析均建立在有合 ...
mysql百万级分页优化
普通分页数据分页在网页中十分多见,分页一般都是limit start,offset,然后根据页码page计算start , 这种分页在几十万的时候分页效率就会比较低了,MySQL需要从头开始一直往后 ...
Mysql大数据表优化处理
原文链接: https://segmentfault.com/a/1190000006158186 当MySQL单表记录数过大时,增删改查性能都会急剧下降,可以参考以下步骤来优化: 单表优化除非单表 ...
MySQL 百万级分页优化(Mysql千万级快速分页)（转）
http://www.jb51.net/article/31868.htm 以下分享一点我的经验一般刚开始学SQL的时候,会这样写复制代码代码如下: SELECT * FROM table OR ...
MySQL 百万级分页优化(Mysql千万级快速分页)
以下分享一点我的经验一般刚开始学SQL的时候,会这样写 : SELECT * FROM table ORDER BY id LIMIT 1000, 10; 但在数据达到百万级的时候,这样写会慢死 : ...

随机推荐

shader forge卡通渲染！
自从用了shader forge,妈妈我再也不写shader了...... 写了3种,分别用的顶点法线.法线贴图.顶点法线+法线贴图,然后还有自发光和受光两种模式,那就是6种了吧... 最后来一张sh ...
BZOJ 4204 && BZOJ 2510 循环矩阵
n^3logn非常显然.所以要用一种因为这个矩阵是一个循环矩阵,所以只要知道第一行就可以知道所有行了. C[i][j]=C[i-1][j-1]; #include <iostream> # ...
BZOJ 1040 树形DP+环套树
就是有n个点n条边,那么有且只有一个环那么用Dfs把在环上的两个点找到.然后拆开,从这条个点分别作树形Dp即可. #include <cstdio> #include <cstrin ...
demo和实际项目的距离
回家的路上想到一个很形象的类比,关于学生时期的实验(以及一些简单的demo)和实际工作项目的差别. 实现了同样的功能,比如要制作一把椅子,如果是简单的demo,那么就如同是给你了一个单独的房间,里面已 ...
ubuntu环境下使用apt-get配置apache+php+mysql
主要步骤:1,安装apachesudo apt-get install apache2sudo /etc/init.d/apache2 restart2,安装phpsudo apt-get insta ...
完成Matrix丶Kingdom PPT后的感想
这次Presentation是我在这节课的第一次上台演讲,让我感悟良多. 具体对我的PPT有兴趣的朋友可以call我,我会共享给大家. 这次老师布置的任务对我而言很有意义.首先,我作为最后一组,我欣赏 ...
WEP算法的安全性
翻译自http://www.isaac.cs.berkeley.edu/isaac/wep-faq.html WEP算法的安全性这篇文章讲述了我们对有线等效加密协议(WEP, 802.11标准的一部 ...
Git Windows客户端保存用户名与密码
1. 在Windows中添加一个HOME环境变量,值为%USERPROFILE%,如下图: 2. 在“开始>运行”中打开%Home%,新建一个名为“_netrc”的文件. 3. 用记事本打开_n ...
web前端的学习.
web前端的了解 1.前端技术包括JavaScript.ActionScript.CSS.xHTML等“传统”技术与Adobe AIR.Google Gears,以及概念性较强的交互式设计,艺术性较强 ...
《java编程思想》读书笔记暂停一段时间，改为上面的练习题
发现个很尴尬的现象.我一天实在看得太快了...全写下写博客都得一晚上.. 之前因为是第一次看这么厚的书,别人都说很难,以为会看很慢的.然而,已经完全学过Java的我感觉没啥压力,越看越快....第 ...

Mysql大范围分页优化案例

Mysql大范围分页优化案例的更多相关文章

随机推荐

热门专题