[mysql] 随机查询效率比较

select

    primary_count as primaryCount,

    primary_score as primaryScore,

    junior_count as juniorCount,

    junior_score as juniorScore,

    senior_count as seniorCount,

    senoir_score as senoirScore,

    total_score as totalScore,

    pass_score as passScore

from pd_paper p

where p.is_valid = ''

order by RAND() limit 1

分析：

ORDER BY从句里面不能使用RAND()函数，因为这样会导致数据列被多次扫描。

测试发现这样效率非常低。一个15万余条的库，查询5条数据，要8秒以上。

You cannot use a column with RAND() values in an ORDER BY clause, because ORDER BY

would evaluate the column multiple times.

更高效的做法：查询max(id) * rand()来随机获取数据。

SELECT *

FROM `table` AS t1

JOIN (

    SELECT ROUND(RAND()

    * (SELECT MAX(id) FROM `table`)) AS id

) AS t2

WHERE t1.id >= t2.id

ORDER BY t1.id ASC LIMIT 5;

但是这样会产生连续的5条记录。解决办法只能是每次查询一条，查询5次。

即便如此也值得，因为15万条的表，查询只需要0.01秒不到。

采用join 语法  可以实现真正的随机。

SELECT *

FROM `table`

WHERE id >= (SELECT FLOOR( MAX(id) * RAND()) FROM `table` )

ORDER BY id LIMIT 1;

把语句完善一下，加上MIN(id)的判断。

如果没有加上MIN(id)的判断，结果有一半的时间总是查询到表中的前面几行。

完整的语句：

①  where 子句

SELECT * FROM `table`

WHERE id >= (SELECT floor( RAND() * ((SELECT MAX(id) FROM `table`)-

 (SELECT MIN(id) FROM `table`)) + (SELECT MIN(id) FROM `table`)))

ORDER BY id LIMIT 1;

② join

SELECT *

FROM `table` AS t1

JOIN (

    SELECT ROUND(RAND()

    * ((SELECT MAX(id) FROM `table`)-(SELECT MIN(id) FROM `table`))

    +(SELECT MIN(id) FROM `table`)) AS id) AS t2

WHERE t1.id >= t2.id

ORDER BY t1.id LIMIT 1;

#随机查询一套考卷定义

SELECT

    p.primary_count as primaryCount,

    p.primary_score as primaryScore,

    p.junior_count as juniorCount,

    p.junior_score as juniorScore,

    p.senior_count as seniorCount,

    p.senoir_score as senoirScore,

    p.total_score   as totalScore,

    p.pass_score as passScore   

FROM

    pd_paper AS p

JOIN

(

    SELECT ROUND(

        RAND()

        *((SELECT MAX(id) FROM pd_paper)-(SELECT MIN(id) FROM pd_paper))

        +(SELECT MIN(id) FROM pd_paper)

    ) AS id

)

    AS p2

WHERE p.id >= p2.id

ORDER BY p.id LIMIT 1;

最后在程序对这两个语句进行分别查询10次，

前者花费时间 0.147433 秒

后者花费时间 0.015130 秒

看来采用JOIN的语法比直接在WHERE中使用函数效率还要高很多。

附加一个复杂sql：按题目类型（三种）随机查询全部考题信息

SELECT * from (

    select

        p.id as id,

        p.title as title,

        p.question as question,

        p.answer as answer,

        p.crt_time as crtTime

    from

        pd_problem p

    join

        (SELECT ROUND(RAND()

            * ((SELECT MAX(pp.id) FROM pd_problem pp)-(SELECT MIN(pp.id) FROM pd_problem pp))

            +(SELECT MIN(pp.id) FROM pd_problem pp)) AS pid) AS p2

    where p.id >= p2.pid

    and p.is_valid = ''

    and p.paper_type = ''

    and p.paper_class = ''

    order by p.id limit 5

 ) as t1

 union all

 SELECT * from (

    select

        p.id as id,

        p.title as title,

        p.question as question,

        p.answer as answer,

        p.crt_time as crtTime

    from

        pd_problem p

    join

        (SELECT ROUND(RAND()

            * ((SELECT MAX(pp.id) FROM pd_problem pp)-(SELECT MIN(pp.id) FROM pd_problem pp))

            +(SELECT MIN(pp.id) FROM pd_problem pp)) AS pid) AS p2

    where p.id >= p2.pid

    and p.is_valid = ''

    and p.paper_type = ''

    and p.paper_class = ''

    order by p.id limit 5

 ) as t2

 union all

 SELECT * from (

    select

        p.id as id,

        p.title as title,

        p.question as question,

        p.answer as answer,

        p.crt_time as crtTime

    from

        pd_problem p

    join

        (SELECT ROUND(RAND()

            * ((SELECT MAX(pp.id) FROM pd_problem pp)-(SELECT MIN(pp.id) FROM pd_problem pp))

            +(SELECT MIN(pp.id) FROM pd_problem pp)) AS pid) AS p2

    where p.id >= p2.pid

    and p.is_valid = ''

    and p.paper_type = ''

    and p.paper_class = ''

    order by p.id limit 5

 ) as t3

[mysql] 随机查询效率比较的更多相关文章

分享：mysql 随机查询数据
在mysql中查询5条不重复的数据,使用以下: 1 SELECT * FROM `table` ORDER BY RAND() LIMIT 5 就可以了.但是真正测试一下才发现这样效率非常低.一个1 ...
提高MySQL数据库查询效率的几个技巧（转载）
[size=5][color=Red]提高MySQL数据库查询效率的几个技巧(转)[/color][/size] MySQL由于它本身的小巧和操作的高效, 在数据库应用中越来越多的被采用.我 ...
如何实现MySQL随机查询数据与MySQL随机更新数据？
以下的文章主要介绍的是MySQL随机选取数据,对实现MySQ随机查询数据与MySQ随机更新数据的实际操作步骤的描述,以及对其实际操作中所要用到的语句的描述,以下就是对其具体操作步骤的描述. MySQL ...
mysql随机查询记录的高效率方法
mysql使用rand随机查询记录的高效率方法一直以为mysql随机查询几条数据,就用 SELECT * FROM `table` ORDER BY RAND() LIMIT 5 就可以了. 但是真 ...
mysql随机查询符合条件的几条记录
随机查询,方法可以有很多种.比如,查询出所有记录,然后随机从列表中取n条记录.使用程序便可实现.可是程序实现必须查询出所有符合条件的记录(至少是所有符合条件的记录id),然后再随机取出n个id,查询数 ...
mysql 随机查询记录集
有时候需求需要随机从数据库查询若干条记录集,网上搜了一下,几篇博文都是些重复的.....不知道他们谁抄的谁的,这里除了介绍提供一种笔者自己想到的方法,本质都是利用mysql 的rand() 第一种方法 ...
如何提高Mysql的查询效率？？？
1.对查询进行优化,应尽量避免全表扫描,首先应考虑在 where 及 order by 涉及的列上建立索引. 2.应尽量避免在 where 子句中对字段进行 null 值判断,否则将导致引擎放弃使用索 ...
Mysql 随机查询10条数据效率最快的查询方法
1)使用join 和 rand() 耗时 0.009 SELECT * FROM `t_topic` AS t1 JOIN ( SELECT ROUND( RAND() * ( (SELECT MAX ...
mysql随机查询若干条数据
条不重复的数据,使用以下: 秒以上搜索Google,网上基本上都是查询max(id) * rand()来随机获取数据. SELECT * FROM `table` AS t1 JOIN (SELE ...

随机推荐

Win8.1设置ftp服务器并设定用户操作权限的详细教程
http://wenku.baidu.com/link?url=VTDLnDa_yfQN9OldjVnYsOBf7UdIj76QjaLDyHP-I0A6iFEfzB8EyBf9uztwm2JDXlFL ...
Python 字典 copy()方法
描述 Python 字典 copy() 方法返回一个字典的浅拷贝(父不变,子变). 语法 copy() 方法语法: D.copy() 参数无. 返回值返回一个字典的浅拷贝(父不变,子变). 实例 ...
python 中 with 用法
前言 with 语句适用于对资源进行访问的场合,确保不管使用过程中是否发生异常都会执行必要的“清理”操作,释放资源, 比如文件使用后自动关闭/线程中锁的自动获取和释放等. 问题引出如下代码: fil ...
python标准库介绍——28 sha 模块详解
==sha 模块== ``sha`` 模块提供了计算信息摘要(密文)的另种方法, 如 [Example 2-39 #eg-2-39] 所示. 它与 ``md5`` 模块类似, 但生成的是 160 位签 ...
django post和get 比较
当我们提交表单仅仅需要获取数据时就可以用GET: 而当我们提交表单时需要更改服务器数据的状态,或者说发送e-mail,或者其他不仅仅是获取并显示数据的时候就使用POST. 在这个搜索书籍的例子里,我们 ...
Spring依赖注入的Setter注入（通过get和set方法注入）
Spring依赖注入的Setter注入(通过get和set方法注入) 导入必要的jar包(Spring.jar和commonslogging.jar) 在src目录下建立applicationCont ...
unity physics joint
除了unity文档(有点儿过于简略)之外,可以参考一下PhysX文档: http://docs.nvidia.com/gameworks/content/gameworkslibrary/physx/ ...
PHP二维数组如何根据某个字段排序
分享下PHP二维数组如何根据某个字段排序的方法. 从两个不同的表中获取各自的4条数据,然后整合(array_merge)成一个数组,再根据数据的创建时间降序排序取前4条. 本文记录的要实现的功能类似于 ...
Javascript玩转继承(一)
Javascript究竟是一门面向对象的语言,还是一门支持对象的语言,我想每个人都有着自己的看法.那些Javascript忠实的Fans一定讲Javascript是一门面向对象的语言,像<Jav ...
linux系统下添加新硬盘的方法详解
对于linux新手来说,在linux上添加新硬盘,是很有挑战性的一项工作. 在Linux服务器上把硬盘接好,启动linux,以root登陆. fdisk -l ## 这里是查看目前系统上有几块硬盘 D ...

[mysql] 随机查询 效率比较

[mysql] 随机查询 效率比较的更多相关文章

随机推荐

热门专题

[mysql] 随机查询效率比较

[mysql] 随机查询效率比较的更多相关文章