一个有趣的 SQL 查询

来源：站长资讯

一个朋友有这样一个SQL查询需求：
有一个登录表(tmp_test)，包含用户ID(uid)和登录时间(login_time)。表结构如下：
*************************** 1. row ***************************
Field: uid
Type: int(10) unsigned
Null: NO
Key: MUL
Default: NULL
Extra:
*************************** 2. row ***************************
Field: login_time
Type: timestamp
Null: NO
Key: MUL
Default: 0000-00-00 00:00:00
Extra:
问如何查询出所有在某一段时间内（如：2012-1-1至2012-1-17)连续7天都有登录的用户。

在写这个SQL时，发现一些很有意思东西，也许对大家写SQL有帮助，因此记录一下。

- 基本思路 Loop Join
首先想到的思路是一个类似于Loop Join的方法：
A. 取出2012-1-1到2012-1-11的每一条记录.
B. 对取出的每一条记录，再去表中查询这个用户的接下来6天的记录。
如果总数为6条记录，则满足连续7天的条件

- Range Join
Loop Join的思路可以通过一个Join语句来实现。姑且称之为Range Join。通常join时，使用的都是
等值join. 如果join列的值是唯一的，那么就是左表的一条记录对应右表的一条记录。而Range Join
中，左表的一行数据对应右表的一个范围内的所有记录。

SQL 语句为：

  SELECT DISTINCT t.uid FROM tmp_test AS t JOIN tmp_test AS t1

  ON date(t.login_time) + 1 <= date(t1.login_time) AND

     date(t.login_time) + 7 > date(t1.login_time) AND

     t.uid = t1.uid

  WHERE t.login_time BETWEEN ’2012-1-1 00:00:00′ AND ’2012-1-11 23:59:59′ AND

        t1.login_time >= ’2012-1-2′ AND t.login_time < ’2012-1-18′(可去掉）

- COUNT(DISTINCT)
“计算连续7天”,可以通过GROUP BY分组和COUNT()来完成。因为一个用户在1天内可能会有多次登录，
这里需要使用(COUNT DISTINCT）. SQL 语句为：

  GROUP BY t.login_time, t.uid

  HAVING COUNT(DISTINCT date(t1.login_time))=6

- BIT_OR
考虑到DISTINCT操作需要缓存数据，就想到了用bit逻辑运算（可能会效率高一些)。因为连续的七天
与第一天的差分别为，1,2,3,4,5,6,7.可以分别用1-7bit位来表示。根据这个特点，可以对分组中
的每一行进行或(|)运算.如果最后的值等于b’1111110′(6个1）.那么就是连续的7天。这个办法可以
避免DISTINC操作。没想到MySQL中真的有了bit操作的聚合函数。BIT_OR就是我们要用的。

SQL 语句为：

GROUP BY t.login_time, t.uid

  HAVING BIT_OR(1 << datediff(t1.login_time, t.login_time)) = b’1111110′;

NOTE: 从测试结果看，没有索引时BIT_OR要比DISTINCT好一点点，不是非常明显。当DISTINCT的
字段上有索引时，要比BIT_OR要好一点点.

- 去掉Range Join
虽说上面的思路实现了这个查询要求，但是由于使用了Range Join,效率并不好。在对uid建索引的情
况下，大约需要3.5s(总共约50000条记录). 有没有更好的方法呢？
受BIT_OR的启发，可以通过单表扫描，用bit位来记录每个用户2012-1-1至2012-1-17是否有登录。
然后根据这个值来判断是否有连续7天的情况。

我们需要一个辅助的函数来进行bit的运算：

DELIMITER |

  /* 判断一个Bit序列中，是否存在若干个连续的1 */

  /* 参数bits: bit序列*/

  /* 参数trait: 指定的若干连续的1.如b’111111‘ */

  CREATE FUNCTION bits_find_N1(bits BIGINT, trait BIGINT)

  RETURNS BOOL

  BEGIN

    WHILE bits <> 0 DO

      IF ((bits & trait) = trait) THEN

        RETURN TRUE;

      END IF;

      SET bits = bits >> 1;

    END WHILE;

    RETURN FALSE;

  END|

  DELIMITER ;

SQL 语句为：

SELECT uid AS bit FROM tmp_test

  WHERE login_time BETWEEN ’2012-1-1 00:00:00′ AND ’2012-1-17 23:59:59′

  GROUP BY uid

  HAVING bits_find_N1(BIT_OR(1 << datediff(login_time, ’2012-1-1′)),

                             b’1111111′) IS TRUE;

这个语句效率还是比较好的，即使不对uid建索引，也只需约0.27s

- 超高效率的语句
下面是另一个朋友写的SQL，虽然有点复杂，但是效率超高，只需要约0.17s是这样的

  SET @wy=0;

  SELECT DISTINCT uid

  FROM (SELECT MAX(date)-MIN(date) less,uid

        FROM (SELECT date-rn diff, uid, date, rn

              FROM (SELECT @wy:=@wy+1 rn, uid,

                           datediff(login_time,’1971-01-01′) date,login_time

                    FROM (SELECT date(login_time) login_time, uid FROM tmp_test

                          WHERE login_time>=’2012-01-01 00:00:00′ AND

                                login_time <’2012-01-18 00:00:00′

                          GROUP BY uid, date(login_time)

                          ORDER BY uid, date(login_time)

                         )x

                   )x

             )x

         GROUP BY diff,uid

        )x

  WHERE less>=6;

一个有趣的 SQL 查询的更多相关文章

一个有趣的 SQL 查询(查询7天连续登陆)
一个有趣的 SQL 查询一个朋友有这样一个SQL查询需求: 有一个登录表(tmp_test),包含用户ID(uid)和登录时间(login_time).表结构如下: . row ********** ...
一个有趣的SQL Server 层级汇总数据问题
看SQL Server大V宋大侠的博客文章,发现了一个有趣的sql server层级汇总数据问题. 具体的问题如下: parent_id emp_id emp_nam ...
MyBatis是一个支持普通SQL查询，存储过程和高级映射的优秀持久层框架
MyBatis是一个支持普通SQL查询,存储过程和高级映射的优秀持久层框架.MyBatis消除了几乎所有的JDBC代码和参数的手工设置以及对结果集的检索封装.MyBatis可以使用简单的XML或注解用 ...
记一个简单的sql查询
在我们做各类统计和各类报表的时候,会有各种各样的查询要求.条件这篇主要记录一个常见的统计查询要求如下: 统计一段时间内,每天注册人数,如果某天没有人注册则显示为0 现在建个简单的表来试试建表语句 ...
Android adb使用sqlite3对一个数据库进行sql查询
sqlite是Android下集成的一个轻量级数据库,我们可以通过adb程序进入数据库命令行,对数据进行查询,具体操作如下: ①打开windows的cmd ②输入adb shell.此时进入了该安卓系 ...
EJB3Persistence开发手册-原生SQL查询(NativeSQL)
EJB3 QL对原生SQL做了非常好的支持.采用原生SQL做查询结果不但可以是象SQL中的返回列值,也可以是Entity类,甚至可以是两者的混合. EJB3 EntityManager接口定义了多个原 ...
黄聪：实用WordPress SQL查询方法
为所有文章和页面添加自定义字段这段代码可以为WordPress数据库内所有文章和页面添加一个自定义字段. 你需要做的就是把代码中的‘UniversalCutomField‘替换成你需要的文字,然后把 ...
在Delphi中动态地使用SQL查询语句 Adoquery sql 参数冒号
在Delphi中动态地使用SQL查询语句在一般的数据库管理系统中,通常都需要应用SQL查询语句来提高程序的动态特性.下面介绍如何在Delphi中实现这种功能.在Delphi中,使用SQL查询语句的途 ...
spring MVC +freemarker + easyui 实现sql查询和执行小工具总结
项目中,有时候线下不能方便的连接项目中的数据源时刻,大部分的问题定位和处理都会存在难度,有时候,一个小工具就能实时的查询和执行当前对应的数据源的库.下面,就本人在项目中实际开发使用的小工具,实时的介绍 ...

随机推荐

【leetcode算法-简单】58. 最后一个单词的长度
[题目描述] 给定一个仅包含大小写字母和空格 ' ' 的字符串,返回其最后一个单词的长度. 如果不存在最后一个单词,请返回 0 . 说明:一个单词是指由字母组成,但不包含任何空格的字符串. 示例: 输 ...
clog就用clog的后缀名
/tmp/log/shuanggou.clog /tmp/log/shuanggou.log /tmp/log/shuanggou_success.log /tmp/log/shuanggou_err ...
PCL学习（五）如何在mesh模型上sample更多点及三维物体姿态估计
---恢复内容开始--- 最近在做关于物体姿态估计的项目基本思路就是我们在估计物体的pose的时候,需要用分割得到的点云与模型库中的模型做匹配 1.通过基于RANSANC的SAC-IA将点云和模型 ...
[转帖]redis知识点总结
redis面试常问知识点总结 https://www.toutiao.com/i6740199554127233543/ 原创波波说运维 2019-10-02 00:01:00 概述今天主要分享一 ...
linux shell中的EOF
关键词:EOF 在平时的运维工作中,我们经常会碰到这样一个场景:执行脚本的时候,需要往一个文件里自动输入N行内容.如果是少数的几行内容,还可以用echo追加方式,但如果是很多行,那么单纯用echo追加 ...
VC++单文档程序固定菜单栏和工具栏
MainFrm.cpp框架类下,找到OnCreate方法 m_wndMenuBar.EnableDocking(CBRS_ALIGN_ANY); m_wndToolBar.EnableDocking( ...
C++实现16进制字符串转换成int整形值
开发中经常需要把16进制字符串转换成整形,写了个个代码供大家参考下: #include <stdio.h> #include <string.h> //字符转换成整形 int ...
剑指offer36：两个链表的第一个公共结点
1 题目描述输入两个链表,找出它们的第一个公共结点. 2 思路和方法方法一: 用两个指针同时从两个链表的表头开始走,当走到自己的链表结尾的时候开始从另一个链表的表头开始向后走.终止条件就是两个指针 ...
WUSTOJ 1239: n皇后问题（Java）
题目链接:
go hello world第一个程序
main 函数所在的包名必须使用main import "fmt" 导入包fmt fmt包包含了Println方法的定义 func main() 程序运行入口方法和c语言相似 ...

一个有趣的 SQL 查询

一个有趣的 SQL 查询的更多相关文章

随机推荐

热门专题