TSQL--查找连续登陆用户

--==========================================

需求：有一个用户登陆日志表，记录用户每次登陆时间，然后想查找用户按天连续登陆的情况，找出每次连续登陆的最早时间和最后时间以及连续登陆天数。

--===========================================

由于长久未写此类SQL,有点手生，本着走一步算一步的精神，慢慢来。

首先查看日志表

SELECT [Uid]

      ,[loginDate]

  FROM [dbo].[Member_LoginLog]

  WHERE [UID]=268

由于按天计算连续登陆，表中时间精确到毫秒，很难肉眼看出数据是否连续，于是考虑转换数据

而又由于我们只关心最早登陆时间和最后登陆时间，因此我们可以先按照天来统计用户最早登陆时间和最后登陆时间，并将时间转换成对应天数

--==============================================

--统计出用户每天最早登陆时间和最后登陆时间

SELECT T1.[UID]

,DATEDIFF(DAY,'2014-01-01',LoginDate) AS DiffDays

,MAX(LoginDate) AS MaxLoginDate

,MIN(LoginDate) AS MinLoginDate

INTO [dbo].[Member_LoginLog_Status1]

FROM [dbo].[Member_LoginLog] T1

GROUP BY T1.[UID],DATEDIFF(DAY,'2014-01-01',LoginDate)

--======================================

--查看效果

SELECT [UID]

,[DiffDays]

,[MaxLoginDate]

,[MinLoginDate]

FROM [dbo].[Member_LoginLog_Status1]

WHERE UID=268

从上图很容易看出第二天没连续登陆，是不是很容易看啊

接下来就是查找联系的天数了，如果我们按照UID分组，然后对DiffDays来排序求出排名来，依据DiffDays的增长量和RID量便可以判断出天数是否连续

SELECT

ROW_NUMBER()OVER(PARTITION BY UID ORDER BY [DiffDays] ASC) AS RID,

T1.*

FROM [dbo].[Member_LoginLog_Status1] T1

WHERE [UID]=268

这样我们便可以使用表的自连接来查找连续的登录，由于需要按照用户和天数来算出排名，因此我们可以先建立索引

CREATE CLUSTERED INDEX CIX_UID_Days ON

[dbo].[Member_LoginLog_Status1]

(

    [UID],[DiffDays]

)

然后再求连续区间：

--==========================================

--查找连续的登录

;WITH Tem AS(

SELECT

ROW_NUMBER()OVER(PARTITION BY UID ORDER BY [DiffDays] ASC) AS RID,

T1.*

FROM [dbo].[Member_LoginLog_Status1] T1

)

,Tem1 AS(

SELECT ROW_NUMBER()OVER(

    PARTITION BY T1.[UID],T1.[DiffDays]

    ORDER BY T2.[diffdays]-T1.[diffdays] DESC) AS RID,

T1.[UID],

T1.MinLoginDate,

T2.MaxLoginDate,

T1.[diffdays] AS MinDiffDays,

T2.[diffdays] AS MAXDiffDays

FROM Tem AS T1

INNER JOIN Tem AS T2

ON T1.UID=T2.UID

AND T1.[diffdays]<=T2.[diffdays]

AND T2.[diffdays]-T1.[diffdays]= T2.RID-T1.RID

)

SELECT

[UID],

MinLoginDate,

MaxLoginDate,

MinDiffDays,

MAXDiffDays

INTO [dbo].[Member_LoginLog_Status2]

FROM Tem1 AS T1

WHERE T1.RID=1

--=========================================

--检查结果

SELECT [UID]

,[MinLoginDate]

,[MaxLoginDate]

,[MinDiffDays]

,[MAXDiffDays]

FROM [dbo].[Member_LoginLog_Status2]

WHERE [UID]=268

找出连续的区间后，我们会发现有很多区间不是最大连续区间，如第5天到第17天连续，但是比之更大的区间还有第3天到第17天，对于这种问题，解决办法就是依据maxDiffDays分组，求出最小的minDiffDays

由于此时要按照用户和maxDiffDays分组，然后按照MinDiffDays排序求最小值，因此先建立索引

CREATE CLUSTERED INDEX CIX_UID_MAXDiffDays

ON [AccMain_101].[dbo].[Member_LoginLog_Status2]

([UID],MAXDiffDays,MinDiffDays ASC)

然后再查询：

--====================================

--求出最大连续区间

;WITH CTE1 AS(

SELECT

ROW_NUMBER()OVER(PARTITION BY [UID],MAXDiffDays ORDER BY MinDiffDays ASC) AS RID,

[UID],

MinLoginDate,

MaxLoginDate,

MinDiffDays,

MAXDiffDays

FROM [AccMain_101].[dbo].[Member_LoginLog_Status2] AS T1

)

INSERT INTO [dbo].[Member_LoginLog_Status3]

           ([Uid]

           ,[firstLoginDate]

           ,[lastLoginDate]

           ,[loginNumber])

SELECT [UID],

MinLoginDate,

MaxLoginDate,

T1.MAXDiffDays-MinDiffDays AS ContinueDays

FROM CTE1 T1

WHERE T1.RID=1

--==================================

--查看结果

SELECT  [Uid]

      ,[firstLoginDate]

      ,[lastLoginDate]

      ,[loginNumber]

  FROM [dbo].[Member_LoginLog_Status3]

  WHERE [UID]=268

查询结果：

结果正是我们想要的，因此打完收工，回家吃饭。

--===============================================

总结：其实查找连续或查找孤岛这类原理，都是利用自连接然后看增长是否连续，多折腾几遍就好。

--===============================================

在wwwwgou的回复中，指出一条更快捷的计算方式，同样使用排名来计算，但不使用关联，而是计算排名与登陆天数的差值，如果登陆天数连续增长，则排名也连续增长，两者的差值保持不变；如果登陆天数不连续，则登陆天数增长的值就会比排名增长的值高，这时两者的差值就会变大。

如下图：

随着天数不连续的次数增加，[天数-排名]的值会不断增大，因此可以使用[天数-排名]来分组，便可以定位到连续区间。

PS: 不会出现两个不同连续区间的[天数-排名]值一样的情况

查找代码：

--========================================

--感谢wwwwgou提供，

--此代码已略做修改

SELECT

[Uid],

mindt = MIN(mindt),

maxdt = MAX(maxdt),

logdays = COUNT(*)

FROM

(

SELECT

[Uid],

RowNo = ROW_NUMBER()

OVER(PARTITION BY [Uid]

ORDER BY DATEDIFF(DAY,'2014-01-01', loginDate)),

DiffDay = DATEDIFF(DAY,'2014-01-01', loginDate),

mindt = MIN(loginDate),

maxdt = MAX(loginDate)

FROM dbo.Member_LoginLog

GROUP BY [Uid], DATEDIFF(DAY,'2014-01-01', loginDate)

) T

GROUP BY [Uid], [RowNo] - DiffDay

ORDER BY [Uid], minDt

对wwwwgou筒子再次表示婶婶地感谢。

--===============================================

请原谅我苍白的讲解，让您们只能看代码。

妹子骚猴就上，不要着急。

TSQL--查找连续登陆用户的更多相关文章

大数据学习day25------spark08-----1. 读取数据库的形式创建DataFrame 2. Parquet格式的数据源 3. Orc格式的数据源 4.spark_sql整合hive 5.在IDEA中编写spark程序（用来操作hive） 6. SQL风格和DSL风格以及RDD的形式计算连续登陆三天的用户
1. 读取数据库的形式创建DataFrame DataFrameFromJDBC object DataFrameFromJDBC { def main(args: Array[String]): U ...
Redis简单案例(三) 连续登陆活动的简单实现
连续登陆活动,或许大家都不会陌生,简单理解就是用户连续登陆了多少天之后,系统就会送一些礼品给相应的用户.最常见的莫过于游戏和商城这些.游戏就送游戏币之类的东西,商城就送一些礼券.正值国庆,应该也有不 ...
mysql 查看当前登陆用户匹配原则及权限user()与current_user()
Mysql在进行登陆时,会去匹配mysql库中的user表,并赋予相应的权限,但是怎么知道我们当时的登陆的用户名及相应的权限呢? 在Mysql中,有两个函数,一个是user(),一个是current_ ...
finger---用于查找并显示用户信息
finger finger命令用于查找并显示用户信息.包括本地与远端主机的用户皆可,帐号名称没有大小写的差别.单独执行finger指令,它会显示本地主机现在所有的用户的登陆信息,包括帐号名称,真实姓名 ...
JavaWeb-SpringSecurity在数据库中查询登陆用户
系列博文项目已上传至guthub 传送门 JavaWeb-SpringSecurity初认识传送门 JavaWeb-SpringSecurity在数据库中查询登陆用户传送门 JavaWeb-Sp ...
AlwaysOn添加高可用性自定义登陆用户的方法
1.在主服务器添加自定义登陆用户,比如TestUser 2.在主服务器执行如下SQL,在master数据库创建存储过程sp_hexadecimal,sp_help_revlogin USE maste ...
linux下登陆用户的行为信息—w和who命令详解
查看用户的操作系统管理员若想知道某一时刻用户的行为,只需要输入命令w 即可,在SHELL终端中输入如下命令: [root@localhost ~]# w 可以看到执行w命令及显示结果. 命令信息含义上 ...
查找oracle自己用户的表
查找oracle自己用户的表 select table_name from user_tables;
mysql创建远程登陆用户并授权
在创建安装微擎的过程中,针对第四步创建远程登陆用户并授权 > grant all PRIVILEGES on database.* to root@'127.0.0.1' id ...

随机推荐

Python bool() 函数
Python bool() 函数 Python 内置函数描述 bool() 函数用于将给定参数转换为布尔类型,如果没有参数,返回 False. bool 是 int 的子类. 语法以下是 boo ...
42. Trapping Rain Water (Array，stack; DP)
Given n non-negative integers representing an elevation map where the width of each bar is 1, comput ...
JAVA序列化和反序列化对象<=>IO流对象<=>字节数组
http://developer.51cto.com/art/201202/317181.htm http://blog.csdn.net/earbao/article/details/4691440 ...
C++，坑...
如果使用const全局变量,记得声明处的引用处都加extern. uint32_t等,t代表是typedef的,在stdint.h头文件里,C99后引入,记得先测试再用. accept函数的参数,记得 ...
【校招面试之 C/C++】第15题 C 回调函数
转自:https://segmentfault.com/a/1190000008293902 做略微改动什么是回调函数我们先来看看百度百科是如何定义回调函数的: 回调函数就是一个通过函数指针调用的 ...
python的错误类型和异常处理
# isinstance() # 判断实例a是否属于类b # issubclass() # 判断类a是否为类b的派生类 # 异常处理 try: pass #Exception是错误类型,能catch到 ...
OC - runtime - 1
Connecting to MQSeries with .NET
By connecting to MQSeries withing a .NET application, first it has to be done is to install MQ Serie ...
LUOGU P4408 [NOI2003]逃学的小孩（树的直径）
题目描述 Chris家的电话铃响起了,里面传出了Chris的老师焦急的声音:“喂,是Chris的家长吗?你们的孩子又没来上课,不想参加考试了吗?”一听说要考试,Chris的父母就心急如焚,他们决定在尽 ...
[转]微信公众平台（测试接口）开发前的准备工作（转载自walkingmanc的专栏）
本文转自:http://blog.csdn.net/jiangweicpu/article/details/21228949 http://blog.csdn.net/walkingmanc/arti ...

TSQL--查找连续登陆用户

TSQL--查找连续登陆用户的更多相关文章

随机推荐

热门专题