hive实现根据用户分组，按用户记录求上下两条记录的时间差

在mysql，数据如下：
#查询某一用户该日抽奖时间

select draw_time from user_draw_log where user_id = 1 and draw_date='2016-03-09' order by id;

+---------------------+

| draw_time           |

+---------------------+

| 2016-03-09 13:52:46 |

| 2016-03-09 13:52:53 |

| 2016-03-09 13:53:01 |

| 2016-03-09 13:53:13 |

| 2016-03-09 13:53:25 |

...

想计算每次抽奖时间之间的间隔以便判断是否是并发插入我的方法如下使用一个临时变量记录前一次的抽奖时间

select draw_time, timediff(draw_time,@prev_time) diff,(@prev_time:=draw_time) from user_draw_log where user_id = 1 and draw_date='2016-03-09' order by id;

+---------------------+------------------+-------------------------+

| draw_time           | diff             | (@prev_time:=draw_time) |

+---------------------+------------------+-------------------------+

| 2016-03-09 13:52:46 | -00:08:28.000000 | 2016-03-09 13:52:46     |

| 2016-03-09 13:52:53 | 00:00:07.000000  | 2016-03-09 13:52:53     |

| 2016-03-09 13:53:01 | 00:00:08.000000  | 2016-03-09 13:53:01     |

| 2016-03-09 13:53:13 | 00:00:12.000000  | 2016-03-09 13:53:13     |

| 2016-03-09 13:53:25 | 00:00:12.000000  | 2016-03-09 13:53:25     |

| 2016-03-09 13:53:32 | 00:00:07.000000  | 2016-03-09 13:53:32     |

| 2016-03-09 13:53:38 | 00:00:06.000000  | 2016-03-09 13:53:38     |

...

有没更方便的方法实现这一功能呢？对所有用户都求相邻记录时间差该如何操作？

hive做法如下：

1.Hive row_number() 函数的高级用法 row_num 按照某个字段分区显示第几条数据

select imei,ts,fuel_instant,gps_longitude,gps_latitude,row_number() over (PARTITION BY imei ORDER BY ts ASC) as row_num from sample_data_2

2.row_num 是相互连续的，join 自身，然后时间相减可求差
create table obd_20140101 as

　　select a.imei,a.row_num,a.ts,COALESCE(unix_timestamp(a.ts, 'yyyy-MM-dd HH:mm:ss.S'), 0) - unix_timestamp(b.ts, 'yyyy-MM-dd HH:mm:ss.S') as intervel ,a.fuel_instant,a.gps_speed as obd_speed,a.gps_status,a.gps_longitude,a.gps_latitude,a.direct_angle,a.obdspeed from obddata_20140101 a join obddata_20140101 b on a.imei = b.imei and a.row_num = b.row_num +1

事实上该方法有更加简便的方法，那就是hive的分析窗口函数：

create table obd_20140101 as

select imei,ts as ts1,fuel_instant,gps_longitude,gps_latitude,lead(ts,1,ts) over (PARTITION BY imei ORDER BY ts ASC) as ts2 from sample_data_2;

这样，数据会按imei分组，并按时间排序。接下来的时间相减就简单了。

select a.imei,a.row_num,a.ts,COALESCE(unix_timestamp(a.ts1, 'yyyy-MM-dd HH:mm:ss.S'), 0) - unix_timestamp(a.ts2, 'yyyy-MM-dd HH:mm:ss.S') as intervel ,a.fuel_instant,a.gps_speed as obd_speed,a.gps_status,a.gps_longitude,a.gps_latitude,a.direct_angle,a.obdspeed from obddata_20140101 a;

hive实现根据用户分组，按用户记录求上下两条记录的时间差的更多相关文章

SQLServer 分组查询相邻两条记录的时间差
原文:SQLServer 分组查询相邻两条记录的时间差首先,我们通过数据库中表的两条记录来引出问题,如下图以上为一个记录操作记录的表数据.OrderID为自增长列,后面依次为操作类型,操作时间,操 ...
SQL获取分组后取某字段最大一条记录（求每个类别中最大的值的列表）
获取分组后取某字段最大一条记录方法一:(效率最高) select * from test as a where typeindex = (select max(b.typeindex) from t ...
sqlserver -- 学习笔记（七）获取同组数据的前两条记录
不啰嗦,直接上图,大概实现效果如下: 有上面这样一份数据,将他们按照userAccount和submitTime进行分组,然后提前每组数据的前两条记录提取后数据如下: 实现的SQL如下: selec ...
Slq怎么样获取首条记录和最后一条记录
sql如何查询表的第一条记录和最后一条记录方法一:使用top select TOP 1 * from apple;TOP 1 表示表apple中的第一条数据 select TOP 1 * from ...
SQL查找TCar表中同一辆车前后两条记录的CarId，两条记录中有多个字段值一样
查询同一个表中某一字段值相同的记录 select * from 表名 where 字段 in(select 字段 from 表名 group by 字段 having count(1)>1) s ...
HIve分组查询返回每组的一条记录
select a.lng,a.lat from (select row_number() over ( partition by uid,grid_id) as rnum,weighted_centr ...
记一次有意思的 SQL 实现 → 分组后取每组的第一条记录
开心一刻今天,朋友气冲冲的走到我面前朋友:我不是谈了个女朋友,谈了三个月嘛,昨天我偷看她手机,你猜她给我备注什么我:备注什么? 朋友:舔狗 2 号! 我一听,气就上来了,说道:走,找她去,这婆娘 ...
[mysql] 先按某字段分组再取每组中前N条记录
From: http://blog.chinaunix.net/uid-26729093-id-4294287.html 请参考:http://bbs.csdn.net/topics/33002126 ...
sql查询上一条记录和下一条记录
上一条记录的SQL语句: * from news where newsid<id order by newsid DESC 下一条记录的SQL语句: * from news where news ...

随机推荐

Linux Mint下的conky配置
最近闲来无事,想把自己的Linux Mint弄的再炫酷点,在桌面上显示一些信息,因为我已经装了Cairo-dock,现在就差这个了,下面简单说下整个流程,首先你得安装conky, sudo apt-g ...
Intellij IDEA 最头大的问题，如何自定义注释模板？
想栈长我当初从 Eclipse 转用 IDEA 真是纠结,放弃然后尝试了N次,不过现在已经算是转型成功了,可以完全脱离 Eclipse 撸码了,虽然说我现在真的撸得非常少了.. 说到 IDEA 的痛点 ...
mysql对库,表,数据类型的操作以及完整性约束
一丶对库的操作求救语法: help create database; 1.创建数据库 CREATE DATABASE 数据库名 charset utf8; 2.数据库的命名规则: 可以由字母.数字. ...
【精华】9张思维导图带你学习Javascript
转自:ChokCoco(http://www.cnblogs.com/coco1s/p/3953653.html) 学习的道路就是要不断的总结归纳,好记性不如烂笔头,so,下面将po出8张javasc ...
C#添加删除防火墙例外（程序、端口）
一. 添加 COM 引用在引用里,选择 COM 页, 找到 NetFwTypeLib , 确定即可二. 添加允许通过防火墙的例外程序 using System; using System.Coll ...
C#高性能Socket服务器IOCP实现
引言我一直在探寻一个高性能的Socket客户端代码.以前,我使用Socket类写了一些基于传统异步编程模型的代码(BeginSend.BeginReceive,等等)也看过很多博客的知识,在linux ...
CentOS-7系统安装配置
CentOS 7 系统安装配置服务器相关设置如下: 操作系统:CentOS 7.3.1611 IP地址:192.168.3.30 网关:192.168.3.1 DNS:8.8.8.8 8.8.4.4 ...
数据库SQL优化大总结之百万级数据库优化方案2
网上关于SQL优化的教程很多,但是比较杂乱.近日有空整理了一下,写出来跟大家分享一下,其中有错误和不足的地方,还请大家纠正补充. 这篇文章我花费了大量的时间查找资料.修改.排版,希望大家阅读之后, ...
小图示优化 - ASP.NET Sprite and Image Optimization (Web Form)
小图示优化 - ASP.NET Sprite and Image Optimization (Web Form) 透过 NuGet安装下面的套件,可以将您的小图示(icon)合并成一张图透过 CSS ...
HDU1075 字典树 + 字符串映射
题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=1075 ,字典树的字符串映射. 题意是给你每个火星文单词对应的英语,然后让你把一篇火星文文章给翻译成英语 ...

hive实现根据用户分组，按用户记录求上下两条记录的时间差

hive实现根据用户分组，按用户记录求上下两条记录的时间差的更多相关文章

随机推荐

热门专题