hive取等分数据

 %sql

 select

     t3.*

 from (

     select

         t2.*

         ,row_number() over(partition by t2.pt order by t2.pv) as rn2

     from (

         select

              t1.cookieid

             ,t1.createtime

             ,t1.pv

             ,ntile(2) over(order by t1.pv)     as pt  --分组内将数据分成2片

             ,row_number() over(order by t1.pv) as rn

             ,count(1) over()                   as cn

         from (

             select 'cookie1' as cookieid ,'2015-04-10' as createtime, 1   as pv union all

             select 'cookie1' as cookieid ,'2015-04-11' as createtime, 2   as pv union all

             select 'cookie1' as cookieid ,'2015-04-12' as createtime, 3   as pv union all

             select 'cookie1' as cookieid ,'2015-04-13' as createtime, 4   as pv union all

             select 'cookie1' as cookieid ,'2015-04-14' as createtime, 5   as pv union all

             select 'cookie1' as cookieid ,'2015-04-15' as createtime, 6   as pv union all

             select 'cookie1' as cookieid ,'2015-04-16' as createtime, 7   as pv union all

             select 'cookie2' as cookieid ,'2015-04-10' as createtime, 8   as pv union all

             select 'cookie2' as cookieid ,'2015-04-11' as createtime, 9   as pv union all

             select 'cookie2' as cookieid ,'2015-04-12' as createtime, 10  as pv union all

             select 'cookie2' as cookieid ,'2015-04-13' as createtime, 11  as pv union all

             select 'cookie2' as cookieid ,'2015-04-14' as createtime, 12  as pv union all

             select 'cookie2' as cookieid ,'2015-04-15' as createtime, 13  as pv union all

             select 'cookie2' as cookieid ,'2015-04-16' as createtime, 14  as pv

         ) t1

     ) t2

 ) t3

 where t3.rn2 = 1 or t3.rn = t3.cn

 ;

hive取等分数据的更多相关文章

Hive 如何快速拉取大批量数据
用hive来做数仓类操作,或者大数据的运算,是没有疑问的,至少在你没有更多选择之前. 当我们要hive来做类似于大批量数据的select时,也许问题就会发生了变化. 1. 通用解决方案之分页首先,我 ...
Hive导出复杂数据到csv文件
工作中经常遇到使用Hive导出数据到文本文件供数据分析时使用.Hive导出复杂数据到csv等文本文件时,有时会遇到以下几个问题: 导出的数据只有数据没有列名. 导出的数据比较复杂时,如字符串内包含一些 ...
Hive中的数据倾斜
Hive中的数据倾斜 hive 1. 什么是数据倾斜 mapreduce中,相同key的value都给一个reduce,如果个别key的数据过多,而其他key的较少,就会出现数据倾斜.通俗的说,就是我 ...
spark SQL （五）数据源 Data Source----json hive jdbc等数据的的读取与加载
1,JSON数据集 Spark SQL可以自动推断JSON数据集的模式,并将其作为一个Dataset[Row].这个转换可以SparkSession.read.json()在一个Dataset[Str ...
Hive读取外表数据时跳过文件行首和行尾
作者:Syn良子出处:http://www.cnblogs.com/cssdongl 转载请注明出处有时候用hive读取外表数据时,比如csv这种类型的,需要跳过行首或者行尾一些和数据无关的或者自 ...
sql 分组取最新的数据sqlserver巧用row_number和partition by分组取top数据
SQL Server 2005后之后,引入了row_number()函数,row_number()函数的分组排序功能使这种操作变得非常简单分组取TOP数据是T-SQL中的常用查询, 如学生信息管理系 ...
Charles 如何抓取https数据包
Charles可以正常抓取http数据包,但是如果没有经过进一步设置的话,无法正常抓取https的数据包,通常会出现乱码.举个例子,如果没有做更多设置,Charles抓取https://www.bai ...
row_number和partition by分组取top数据
分组取TOP数据是T-SQL中的常用查询, 如学生信息管理系统中取出每个学科前3名的学生.这种查询在SQL Server 2005之前,写起来很繁琐,需要用到临时表关联查询才能取到.SQL Serve ...
Hive几种数据导出方式
Hive几种数据导出方式今天我们再谈谈Hive中的几种不同的数据导出方式.可以根据导出的地方不一样,将这些方式分为三种: (1).导出到本地文件系统: (2).导出到HDFS中: (3).导出到Hi ...

随机推荐

vue 的全局拦截器
使用拦截器你可以截取请求或响应在被 then 或者 catch 处理之前 mounted:function(){ Vue.http.inserceptors.push(function(resque ...
初步认识ASP.NET WebForm
C#可已进行以下两大类的开发一.客户端应用程序C/S 主要有两种开发技术: 1.winForm windows窗体应用程序 2.WPF微软新一代图形框架 MFC(比较老的开发技术) MVVM(客户端 ...
Windows系统安装 Qt 5.7.0
Windows系统安装 Qt 5.7.0 我们的电脑系统:Windows 10 64位 Qt5 软件:Qt 5. 7. 0 下载 Qt 5.7.0 软件在这个网站里面,下载:Qt 5.7.0 fo ...
c++ 类中模版成员函数
C++函数模版与类模版. template <class T> void SwapFunction(T &first, T &second){ }//函数模版 templa ...
c++ 拷贝构造函数继承
拷贝构造函数要求把所有变量都需要做拷贝.在有继承关系情况先,子类的拷贝构造函数,需要调用父类拷贝构造函数.示例代码如下: class Base{ public: virtual ~Base(); Ba ...
WebGoat系列实验Injection Flaws
WebGoat系列实验Injection Flaws Numeric SQL Injection 下列表单允许用户查看天气信息,尝试注入SQL语句显示所有天气信息. 选择一个位置的天气,如Columb ...
fiddler抓包后Jmeter实现登录接口
登录接口测试时,先要抓取登录接口,我们使用fiddler来抓包,如下图: 然后再使用Jmeter,填写相对于的参数. 查看结果树: 关键在与抓包,搞清楚抓包的信息,可以用fiddler和火狐和谷歌.我 ...
Linux 新建用户、用户组，给用户分配权限
注:内容来自网络 Linux 系统是一个多用户多任务的分时操作系统,任何一个要使用系统资源的用户,都必须首先向系统管理员申请一个账号,然后以这个账号的身份进入系统.用户的账号一方面可以帮助系统管理员对 ...
MySQL 5.0的my.cnf配置选项(另外一种方式分类整理)
一. mysqld程序--目录和文件 basedir = path 使用给定目录作为根目录(安装目录). Show variables like “basedir” //数据库中查看目录 da ...
使用Google浏览器开发者工具学习HTTP请求记录
GET请求 1.Google浏览器开发者工具截图图示 2.General Request URL :为请求链接 Status Code :为HTTP响应状态码 3.ResponseHeaders :响 ...

hive取等分数据

hive取等分数据的更多相关文章

随机推荐

热门专题