hive中窗口分析函数
分组统计
1. groups sets(field1,field2,field3, (field1,field2)) 样例如下:
select dt,tenantCode,nvl(platform,'all') as platform,
count(1) as uv_one
from(
select tenantCode,platform,dt,deviceId,count(deviceId) as pv from
dw_stg.tmp_tg_user_behavior_day a
group by tenantCode,platform,dt,deviceId
having tenantCode is not null
and deviceId is not null
--and count(deviceId) = 1 --浏览量为1的访客数
)aa group by tenantCode,platform,dt
grouping sets((dt,tenantCode), (dt,tenantCode,platform))
结果显示如下:
hive中窗口分析函数的更多相关文章
- Hive—简单窗口分析函数
		hive 窗口分析函数 : jdbc:hive2:> select * from t_access; +----------------+---------------------------- ... 
- hive中分析函数window子句
		hive中有些分析函数功能确实很强大,在和sum,max等聚合函数结合起来能实现不少功能. 直接上代码演示吧 原始数据 channel1 2016-11-10 1 channel1 2016-11-1 ... 
- hive 中窗口函数row_number,rank,dense_ran,ntile分析函数的用法
		hive中一般取top n时,row_number(),rank,dense_ran()这三个函数就派上用场了, 先简单说下这三函数都是排名的,不过呢还有点细微的区别. 通过代码运行结果一看就明白了. ... 
- hive中 udf,udaf,udtf
		1.hive中基本操作: DDL,DML 2.hive中函数 User-Defined Functions : UDF(用户自定义函数,简称JDF函数)UDF: 一进一出 upper lower ... 
- Hive中的数据库(Database)和表(Table)
		在前面的文章中,介绍了可以把Hive当成一个"数据库",它也具备传统数据库的数据单元,数据库(Database/Schema)和表(Table). 本文介绍一下Hive中的数据库( ... 
- Hive中的HiveServer2、Beeline及数据的压缩和存储
		1.使用HiveServer2及Beeline HiveServer2的作用:将hive变成一种server服务对外开放,多个客户端可以连接. 启动namenode.datanode.resource ... 
- Hive中的用户自定义函数
		1.1 关于自定义函数 1)Hive 自带了一些函数,比如:max/min等,但是数量有限,自己可以通过自定义UDF来方便的扩展. 2)当Hive提供的内置函数无法满足你的业务处理需要时,此时就可以考 ... 
- SparkSQL读取Hive中的数据
		由于我Spark采用的是Cloudera公司的CDH,并且安装的时候是在线自动安装和部署的集群.最近在学习SparkSQL,看到SparkSQL on HIVE.下面主要是介绍一下如何通过SparkS ... 
- hive中rcfile格式(收藏文)
		首先声明,此文是属于纯粹收藏文,感觉讲的很不错. 本文介绍了Facebook公司数据分析系统中的RCFile存储结构,该结构集行存储和列存储的优点于一身,在MapReduce环境下的大规模数据分析中扮 ... 
随机推荐
- PHP中的$_SERVER超全局变量
			详细参数 PHP编程中经常需要用到一些服务器的一些资料,特把$_SERVER的详细参数整理下,方便以后使用. $_SERVER['PHP_SELF'] #当前正在执行脚本的文件名,与 document ... 
- [转]Jackson 解析json数据之忽略解析字段注解@JsonIgnoreProperties
			以前解析json用的惯的就是Google的gson了,用惯了基本就用它了,一直也没发现什么大问题,因为都是解析简单的json数据.但是最近学习springboot,要解析一个比较复杂的json数据.就 ... 
- Android Activity全面解析
			Android Activity全面解析 首先,就从Android四大组件Activity开始. 1.Activity生命周期方法完全解析 activity_lifecycle.png 1).on ... 
- postman发送post数据到node.js中
			使用get请求我们很容易的来利用postman来发送数据,但是今天的express在使用postman进行post请求的时候,竟然解析的body是空对象.在网上找了一下果然有解决方法,如下: 因为是P ... 
- Zephir入门 —— 语法篇
			概述 Zephir的语法跟PHP很相似,所以这里不会把官网的文档照搬过来翻译一遍,而是会把一些Zephir相较于PHP比较特别的语法挑出来讲一下.如果想要要完整学习Zephir的语法,没有比官网的文档 ... 
- Android自己定义ViewGroup(二)——带悬停标题的ExpandableListView
			项目里要加一个点击可收缩展开的列表,要求带悬停标题,详细效果例如以下图: watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQv/font/5a6L5L2T/fon ... 
- 分享:三种取消选中单选框radio的方法
			三种取消选中radio的方式,本文依赖于jQuery,其中第一种,第二种方式是使用jQuery实现的,第三种方式是基于JS和DOM实现的. <!DOCTYPE HTML> <html ... 
- 牛腩学Kotlin做Android应用
			牛腩学Kotlin做Android应用,蹭热度视频,边学边做, 01-kotlin插件安装及hello world 02-kotlin基础语法速览 哔哩哔哩观看地址:http://www.bilibi ... 
- Daemontools和Supervisor管理linux常驻进程
			linux主要使用supervise来管理常驻进程.基于supervise的两个比较重要的工具是Daemontools和Supervisor. 实际上,supervise也算Daemontools的一 ... 
- pandas数组(pandas Series)-(4)NaN的处理
			上一篇pandas数组(pandas Series)-(3)向量化运算里说到,将两个 pandas Series 进行向量化运算的时候,如果某个 key 索引只在其中一个 Series 里出现,计算的 ... 
