Hive函数：rank()、dense

数据准备：

G1,KING,5000

G1,BING,5000

G2,FING,5000

G1,FORD,3000

G2,SCOTT,3000

G1,JONES,2975

G2,BLAKE,2850

G1,CLARK,2450

G1,ALLEN,1600

G1,CELL1,NULL

G2,CELL2,NULL

CREATE EXTERNAL TABLE test_data (

gid string,

ename STRING,

sal INT

) ROW FORMAT DELIMITED

FIELDS TERMINATED BY ','

stored as textfile location '/user/jc_rc_ftp/test_data';

select * from test_data l;

+--------+----------+--------+--+

| l.gid  | l.ename  | l.sal  |

+--------+----------+--------+--+

| G1     | CELL1    | NULL   |

| G2     | CELL2    | NULL   |

| G1     | KING     | 5000   |

| G1     | BING     | 5000   |

| G2     | FING     | 5000   |

| G1     | FORD     | 3000   |

| G2     | SCOTT    | 3000   |

| G1     | JONES    | 2975   |

| G2     | BLAKE    | 2850   |

| G1     | CLARK    | 2450   |

| G1     | ALLEN    | 1600   |

+--------+----------+--------+--+

rank

---rank()over(order by 列名排序)的结果是不连续的，如果有4个人，其中有3个是并列第1名，那么最后的排序结果结果如：1 1 1 4

SQL> select gid,ename,sal,rank() over(order by sal desc) from test_data;

---rank() over (partition by 分组字段 order by 排序字段顺序)

注意：使用rank()over(order by 排序字段顺序)排序的时候，空值是最大的

select gid,ename,sal,rank()over(partition by gid order by coalesce(sal,0) desc) from test_data;

+------+--------+-------+----------------+--+

| gid | ename | sal | rank_window_0 |

+------+--------+-------+----------------+--+

| G1 | BING | 5000 | 1 |

| G1 | KING | 5000 | 1 |

| G1 | FORD | 3000 | 3 |

| G1 | JONES | 2975 | 4 |

| G1 | CLARK | 2450 | 5 |

| G1 | ALLEN | 1600 | 6 |

| G1 | CELL1 | NULL | 7 |

| G2 | FING | 5000 | 1 |

| G2 | SCOTT | 3000 | 2 |

| G2 | BLAKE | 2850 | 3 |

| G2 | CELL2 | NULL | 4 |

+------+--------+-------+----------------+--+

dense_rank

---dense_rank()over(order by 列名排序)的结果是连续的，如果有4个人，其中有3个是并列第1名，那么最后的排序结果如：1 1 1 2
如果排序字段为null，可能造成在排序时将null字段排在最前面，影响排序的正确性。
所以建议将 dense_rank()over(order by 列名排序)改为dense_rank()over(order by 列名排序 nulls last)

---rank()over(order by 列名排序)的结果是不连续的，如果有4个人，其中有3个是并列第1名，那么最后的排序结果结果如：1 1 1 4

SQL> select gid,ename,sal,rank() over(order by sal desc) from test_data;

+------+--------+-------+----------------+--+

| gid  | ename  |  sal  | rank_window_0  |

+------+--------+-------+----------------+--+

| G2   | FING   | 5000  | 1              |

| G1   | BING   | 5000  | 1              |

| G1   | KING   | 5000  | 1              |

| G2   | SCOTT  | 3000  | 4              |

| G1   | FORD   | 3000  | 4              |

| G1   | JONES  | 2975  | 6              |

| G2   | BLAKE  | 2850  | 7              |

| G1   | CLARK  | 2450  | 8              |

| G1   | ALLEN  | 1600  | 9              |

| G1   | CELL1  | NULL  | 10             |

| G2   | CELL2  | NULL  | 10             |

+------+--------+-------+----------------+--+

---rank() over (partition by 分组字段 order by 排序字段 顺序)

注意：使用rank()over(order by 排序字段 顺序)排序的时候，空值是最大的

select gid,ename,sal,rank()over(partition by gid order by coalesce(sal,0) desc) from test_data;

+------+--------+-------+----------------+--+

| gid  | ename  |  sal  | rank_window_0  |

+------+--------+-------+----------------+--+

| G1   | BING   | 5000  | 1              |

| G1   | KING   | 5000  | 1              |

| G1   | FORD   | 3000  | 3              |

| G1   | JONES  | 2975  | 4              |

| G1   | CLARK  | 2450  | 5              |

| G1   | ALLEN  | 1600  | 6              |

| G1   | CELL1  | NULL  | 7              |

| G2   | FING   | 5000  | 1              |

| G2   | SCOTT  | 3000  | 2              |

| G2   | BLAKE  | 2850  | 3              |

| G2   | CELL2  | NULL  | 4              |

+------+--------+-------+----------------+--+

---dense_rank()over(order by 列名排序)的结果是连续的，如果有4个人，其中有3个是并列第1名，那么最后的排序结果如：1 1 1 2

如果排序字段为null，可能造成在排序时将null字段排在最前面，影响排序的正确性。

所以建议将 dense_rank()over(order by 列名 排序)改为dense_rank()over(order by 列名排序 nulls last)

select gid,ename,sal,dense_rank()over(order by sal desc) from test_data;

+------+--------+-------+----------------------+--+

| gid  | ename  |  sal  | dense_rank_window_0  |

+------+--------+-------+----------------------+--+

| G2   | FING   | 5000  | 1                    |

| G1   | BING   | 5000  | 1                    |

| G1   | KING   | 5000  | 1                    |

| G2   | SCOTT  | 3000  | 2                    |

| G1   | FORD   | 3000  | 2                    |

| G1   | JONES  | 2975  | 3                    |

| G2   | BLAKE  | 2850  | 4                    |

| G1   | CLARK  | 2450  | 5                    |

| G1   | ALLEN  | 1600  | 6                    |

| G2   | CELL2  | NULL  | 7                    |

| G1   | CELL1  | NULL  | 7                    |

+------+--------+-------+----------------------+--+

select gid,ename,sal,dense_rank()over(partition by gid order by sal desc) from test_data;

+------+--------+-------+----------------------+--+

| gid  | ename  |  sal  | dense_rank_window_0  |

+------+--------+-------+----------------------+--+

| G1   | BING   | 5000  | 1                    |

| G1   | KING   | 5000  | 1                    |

| G1   | FORD   | 3000  | 2                    |

| G1   | JONES  | 2975  | 3                    |

| G1   | CLARK  | 2450  | 4                    |

| G1   | ALLEN  | 1600  | 5                    |

| G1   | CELL1  | NULL  | 6                    |

| G2   | FING   | 5000  | 1                    |

| G2   | SCOTT  | 3000  | 2                    |

| G2   | BLAKE  | 2850  | 3                    |

| G2   | CELL2  | NULL  | 4                    |

+------+--------+-------+----------------------+--+

Hive函数：rank()、dense_rank()的更多相关文章

Oracle 的开窗函数 rank,dense_rank,row_number
1.开窗函数和分组函数的区别分组函数是指按照某列或者某些列分组后进行某种计算,比如计数,求和等聚合函数进行计算. 开窗函数是指基于某列或某些列让数据有序,数据行数和原始数据数相同,依然能曾现个体数据 ...
Hive ROW_NUMBER,RANK(),DENSE_RANK()
准备数据浙江,杭州,300 浙江,宁波,150 浙江,温州,200 浙江,嘉兴,100 江苏,南京,270 江苏,苏州,299 江苏,某市,200 江苏,某某市,100 创建表 CREATE t ...
知方可补不足~row_number,rank,dense_rank,ntile排名函数的用法
回到目录这篇文章介绍SQL中4个很有意思的函数,我称它的行标函数,它们是row_number,rank,dense_rank和ntile,下面分别进行介绍. 一 row_number:它为数据表加一 ...
SQL Server：排名函数row_number,rank,dense_rank,ntile详解
1.Row_Number函数 row_number函数大家比较熟悉一些,因为它的用途非常的广泛,我们经常在分页与排序中用到它,它的功能就是在每一行中生成一个连续的不重复的序号例如: select S ...
Hive学习之路（十四）Hive分析窗口函数(二) NTILE,ROW_NUMBER,RANK,DENSE_RANK
概述本文中介绍前几个序列函数,NTILE,ROW_NUMBER,RANK,DENSE_RANK,下面会一一解释各自的用途. 注意: 序列函数不支持WINDOW子句.(ROWS BETWEEN) 数据 ...
SQL-OVER与四种排名函数：ROW_NUMBER(),RANK(),DENSE_RANK(),NTILE()
1 SELECT orderid,custid,val, ROW_NUMBER() OVER(ORDER BY val) AS rownum, RANK() OVER(ORDER BY val) AS ...
SQL Server中排名函数row_number,rank,dense_rank,ntile详解
SQL Server中排名函数row_number,rank,dense_rank,ntile详解从SQL SERVER2005开始,SQL SERVER新增了四个排名函数,分别如下:1.row_n ...
大数据学习day29-----spark09-------1. 练习：统计店铺按月份的销售额和累计到该月的总销售额（SQL, DSL,RDD） 2. 分组topN的实现（row_number(), rank(), dense_rank()方法的区别）3. spark自定义函数-UDF
1. 练习数据: (1)需求1:统计有过连续3天以上销售的店铺有哪些,并且计算出连续三天以上的销售额第一步:将每天的金额求和(同一天可能会有多个订单) SELECT sid,dt,SUM(mone ...
[转]oracle分析函数Rank, Dense_rank, row_number
oracle分析函数Rank, Dense_rank, row_number 分析函数2(Rank, Dense_rank, row_number) 目录 ==================== ...
sql server 排名函数：DENSE_RANK
一.需求之前sql server 的排名函数用得最多的应该是RoW_NUMBER()了,我通常用ROW_NUMBER() + CTE 来实现分页:今天逛园,看到另一个内置排名函数还不错,自己顺便想了 ...

随机推荐

[Luogu 1122] 最大子树和
题目 Description 小明对数学饱有兴趣,并且是个勤奋好学的学生,总是在课后留在教室向老师请教一些问题.一天他早晨骑车去上课,路上见到一个老伯正在修剪花花草草,顿时想到了一个有关修剪花卉的问题 ...
掌握这些知识，你的python水平能更上一层楼（续）
笔者的上一篇python文章阅读量不错,看来python爱好者很多,所以再写一篇,以飨读者. 先接着上一篇讲一个问题,下面这段code有没有问题? def countcalls(func): coun ...
linux内核管理
一 linux组成:kernel.库.rootfs.程序 1.kernel的功能: 1) kernel提供的功能都通过系统调用给用户接口 2) kernel包括:进程管理 .内存管理 .网络管理 ...
Spring中Bean的生命周期讨论
1.代码和配置文件准备 1.1.测试类(user.java) public class User { private int id; private String name; private int ...
PHP源代码加密
加密软件(php_screw) >下载网站:http://sourceforge.net/projects/php-screw/ >描述:php文件通常以文本格式存贮在服务器端, 很容易被 ...
C语言的输入输出操作函数小结
一.scanf()&printf()函数 scanf() 函数用于从标准输入(键盘)读取并格式化, printf() 函数发送格式化输出到标准输出(屏幕). scanf()函数原型为int ...
每天学习点js（2）
在日常开发中可能有很多不被重视但有关系着基础的知识,下面我们就来看看这几道题吧题1 ["1","2","3"].map(parseInt) ...
修改GeoJson的网址
http://geojson.io 可以打开自己的json 然后修改
控制反转（ IoC）和依赖注入（DI）
控制反转( IoC)和依赖注入(DI) tags: 容器依赖注入 IOC DI 控制反转引言:如果你看过一些框架的源码或者手册,像是laravel或者tp5之类的,应该会提到容器,依赖注入,控制反 ...
[日常] Codeforces Round #440 Div.2 大力翻车实况
上次打了一发ABC然后大力翻车...上午考试又停电+Unrated令人非常滑稽...下午终于到了CF比赛... 赛前大力安利了一发然后拉了老白/ $ljm$ / $wcx$ 一起打, 然后搞了个 TI ...

Hive函数：rank()、dense_rank()

rank

dense_rank

Hive函数：rank()、dense_rank()的更多相关文章

随机推荐

热门专题