Hive sql 查询数据库查询 top-n
数据库查询*分组排序取top n
要求:按照课程分组,查找每个课程最高的两个成绩。
数据文件如下:
第一列no为学号,第二列course为课程,第三列score为分数
mysql> select * from lesson;
+-------+---------+-------+
| no    | course  | score |
+-------+---------+-------+
| N0101 | Marth   |   100 |
| N0102 | English |    12 |
| N0102 | Chinese |    55 |
| N0102 | History |    58 |
| N0102 | Marth   |    25 |
| N0103 | English |   100 |
| N0103 | Chinese |    87 |
| N0103 | History |    88 |
| N0103 | Marth   |    72 |
| N0104 | English |    20 |
| N0104 | Chinese |    60 |
| N0104 | History |    88 |
| N0104 | Marth   |    56 |
| N0105 | English |    56 |
| N0105 | Chinese |    88 |
| N0105 | History |    88 |
| N0201 | English |    66 |
| N0201 | Chinese |    77 |
| N0201 | History |    80 |
| N0201 | Marth   |   100 |
| N0202 | English |    35 |
| N0202 | Chinese |    56 |
| N0202 | History |    86 |
| N0202 | Marth   |    99 |
| N0203 | English |   100 |
| N0203 | Chinese |    87 |
| N0203 | History |    88 |
| N0203 | Marth   |    57 |
| N0204 | English |    98 |
| N0204 | Chinese |   100 |
| N0204 | History |    66 |
| N0204 | Marth   |    71 |
| N0205 | English |    98 |
| N0205 | Chinese |   100 |
| N0205 | History |    66 |
| N0205 | Marth   |    71 |
| N0301 | English |    66 |
| N0301 | Chinese |    89 |
| N0301 | History |    68 |
| N0301 | Marth   |    83 |
| N0302 | English |    76 |
| N0302 | Chinese |    99 |
| N0302 | History |    80 |
| N0302 | Marth   |    74 |
| N0303 | English |   100 |
| N0303 | Chinese |   100 |
| N0303 | History |    88 |
| N0303 | Marth   |    57 |
| N0304 | English |    76 |
| N0304 | Chinese |   100 |
| N0304 | History |    66 |
| N0304 | Marth   |    86 |
| N0305 | English |    98 |
| N0305 | Chinese |   100 |
| N0305 | History |    40 |
| N0305 | Marth   |    59 |
| N0306 | English |    52 |
| N0306 | Chinese |    87 |
| N0306 | History |    72 |
| N0306 | Marth   |    71 |
| N0101 | Chinese |    55 |
| N0101 | History |    84 |
| N0101 | English |    82 |
| N0101 | English |    82 |
+-------+---------+-------+
64 rows in set
在hive上查询
select a.course,a.score
from
(
select course,score,row_number() over(partition by course order by score desc) as n
from lesson
)a
where a.n<=2;
其中:
row_number() over(partition by course order by score desc)
意思是以课程分组,按成绩递减排序,并为每组中的数据打上行号的标记,从1开始。
这样,再在外层套一层过滤行号小于等于2的即可:-D
原文:https://blog.csdn.net/wguangliang/article/details/50167283
Hive sql 查询数据库查询 top-n的更多相关文章
- 转载 50种方法优化SQL Server数据库查询
		原文地址 http://www.cnblogs.com/zhycyq/articles/2636748.html 50种方法优化SQL Server数据库查询 查询速度慢的原因很多,常见如下几种: 1 ... 
- 优化SQL Server数据库查询方法
		SQL Server数据库查询速度慢的原因有很多,常见的有以下几种: 1.没有索引或者没有用到索引(这是查询慢最常见的问题,是程序设计的缺陷) 2.I/O吞吐量小,形成了瓶颈效应. 3.没有创建计算列 ... 
- SQL Server数据库--》top关键字,order by排序,distinct去除重复记录,sql聚合函数,模糊查询,通配符,空值处理。。。。
		top关键字:写在select后面 字段的前面 比如你要显示查询的前5条记录,如下所示: select top 5 * from Student 一般情况下,top是和order by连用的 orde ... 
- 50种方法优化SQL Server数据库查询
		查询速度慢的原因很多,常见如下几种: 1.没有索引或者没有用到索引(这是查询慢最常见的问题,是程序设计的缺陷) 2.I/O吞吐量小,形成了瓶颈效应. 3.没有创建计算列导致查询不优化. 4.内存不足 ... 
- [译]LINT TO SQL 介绍(数据库查询) - Part.3
		出处:Linq To Sql (Part.3 – Querying our database) 术语表 Built-in:内置的 Clause:子句 Debugger:调试器 Object Relat ... 
- (五)SQL入门 数据库查询
		什么是查询?查询就是Select语句对数据库的探究. 查询是一种目的,一种需求,一种期望.是Select语句去实现的.Select语句不是只是指select语句,而是多个子句一起使用得组合. sele ... 
- sql server数据库查询同义词
		查询数据库同义词: select * from sys.synonyms, 查询同义词个数:select count(1) from sys.synonyms 
- sql server数据库查询取出重复数据记录
		问题:博主在2011年6月,广东技术师范大学大四的时候,从学校计算机科学学院网站看到招聘信息并到广东中原地产IT部面试,很清楚记得当时的面试题目:怎么从数据库里面查询重复记录. 解决方案:在sql s ... 
- LinQ to sql 各种数据库查询方法
		1.多条件查询: 并且 && 或者 || var list = con.car.Where(r => r.code == "c014" || r.oil == ... 
随机推荐
- JDK5.0 特性线程 同步装置之CountDownLatch 同步装置之CyclicBarrier 线程 BlockingQueue
			来自:http://www.cnblogs.com/taven/category/475298.html import java.util.concurrent.CountDownLatch; imp ... 
- idea 配置svn
			1.情景展示 idea安装好后,如何配置svn? 2.分析 由于没有针对idea的svn插件,因此只能选择安装svn的客户端. 3.解决方案 第一步:下载小乌龟SVN客户端: 官网地址:htt ... 
- Excel之定位和查找
			在数据量比较少的情况下,我们要到达Excel中某一位置时,通常会用鼠标拖动滚动条到达需要的位置,查找某已知固定的值,用Ctr+F,在查找内容中输入对应的值即可一个个的查找到其对应的位置.但当数据量较多 ... 
- 基于py3和pymysql的数据库查询,查询某几列的数据
			#python3 #xiaodeng #基于py3和pymysql的数据库查询,查询某几列的数据 import pymysql conn=pymysql.connect(....) cur=conn. ... 
- 解决ajax异步传输数据,return返回为undefined的问题
			function GetUserInfo(tp) { var username; $.ajax({ type: "POST", cache: false, data: " ... 
- IM系统架构设计之浅见
			转自:http://mobile.51cto.com/hot-439693.htm 背景:除去大名鼎鼎的QQ这款即时聊天工具,还有许多细分行业的IM,比如淘宝阿里旺旺.网易泡泡.YY语音....... ... 
- 安装xenapp后,非管理员连接RDP出现桌面当前不可用的解决方法
			安装完xenapp后,非管理员帐号就不能远程登录到2008服务器. 修改方法如下:1.启动 Citrix AppCenter展开citrix资源.Xenapp.<场地>.策略,右面的窗格切 ... 
- 对simhash算法的一些思考
			http://2588084.blog.51cto.com/2578084/558873 
- ant执行jar包中的main方法
			<project name= "myproject" basedir= "." default="main"> <p ... 
- C语言学习笔记 (001) - 常量指针与指针常量的区别(转帖)
			三个名词虽然非常绕嘴,不过说的非常准确.用中国话的语义分析就可以很方便地把三个概念区分开. 一) 常量指针. 常量是形容词,指针是名词,以指针为中心的一个偏正结构短语.这样看,常量指针本质是指针,常量 ... 
