一道hive面试题:explode map字段

需要找到每个学生最好的课程和成绩，最差的课程和成绩，以及各科的平均分

文本数据如下：

name　　scores
张三    语文:78,数学:90,英语:82,历史:77,政治:80,物理:88,化学:79,地理:92,生物:86

李四    语文:68,数学:84,英语:79,历史:65,政治:66,物理:78,化学:72,地理:83,生物:75

王五    语文:88,数学:69,英语:86,历史:82,政治:70,物理:68,化学:89,地理:95,生物:93

朱六    语文:73,数学:76,英语:73,历史:76,政治:75,物理:85,化学:86,地理:85,生物:90

钱二    语文:68,数学:91,英语:92,历史:97,政治:83,物理:88,化学:77,地理:72,生物:70

段七    语文:86,数学:80,英语:85,历史:87,政治:88,物理:98,化学:69,地理:87,生物:74

建表语句：

create external table score_test(

    name string,

    scores map<String, int>

)

row format delimited fields terminated by '\t'

collection items terminated by ','

map keys terminated by ':'

lines terminated by '\n'

通过hadoop命令将文本上传到hive表对应的目录下。

sql：

select

    a.name,

    max(if(a.key1 = 1, a.subject, '')) as bad_subject,

    max(if(a.key1 = 1, a.score, 0)) as bad_score,

    max(if(a.key2 = 1, a.subject, '')) as good_subject,

    max(if(a.key2 = 1, a.score, 0)) as good_score,

    avg(a.score) as avg_score

from

(

    select

        name,

        subject,

        score,

        row_number() over(partition by name order by score) as key1,

        row_number() over(partition by name order by score desc) as key2

    from

        score_test LATERAL VIEW explode(scores) adTable AS subject, score

) as a

group by a.name

having bad_score > 0 and good_score > 0

结果：

+---------+--------------+------------+---------------+-------------+-------------+

| name    | bad_subject  | bad_score  | good_subject  | good_score  |  avg_score  |

+---------+--------------+------------+---------------+-------------+-------------+

| 张三     | 历史         | 77         | 地理           | 92          |     83.56   |

| 朱六     | 语文         | 73         | 生物           | 90          |     79.89   |

| 李四     | 历史         | 65         | 数学           | 84          |     74.44   |

| 段七     | 化学         | 69         | 物理           | 98          |     83.78   |

| 王五     | 物理         | 68         | 地理           | 95          |     82.22   |

| 钱二     | 语文         | 68         | 历史           | 97          |     82.00   |

+---------+--------------+------------+---------------+-------------+-------------+

一道hive面试题:explode map字段的更多相关文章

一道hive面试题（窗口函数）
表student中的数据格式如下: name month degree s1 201801 As1 201802 As1 201803 Cs1 201804 As1 201805 As1 201806 ...
Hive：map字段存储和取用 ( str_to_map函数 )
str_to_map(字符串参数, 分隔符1, 分隔符2) 使用两个分隔符将文本拆分为键值对. 分隔符1将文本分成K-V对,分隔符2分割每个K-V对.对于分隔符1默认分隔符是 ',',对于分隔符2默认 ...
Hive表种map字段的查询取用
建表可以用 map<string,string> 查询时可以按照 aaa[bbb], aaa 是map字段名,bbb是其中的参数名,就可以取到这个参数的值了当参数名bbb是string时 ...
【转】hive优化之--控制hive任务中的map数和reduce数
一. 控制hive任务中的map数: 1. 通常情况下,作业会通过input的目录产生一个或者多个map任务. 主要的决定因素有: input的文件总个数,input的文件大小,集群设置 ...
hive优化之------控制hive任务中的map数和reduce数
一. 控制hive任务中的map数: 1. 通常情况下,作业会通过input的目录产生一个或者多个map任务. 主要的决定因素有: input的文件总个数,input的文件大小,集群设置的 ...
一道sql面试题（查询语句）
一道sql面试题(查询语句) id name age 1 a 11 2 b 11 3 c 12 4 d 13 5 e ...
hive优化之——控制hive任务中的map数和reduce数
一. 控制hive任务中的map数: 1. 通常情况下,作业会通过input的目录产生一个或者多个map任务.主要的决定因素有: input的文件总个数,input的文件大小,集群设置的文 ...
Hive任务优化--控制hive任务中的map数和reduce数
一. 控制hive任务中的map数: 1. 通常情况下,作业会通过input的目录产生一个或者多个map任务.主要的决定因素有: input的文件总个数,input的文件大小,集群设置的文 ...
hive优化，控制map、reduce数量
一.调整hive作业中的map数 1.通常情况下,作业会通过input的目录产生一个或者多个map任务.主要的决定因素有: input的文件总个数,input的文件大小,集群设置的文件块大小(目前为1 ...

随机推荐

mysql资源地址
http://ftp.ntu.edu.tw/MySQL/Downloads/MySQL-5.7/
database design three form
https://www.cnblogs.com/linjiqin/archive/2012/04/01/2428695.html
ZT android -- 蓝牙 bluetooth （四）OPP文件传输
android -- 蓝牙 bluetooth (四)OPP文件传输分类: Android的原生应用分析 2013-06-22 21:51 2599人阅读评论(19) 收藏举报 4.2源码AND ...
[BZOJ 2322][BeiJing2011]梦想封印
梦想封印题意原题面: Problem 2322. -- [BeiJing2011]梦想封印 2322: [BeiJing2011]梦想封印 Time Limit: 20 Sec Memory L ...
对volatile不具有原子性的理解
在阅读多线程书籍的时候,对volatile的原子性产生了疑问,问题类似于这篇文章所阐述的那样.经过一番思考给出自己的理解. 我们知道对于可见性,Java提供了volatile关键字来保证可见性.有序性 ...
linux性能系列--cpu
一.先看看什么是CPU? 回答:中央处理器(Central Processing Unit)的缩写,即CPU,CPU是电脑中的核心配件,只有火柴盒那么大,几十张纸那么厚,但它却是一台计算机的运算核心和 ...
JavaScript 数组遍历方法的对比
JavaScript 发展至今已经发展出多种数组的循环遍历的方法,不同的遍历方法运行起来那个比较快,不同循环方法使用在那些场景,下面将进行比较: 各种数组遍历的方法 for 语句 ,,,] , len ...
css3优惠券
<!DOCTYPE HTML> <html> <head> <meta charset="UTF-8" /> <title&g ...
编程算法 - 数字在排序数组中出现的次数代码(C)
版权声明:本文为博主原创文章,未经博主同意不得转载. https://blog.csdn.net/u012515223/article/details/36869869 数字在排序数组中出现的次数代 ...
selenium + python自动化测试unittest框架学习（二）
1.unittest单元测试框架文件结构 unittest是python单元测试框架之一,unittest测试框架的主要文件结构: File >report >all_case.py &g ...

一道hive面试题:explode map字段

一道hive面试题:explode map字段的更多相关文章

随机推荐

热门专题