1. 数据说明

(1) student表

hive> select * from student;

# 学生ID    学生姓名     性别    年龄    所在系
# sid sname sex age dept
95002 Aiden female 19 IS
95017 Jacob female 18 IS
95018 Ethan female 19 IS
95013 Matthew male 21 CS
95014 Nicholas female 19 CS
......

(2) course表

hive> select * from course;

# 课程ID    课程名称
# cid cname
1 Chinese
2 Math
3 English
4 Physics
5 Chemistry
6 Biology

(3) sc表

hive> select * from sc;

# 学生ID    课程ID  成绩
# sid cid score
95001 1 81
95001 2 85
95001 3 88
95001 4 70
95002 2 90
......

2. SQL查询练习题目

(1) 基本练习

<1> 查询全体学生的学号与姓名

select sid, sname from student;

<2> 查询选修了课程的学生姓名

select distinct sid from sc;

(2) hive的group by和集合函数

<1> 查询学生的总人数

select count(*) from student;

<2> 计算1号课程的学生平均成绩

select cid, avg(score) from sc
where cid = '1'
group by cid;

<3> 查询各科成绩平均分

select c.cname, tmp.avg_score from
course c join
(select cid, avg(score) avg_score from sc
group by cid) tmp
on c.cid = tmp.cid; /*
Chinese 83.66666666666667
Math 88.66666666666667
English 81.46153846153847
Physics 83.125
Chemistry 85.0
Biology 89.45454545454545
*/

<4> 查询1号课程的最高分数

select cid, max(score) max_score from sc
where cid = '1'
group by cid; /*
1 98
*/

<5> 求各个课程号及相应的选课人数

select cid, count(distinct sid) count_sid from sc
group by cid; /*
1 15
2 15
3 13
4 16
5 12
6 11
*/

<6> 查询选修了3门以上的课程的学生学号

select sid, count(distinct cid) count_cid from sc
group by sid
having count_cid > 3; /*
95001 4
95002 4
95004 4
95005 4
95006 6
95007 4
95011 4
95012 4
95013 4
95015 4
95018 4
95019 5
95022 4
*/

(3) hive的order by/sort by/distribute by

<1> 查询学生信息,结果按学号全局有序

select * from student
order by sid;

<2> 查询学生信息,结果区分性别按年龄有序

set mapred.reduce.tasks=2;(默认-1)

select * from student
distribute by sex
sort by age; /*
95009 Alexande female 18 MA
95017 Jacob female 18 IS
95008 Zachary female 18 CS
95014 Nicholas female 19 CS
95019 Jack female 19 IS
95018 Ethan female 19 IS
95002 Aiden female 19 IS
95007 Jaden female 19 MA
95012 Andrew female 20 CS
95003 Michael female 22 MA
95021 Connor male 17 MA
95005 Tyler male 18 MA
95011 Noah male 18 MA
95015 Jackson male 18 MA
95010 Caden male 19 CS
95004 Ryan male 19 IS
95022 Logan male 20 MA
95001 Caleb male 20 CS
95020 Joshua male 21 IS
95013 Matthew male 21 CS
95016 Brayden male 21 MA
95006 Dylan male 23 CS
*/

(4) join查询

<1> 查询每个学生及其选修课程的情况

select s.sname, c.cname from
student s join sc on s.sid = sc.sid
join course c on c.cid = sc.cid; /*
Caleb Chinese
Caleb Math
Caleb English
Caleb Physics
Aiden Math
Aiden English
Aiden Physics
Aiden Chemistry
Michael Chinese
Michael English
......
*/

<2> 查询学生的得分情况

select s.sname, c.cname, sc.score from
student s join sc on s.sid = sc.sid
join course c on c.cid = sc.cid; /*
Noah Chinese 81
Noah Math 91
Noah English 81
Noah Physics 86
Andrew Chinese 81
Andrew English 78
Andrew Physics 85
Andrew Biology 98
......
*/

<3> 查询选修2号课程且成绩在90分以上的所有学生

select s.sname, sc.cid, sc.score from
student s join sc on s.sid = sc.sid
where sc.cid = '2' and sc.score > 90; /*
Ryan 2 92
Tyler 2 92
Caden 2 98
Noah 2 91
Nicholas 2 100
Brayden 2 99
Ethan 2 100
Joshua 2 99
Connor 2 93
*/

<4> 查询所有学生的信息,如果在成绩表中有成绩,则输出成绩表中的课程号

select s.*, sc.cid from
student s left join sc
on s.sid = sc.sid; /*
......
95015 Jackson male 18 MA 1
95015 Jackson male 18 MA 3
95015 Jackson male 18 MA 4
95015 Jackson male 18 MA 6
95016 Brayden male 21 MA 1
95016 Brayden male 21 MA 2
95016 Brayden male 21 MA 4
*/

(5) LEFT SEMI JOIN

查询与"Jackson"在同一个系学习的学生

select student.sname, student.dept from student left semi join
(select dept from student where sname = 'Jackson') tmp
on student.dept = tmp.dept; /*
Michael MA
Tyler MA
Jaden MA
Connor MA
Logan MA
Noah MA
Alexande MA
Jackson MA
Brayden MA
*/

Hive案例05-学生成绩表综合案例的更多相关文章

  1. hive学习04-员工部门表综合案例

    知识点: 格式转换:cast(xxx as int) 按某列分桶某列排序,排序后打标机:例如:求每个地区工资最高的那个人的信息: ROW_NUMBER() OVER(PARTITION BY COLU ...

  2. 101 01 Android 零基础入门 02 Java面向对象 03 综合案例(学生信息管理) 02 案例分析及实现 05 通过方法实现学生类与专业类关联——方案二

    101 01 Android 零基础入门 02 Java面向对象 03 综合案例(学生信息管理) 02 案例分析及实现 05 通过方法实现学生类与专业类关联--方案二 本文知识点:通过方法实现学生类与 ...

  3. 098 01 Android 零基础入门 02 Java面向对象 03 综合案例(学生信息管理) 02 案例分析及实现 02 编写并测试Subject类

    098 01 Android 零基础入门 02 Java面向对象 03 综合案例(学生信息管理) 02 案例分析及实现 02 编写并测试Subject类 本文知识点:编写并测试Subject类 说明: ...

  4. 099 01 Android 零基础入门 02 Java面向对象 03 综合案例(学生信息管理) 02 案例分析及实现 03 编写并测试Student类

    099 01 Android 零基础入门 02 Java面向对象 03 综合案例(学生信息管理) 02 案例分析及实现 03 编写并测试Student类 本文知识点:编写并测试Subject类 说明: ...

  5. 学生表sid,sname,结果表cid,cname,学生成绩表sid,cid,cscore,最高要求的分数输出候补课程专门命名

    --1.建表SQL: --学生表: -- Createtable createtable STUDENT ( SID   NUMBERnotnull, SNAME NVARCHAR2) ) table ...

  6. mysql经典面试题之学生成绩表

    需要数据库表1.学生表 Student(SID,Sname,Sage,Ssex) --SID 学生编号,Sname 学生姓名,Sage 出生年月,Ssex 学生性别 2.课程表 Course(CID, ...

  7. MapReduce:汇总学生表和成绩表为----学生成绩表

    已知两张数据表,其中表一存储的是学生编号.学生姓名:表二存储的是学生编号.考试科目.考试成绩:编写mapreduce程序,汇总两张表数据为一张统一表格. 表一: A001 zhangsan A002 ...

  8. 069 01 Android 零基础入门 01 Java基础语法 09 综合案例-数组移位 01 综合案例-数组移位-案例需求

    069 01 Android 零基础入门 01 Java基础语法 09 综合案例-数组移位 01 综合案例-数组移位-案例需求 本文知识点:综合案例-数组移位-案例需求 说明:因为时间紧张,本人写博客 ...

  9. 032 01 Android 零基础入门 01 Java基础语法 03 Java运算符 12 运算符和if-else条件语句的综合案例——闰年问题

    032 01 Android 零基础入门 01 Java基础语法 03 Java运算符 12 运算符和if-else条件语句的综合案例--闰年问题 本文知识点:运算符和if-else条件语句的综合案例 ...

随机推荐

  1. Eclipse进行远程调试(Tomcat远程调试)

    1.配置tomcat Linxu系统: tomcat/bin/catalina.sh或者startup.sh开始处中增加如下内容: declare -x CATALINA_OPTS="-Xd ...

  2. git cmd 命令在已有的仓库重新添加新的文件夹

    正确步骤: 1. git init //初始化仓库 git add .(文件name) //添加文件到本地仓库 git commit -m “first commit” //添加文件描述信息 git ...

  3. Spring之AOP由浅入深

    1.AOP的作用 在OOP中,正是这种分散在各处且与对象核心功能无关的代码(横切代码)的存在,使得模块复用难度增加.AOP则将封装好的对象剖开,找出其中对多个对象产生影响的公共行为,并将其封装为一个可 ...

  4. Lambda表达式where过滤数据

    使用Lambda的表达式来过滤符合条件的数据.下面的代码实现,是把字符阵列中,把名字长度等于3元素找出来. class Bv { public void LambdaExpression() { st ...

  5. 关于Runtime.getRuntime().exec()产生阻塞的2个陷阱

    本文来自网易云社区 背景 相信做java服务端开发的童鞋,经常会遇到Java应用调用外部命令启动一些新进程来执行一些操作的场景,这时候就会使用到Runtime.getRuntime().exec(), ...

  6. [CocoaPods]CocoaPods安装详解

    安装CocoaPods之前先安装ruby: 1.安装ruby ruby官网rubygems.org已被屏蔽,替换当前镜像是否为国内镜像. $gem sources --add https://gems ...

  7. 多个git使用的 ssh key共存

    ssh-keygen -t rsa -C "ljkj028@qq.com" 不要一直回车,指定密钥为 id_rsa_ljkj 默认为(id_rsa) 同理 创建其他密钥 打开ssh ...

  8. Shell - Shell脚本调试方法

    Shell脚本调试选项 Shell本身提供一些调试方法选项: -n,读一遍脚本中的命令但不执行,用于检查脚本中的语法错误. -v,一边执行脚本,一边将执行过的脚本命令打印到标准输出. -x,提供跟踪执 ...

  9. LeetCode--No.002 Add Two Numbers

    Add Two Numbers Total Accepted: 160702 Total Submissions: 664770 Difficulty: Medium You are given tw ...

  10. UML类图中的六种关系(物理设计阶段)

    UML类图中经常会用到各种箭头和线条来表示不同类或者接口之间的关系,因此非常好的理解各个图标的含义是很有必要的. 在物理设计阶段可以通过EA工具将类图搭建好,然后直接生成物理类,这样也可以减少物理设计 ...