综合练习:学生课程分数

网盘下载sc.txt文件,分别创建RDD、DataFrame和临时表/视图;

分别用RDD操作、DataFrame操作和spark.sql执行SQL语句实现以下数据分析:

  1. 总共有多少学生?

  2. 总共开设了多少门课程?

  3. 每个学生选修了多少门课?

  4. 每门课程有多少个学生选?

  5. 每门课程>95分的学生人数
  6. 课程'Python'有多少个100分?

  7. Tom选修了几门课?每门课多少分?

  8. Tom的成绩按分数大小排序。

  9. Tom选修了哪几门课?

  10. Tom的平均分。

  11. 'OperatingSystem'不及格人数

  12. 'OperatingSystem'平均分

  13. 'OperatingSystem'90分以上人数

  14. 'OperatingSystem'前3名

  15. 每个分数按比例+20平时分。

  16. 求每门课的平均分

  17. 选修了7门课的有多少个学生?

  18. 每门课大于95分的学生数

  19. 每门课的选修人数、平均分、不及格人数、通过率
  20. 优秀、良好、通过和不合格各有多少人?
  21. 同时选修了DataStructure和 DataBase 的学生
  22. 选修了DataStructure 但没有选修 DataBase 的学生
  23. 选修课程数少于3门的同学
  24. 选修6门及以上课程数的同学
  25. 查询平均成绩大于等于60分的姓名和平均成绩
  26. 找出平均分最高的10位同学

RDD操作

1、总共有多少学生?

2、总共开设了多少门课程?

3、每个学生选修了多少门课?

4、每门课程有多少个学生选?

5、每门课程>95分的学生人数

6、课程'Python'有多少个100分?

7、Tom选修了几门课?每门课多少分?

8、Tom的成绩按分数大小排序。

9、Tom选修了哪几门课?

10、Tom的平均分。

11、'OperatingSystem'不及格人数

12、'OperatingSystem'平均分

13、'OperatingSystem'90分以上人数

14、'OperatingSystem'前3名

15、每个分数按比例+20平时分。

16、求每门课的平均分

17、选修了7门课的有多少个学生?

18、每门课大于95分的学生数

19、每门课的选修人数、平均分、不及格人数、通过率

20、优秀、良好、通过和不合格各有多少人?

21、同时选修了DataStructure和 DataBase 的学生

22、选修了DataStructure 但没有选修 DataBase 的学生

23、选修课程数少于3门的同学

24、选修6门及以上课程数的同学

25、查询平均成绩大于等于60分的姓名和平均成绩

26、找出平均分最高的10位同学

DataFrame操作

1、总共有多少学生?

2、总共开设了多少门课程?

3、每个学生选修了多少门课?

4、每门课程有多少个学生选?

5、每门课程>95分的学生人数

6、课程'Python'有多少个100分?

7、Tom选修了几门课?每门课多少分?

8、Tom的成绩按分数大小排序。

9、Tom选修了哪几门课?

10、Tom的平均分。

11、'OperatingSystem'不及格人数

12、'OperatingSystem'平均分

13、'OperatingSystem'90分以上人数

14、'OperatingSystem'前3名

15、每个分数按比例+20平时分。

16、求每门课的平均分

17、选修了7门课的有多少个学生?

18、每门课大于95分的学生数

19、每门课的选修人数、平均分、不及格人数、通过率

20、优秀、良好、通过和不合格各有多少人?

21、同时选修了DataStructure和 DataBase 的学生

22、选修了DataStructure 但没有选修 DataBase 的学生

23、选修课程数少于3门的同学

24、选修6门及以上课程数的同学

25、查询平均成绩大于等于60分的姓名和平均成绩

26、找出平均分最高的10位同学

spark.sql执行SQL语句操作

创造临时表

1、总共有多少学生?

2、总共开设了多少门课程?

3、每个学生选修了多少门课?

4、每门课程有多少个学生选?

5、每门课程>95分的学生人数

6、课程'Python'有多少个100分?

7、Tom选修了几门课?每门课多少分?

8、Tom的成绩按分数大小排序。

9、Tom选修了哪几门课?

10、Tom的平均分。

11、'OperatingSystem'不及格人数

12、'OperatingSystem'平均分

13、'OperatingSystem'90分以上人数

14、'OperatingSystem'前3名

15、每个分数按比例+20平时分。

16、求每门课的平均分

17、选修了7门课的有多少个学生?

18、每门课大于95分的学生数

19、每门课的选修人数、平均分、不及格人数、通过率

20、优秀、良好、通过和不合格各有多少人?

21、同时选修了DataStructure和 DataBase 的学生

22、选修了DataStructure 但没有选修 DataBase 的学生

23、选修课程数少于3门的同学

24、选修6门及以上课程数的同学

25、查询平均成绩大于等于60分的姓名和平均成绩

26、找出平均分最高的10位同学

8. SparkSQL综合作业的更多相关文章

  1. 【爬虫综合作业】猫眼电影TOP100分析

    作业的要求来自于:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE2/homework/3075 一.爬虫对象 猫眼电影TOP100排行榜 二.代码如下 im ...

  2. python综合作业要求

    要求: 1.课程成绩数据(学号尾数为0,1同学完成) 至少要完成内容:分析每年不同班级平均成绩情况.不同年份总体平均成绩情况.不同性别学生成绩情况,并用一定图表展示. 2.集美大学各省录取分数数据(学 ...

  3. 大数据应用期末总评Hadoop综合大作业

    作业要求来源于:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE2/homework/3339 1.将爬虫大作业产生的csv文件上传到HDFS 此次作业选取的 ...

  4. C语言博客作业--结构体,文件

    1.本章学习总结(2分) 1.1 学习内容总结 (1)结构体如何定义.成员如何赋值 结构体的一般形式为:      struct  结构体名     {      数据类型 成员名1:      数据 ...

  5. C博客作业03——函数

    0.展示PTA总分 截图展示: 1.本章学习总结 1.1学习内容总结 (a)函数的定义 1)函数是一个完成特定工作的独立程序模块,包括库函数和自定义函数两种,scanf(),printf()等为库函数 ...

  6. day11 本日作业+周末作业

    目录 一.今日作业 1.编写文件copy工具 2.编写登录程序,账号密码来自于文件 3.编写注册程序,账号密码来存入文件 二.周末综合作业: 1.编写用户登录接口 2.编写程序实现用户注册后,可以登录 ...

  7. 现在开始(Do It Now)

    现在开始(Do It Now) 很多年前读大学的时候,我决定制定一个计划挑战自己:只用三个学期完成其他人通常花费四年的课程,能否毕业.这篇文章(此文为翻译)详细的说明了我在成功实现该目标过程中的所有时 ...

  8. lingo运筹学上机实验指导

    <运筹学上机实验指导>分为两个部分,第一部分12学时,是与运筹学理论课上机同步配套的4个实验(线性规划.灵敏度分析.运输问题与指派问题.最短路问题和背包问题)的Excel.LONGO和LI ...

  9. 接着继续(OO博客第四弹)

    .测试与JSF正确性论证 测试和JSF正确性论证是对一个程序进行检验的两种方式.测试是来的最直接的,输入合法的输入给出正确的提示,输入非法的输入给出错误信息反馈,直接就能很容易的了解程序的运行情况.但 ...

随机推荐

  1. 通过实例程序验证与优化谈谈网上很多对于Java DCL的一些误解以及为何要理解Java内存模型

    个人创作公约:本人声明创作的所有文章皆为自己原创,如果有参考任何文章的地方,会标注出来,如果有疏漏,欢迎大家批判.如果大家发现网上有抄袭本文章的,欢迎举报,并且积极向这个 github 仓库 提交 i ...

  2. python学习-Day9

    目录 记忆不清点回顾 今日概要 今日内容 大作业讲解 字符编码实际应用 编码与解码 如何解决乱码的问题 文件操作简介 什么是文件 代码操作文件 代码操作文件的流程 基本语法结构 使用关键字打开文件 w ...

  3. 标准输入输出() & 打印流 &配置文件

    public static void main(String[] args) { //System 类 的 public final static InputStream in = null; // ...

  4. R 数据可视化: PCA 主成分分析图

    简介 主成分分析(Principal Component Analysis,PCA)是一种无监督的数据降维方法,通过主成分分析可以尽可能保留下具备区分性的低维数据特征.主成分分析图能帮助我们直观地感受 ...

  5. C++实例2--职工管理系统

    职工管理系统 1.  头文件 1.1 workerManager.h 系统类 1 #pragma once // 防止头文件重复包含 2 #include<iostream> // 包含输 ...

  6. XPath语法和lxml模块

    XPath语法和lxml模块 什么是XPath? xpath(XML Path Language)是一门在XML和HTML文档中查找信息的语言,可用来在XML和HTML文档中对元素和属性进行遍历. X ...

  7. MySQL存储过程入门了解

    0.环境说明: mysql版本:5.7 1.使用说明 ​ 存储过程是数据库的一个重要的对象,可以封装SQL语句集,可以用来完成一些较复杂的业务逻辑,并且可以入参出参(类似于java中的方法的书写). ...

  8. 玩转ASP.NET 6.0框架-序言

    ASP.NET Core是微软提供的强大的web框架,它有很多潜在的强大而有用的功能. 本专栏的目标是帮助您把框架的隐藏能力最大限度地发挥出来,让您能够按需定制ASP NET Core框架.本专栏提供 ...

  9. Spring Security之用户名+密码登录

    自定义用户认证逻辑 处理用户信息获取逻辑 实现UserDetailsService接口 @Service public class MyUserDetailsService implements Us ...

  10. monit 配置详解(monitrc)

    monitrc是Monit的主配置文件(控制文件). monitrc的内容主要分为全局(golbal)和服务(services)两个部分. 默认情况下monitrc文件在/etc/monit目录下. ...