Spark练习之Transformation操作开发

/**

     * map算子：将集合中的每一个元素都乘以2

     */

    private static void map() {

        //创建SparkConf

        SparkConf conf = new SparkConf()

                .setAppName("map")

                .setMaster("local");

        //创建JavaSparkContext

        JavaSparkContext sc = new JavaSparkContext(conf);

        //构造集合

        List<Integer> numbers = Arrays.asList(1, 2, 3, 4, 5);

        //并行化集合，创建初始RDD

        JavaRDD<Integer> numberRDD = sc.parallelize(numbers);

        //使用map算子，将集合中的每个元素都乘以2

        //map算子，是对任何类型的RDD，都可以调用的

        //在Java中，map算子接收的参数时Function对象

        //创建的Function对象，一定会让你设置第二个泛型参数，这个泛型参数，就是返回的新元素的类型

        //同时call()方法的返回类型，也必须与第二个泛型类型同步

        //在call()方法内部，就可以对原始RDD中的每一个元素进行各种处理和计算，并返回一个新的元素

        //所有新的元素就会组成一个新的RDD

        JavaRDD<Integer> multipleNUmberRDD = numberRDD.map(new Function<Integer, Integer>() {

            private static final long serivalVersionUID = 1L;

            //传入call方法的，是1,2,3,4,5

            //返回的就是2,4,6,8,10

            @Override

            public Integer call(Integer integer) throws Exception {

                return integer * 2;

            }

        });

        //打印新的RDD

        multipleNUmberRDD.foreach(new VoidFunction<Integer>() {

            private static final long serivalVersionUID = 1L;

            @Override

            public void call(Integer integer) throws Exception {

                System.out.println(integer);

            }

        });

        //关闭JavaSparkContext

        sc.close();

    }

1.2 Scala

def map(): Unit = {

    val conf = new SparkConf().setAppName("map").setMaster("local")

    val sc = new SparkContext(conf)

    val numbers = Array(1, 2, 3, 4, 5)

    val numberRDD = sc.parallelize(numbers, 1)

    val multipleNumberRDD = numberRDD.map(num => num * 2)

    multipleNumberRDD.foreach(num => println(num))

  }

二、filter：过滤出集合中的偶数

2.1 Java

/**

     * filter算子：过滤集合中的偶数

     */

    private static void filter() {

        //创建SparkConf

        SparkConf conf = new SparkConf()

                .setAppName("map")

                .setMaster("local");

        //创建JavaSparkContext

        JavaSparkContext sc = new JavaSparkContext(conf);

        //构造集合

        List<Integer> numbers = Arrays.asList(1, 2, 3, 4, 5, 6, 7, 8, 9, 10);

        //并行化集合，创建初始RDD

        JavaRDD<Integer> numberRDD = sc.parallelize(numbers);

        //对初始化RDD执行filter算子，过滤出其中的偶数

        //filter算子操作，传入的也是Function，其他的使用注意点，和map是一样的

        //但是，唯一的不同，就是call()方法的返回类型是Boolean

        //每一个初始RDD中的元素，都会传入call()方法，此时你可以执行各种自定义的计算逻辑

        //来判断这个元素是否是你想要的

        //如果想在新的RDD中保留这个元素，那么就返回true，否则，返回false

        JavaRDD<Integer> evenNumberRDD = numberRDD.filter(new Function<Integer, Boolean>() {

            private static final long serivalVersionUID = 1L;

            //传入call方法的，是1,2,3,4,5

            //返回的就是2,4,6,8,10

            @Override

            public Boolean call(Integer integer) throws Exception {

                return integer % 2 == 0;

            }

        });

        //打印新的RDD

        evenNumberRDD.foreach(new VoidFunction<Integer>() {

            private static final long serivalVersionUID = 1L;

            @Override

            public void call(Integer integer) throws Exception {

                System.out.println(integer);

            }

        });

        //关闭JavaSparkContext

        sc.close();

    }

2.2 Scala

def filter(): Unit = {

    val conf = new SparkConf().setAppName("filter").setMaster("local")

    val sc = new SparkContext(conf)

    val numbers = Array(1, 2, 3, 4, 5, 6, 7, 8, 9, 10)

    val numberRDD = sc.parallelize(numbers, 1)

    val multipleNumberRDD = numberRDD.filter(num => num % 2 == 0)

    multipleNumberRDD.foreach(num => println(num))

  }

三、flatMap：将行拆分为单词

3.1 Java

/**

     * flatMap算子：过滤集合中的偶数

     */

    private static void flatMap() {

        //创建SparkConf

        SparkConf conf = new SparkConf()

                .setAppName("flatMap")

                .setMaster("local");

        //创建JavaSparkContext

        JavaSparkContext sc = new JavaSparkContext(conf);

        //构造集合

        List<String> lineList = Arrays.asList("hello you", "hello me", "hello world");

        //并行化集合，创建初始RDD

        JavaRDD<String> lines = sc.parallelize(lineList);

        //对初始化RDD执行flatMap算子，将每一行文本，拆分为多个单词

        //flatMap算子，在Java中，接收的参数的FlagMapFunction

        //需要自定义FlatMapFunction的第二个泛型类型，即代表了返回的新元素的类型

        //call()方法，返回的类型，不是U，而是Iterable<U>，这里的U也与第二个泛型类型相同

        //flatMap其实就是，接收原始RDD中的每个元素，并进行各种逻辑的计算和处理，返回可以返回多个元素

        //多个元素，即封装在Iterator集合中，可以使用ArrayList等集合

        JavaRDD<String> words = lines.flatMap(new FlatMapFunction<String, String>() {

            private static final long serivalVersionUID = 1L;

            @Override

            public Iterator<String> call(String s) throws Exception {

                return (Iterator<String>) Arrays.asList(s.split(" "));

            }

        });

        //打印新的RDD

        words.foreach(new VoidFunction<String>() {

            private static final long serivalVersionUID = 1L;

            @Override

            public void call(String t) throws Exception {

                System.out.println(t);

            }

        });

        //关闭JavaSparkContext

        sc.close();

    }

3.2 Scala

 def flatMap(): Unit = {

    val conf = new SparkConf().setAppName("flatMap").setMaster("local")

    val sc = new SparkContext(conf)

    val lineArray = Array("hello you", "hello me", "hello world")

    val lines = sc.parallelize(lineArray, 1)

    val words = lines.flatMap(line => line.split(" "))

    words.foreach(word => println(word))

  }

四、groupByKey：将每个班级的成绩进行分组

4.1 Java

/**

     * groupNyKey算子：按照班级对成绩进行分组

     */

    private static void groupByKey() {

        //创建SparkConf

        SparkConf conf = new SparkConf()

                .setAppName("groupByKey")

                .setMaster("local");

        //创建JavaSparkContext

        JavaSparkContext sc = new JavaSparkContext(conf);

        //构造集合

        List<Tuple2<String, Integer>> scoresList = Arrays.asList(

                new Tuple2<>("class1", 80),

                new Tuple2<>("class2", 88),

                new Tuple2<>("class1", 80),

                new Tuple2<>("class2", 90));

        //并行化集合，创建JavaPairRDD

        JavaPairRDD<String, Integer> scores = sc.<String, Integer>parallelizePairs(scoresList);

        //针对Scores RDD，执行groupByKey算子，对每个班级的成绩进行分组

        //groupByKey算子，返回的还是JavaPairRDD

        //但是，JavaPairRDD的第一个泛型类型不变，第二个泛型类型会变成Iterable这种集合类型

        //也就是说，按照了Key进行分组，每个key可能都会有多个value，此时多个value聚合成了Iterable

        //那么接下来，就可以通过groupedScores这种JavaPairRDD处理某个分组内的数据

        JavaPairRDD<String, Iterable<Integer>> groupEdScores = scores.groupByKey();

        //打印groupedScores RDD

        groupEdScores.foreach(new VoidFunction<Tuple2<String, Iterable<Integer>>>() {

            private static final long serivalVersionUID = 1L;

            //对每个key，都会将其value，依次传入call方法

            //从而聚合出每个key对应的一个value

            //然后，将每个key对应的一个value，组合成一个Tuple2,作为新RDD的元素

            @Override

            public void call(Tuple2<String, Iterable<Integer>> stringIterableTuple2) throws Exception {

                System.out.println("class：" + stringIterableTuple2._1);

                Iterator<Integer> ite = stringIterableTuple2._2.iterator();

                while (ite.hasNext()) {

                    System.out.println(ite.next());

                }

                System.out.println("====================================");

            }

        });

        //关闭JavaSparkContext

        sc.close();

    }

2.2 Scala

def groupByKey(): Unit = {

    val conf = new SparkConf().setAppName("groupByKey").setMaster("local")

    val sc = new SparkContext(conf)

    val scoreList = Array(new Tuple2[String, Integer]("class1", 80),

      new Tuple2[String, Integer]("class2", 88),

      new Tuple2[String, Integer]("class1", 80),

      new Tuple2[String, Integer]("class2", 90))

    val scores = sc.parallelize(scoreList, 1)

    val groupedScores = scores.groupByKey()

    groupedScores.foreach(

      score => {

        println(score._1)

        score._2.foreach(singleScore => println(singleScore))

        println("===========")

      }

    )

  }

五、reduceByKey：统计每个班级的总分

5.1 Java

/**

     * reduceNyKey算子：统计每个班级的总分

     */

    private static void reduceNyKey() {

        //创建SparkConf

        SparkConf conf = new SparkConf()

                .setAppName("reduceNyKey")

                .setMaster("local");

        //创建JavaSparkContext

        JavaSparkContext sc = new JavaSparkContext(conf);

        //构造集合

        List<Tuple2<String, Integer>> scoresList = Arrays.asList(

                new Tuple2<>("class1", 80),

                new Tuple2<>("class2", 88),

                new Tuple2<>("class1", 80),

                new Tuple2<>("class2", 90));

        //并行化集合，创建JavaPairRDD

        JavaPairRDD<String, Integer> scores = sc.<String, Integer>parallelizePairs(scoresList);

        //针对Scores RDD，执行reduceByKey算子

        //reduceByKey，接收的参数时Function2类型，它有三个泛型参数，实际上代表了3个值

        //第一个泛型类型和第二个泛型类型，代表了原始RDD中的元素的value的类型

        //因此对每个key进行reduce，都会依次将第一个、第二个value传入，将值再与第三个value传入

        //因此此处，会自动定义两个泛型类型，代表call()方法的两个传入参数的类型

        //第三个泛型类型，代表了每次reduce操作返回的值的类型，默认也是与原始RDD的value类型相同的

        //reduceByKey算子返回的RDD，还是JavaPairRDD<key,value>

        JavaPairRDD<String, Integer> totalScores = scores.reduceByKey(new Function2<Integer, Integer, Integer>() {

            private static final long serivalVersionUID = 1L;

            @Override

            public Integer call(Integer v1, Integer v2) throws Exception {

                return v1 + v2;

            }

        });

        //打印totalScore RDD

        //打印groupedScores RDD

        totalScores.foreach(new VoidFunction<Tuple2<String, Integer>>() {

            private static final long serivalVersionUID = 1L;

            @Override

            public void call(Tuple2<String, Integer> t) throws Exception {

                System.out.println(t._1 + ":" + t._2);

            }

        });

        //关闭JavaSparkContext

        sc.close();

    }

5.2 Scala

def reduceByKey(): Unit = {

    val conf = new SparkConf().setAppName("reduceByKey").setMaster("local")

    val sc = new SparkContext(conf)

    val scoreList = Array(new Tuple2[String, Integer]("class1", 80),

      new Tuple2[String, Integer]("class2", 88),

      new Tuple2[String, Integer]("class1", 80),

      new Tuple2[String, Integer]("class2", 90))

    val scores = sc.parallelize(scoreList, 1)

    val totalScores = scores.reduceByKey(_ + _)

    totalScores.foreach(classScore => println(classScore._1 + ":" + classScore._2))

  }

六、sortByKey：将学生分数进行排序

6.1 Java

/**

     * sortByKey算子：按照学生分数进行排序

     */

    private static void sortByKey() {

        //创建SparkConf

        SparkConf conf = new SparkConf()

                .setAppName("sortByKey")

                .setMaster("local");

        //创建JavaSparkContext

        JavaSparkContext sc = new JavaSparkContext(conf);

        //构造集合

        List<Tuple2<Integer, String>> scoresList = Arrays.asList(

                new Tuple2<>(65, "leo"),

                new Tuple2<>(60, "tom"),

                new Tuple2<>(90, "marry"),

                new Tuple2<>(88, "jack"));

        //并行化集合，创建JavaPairRDD

        JavaPairRDD<Integer, String> scores = sc.<Integer, String>parallelizePairs(scoresList);

        //对scoreRDD执行sortByKey算子

        //sortByKey其实就是根据key进行排序，可以手动指定升序，或者降序

        //返回的，还是JavaPairRDD，其中的元素内容和原始的RDD一样

        //只是RDD中的元素顺序不同了

        JavaPairRDD<Integer, String> sortedScored = scores.sortByKey();

        //打印sortedScored RDD

        sortedScored.foreach(new VoidFunction<Tuple2<Integer, String>>() {

            private static final long serivalVersionUID = 1L;

            @Override

            public void call(Tuple2<Integer, String> t) throws Exception {

                System.out.println(t._1 + "：" + t._2);

            }

        });

        //关闭JavaSparkContext

        sc.close();

    }

6.2 Scala

def sortByKey(): Unit = {

    val conf = new SparkConf().setAppName("sortByKey").setMaster("local")

    val sc = new SparkContext(conf)

    val scoreList = Array(new Tuple2[Integer, String](90, "cat"),

      new Tuple2[Integer, String](80, "leo"),

      new Tuple2[Integer, String](80, "opp"),

      new Tuple2[Integer, String](55, "lll"))

    val scores = sc.parallelize(scoreList, 1)

    val totalScores = scores.sortByKey()

    totalScores.foreach(studentScore => println(studentScore._1 + ":" + studentScore._2))

  }

七、join：打印每个学生的成绩

7.1 Java

/**

     * join算子：打印学生成绩

     */

    private static void join() {

        //创建SparkConf

        SparkConf conf = new SparkConf()

                .setAppName("join")

                .setMaster("local");

        //创建JavaSparkContext

        JavaSparkContext sc = new JavaSparkContext(conf);

        //学生集合

        List<Tuple2<Integer, String>> studentList = Arrays.asList(

                new Tuple2<>(1, "leo"),

                new Tuple2<>(2, "tom"),

                new Tuple2<>(3, "marry"),

                new Tuple2<>(4, "jack"));

        //分数集合

        List<Tuple2<Integer, Integer>> scoreList = Arrays.asList(

                new Tuple2<>(1, 100),

                new Tuple2<>(2, 80),

                new Tuple2<>(3, 50),

                new Tuple2<>(4, 20));

        //并行化两个RDD

        JavaPairRDD<Integer, String> student = sc.<Integer, String>parallelizePairs(studentList);

        JavaPairRDD<Integer, Integer> scores = sc.<Integer, Integer>parallelizePairs(scoreList);

        //使用join算子关联两个RDD

        //join以后，还是会根据key进行join，并返回JavaPairRDD

        //但是JavaPairRDD的第一个泛型类型，之前两个JavaPairRDD的key类型，因为是通过key进行join的

        //第二个泛型类型，是Tuple2<v1,v2>的类型，Tuple2的两个反省分别为原始RDD的value的类型

        //join，就返回的RDD的每一个元素，就是通过Key join上的一个pair

        //比如有（1,1）（1,2）（1,3）的一个RDD和（1,4）（2,1）（2.2）的一个RDD

        //join以后，实际上会得到（1，（1,4））（1，（2,4））（1，（3,4））

        JavaPairRDD<Integer, Tuple2<String, Integer>> studentScores = student.<Integer>join(scores);

        //打印sortedScored RDD

        studentScores.foreach(new VoidFunction<Tuple2<Integer, Tuple2<String, Integer>>>() {

            @Override

            public void call(Tuple2<Integer, Tuple2<String, Integer>> t) throws Exception {

                System.out.println("student id：" + t._1);

                System.out.println("student name：" + t._2._1);

                System.out.println("student score：" + t._2._2);

                System.out.println("==============");

            }

        });

        //关闭JavaSparkContext

        sc.close();

    }

7.2 Scala

def join(): Unit = {

    val conf = new SparkConf().setAppName("join").setMaster("local")

    val sc = new SparkContext(conf)

    //学生集合

    val studentList = Array(

      new Tuple2[Integer, String](1, "leo"),

      new Tuple2[Integer, String](2, "tom"),

      new Tuple2[Integer, String](3, "marry"))

    //分数集合

    val scoreList = Array(

      new Tuple2[Integer, Integer](1, 100), new Tuple2[Integer, Integer](2, 80),

      new Tuple2[Integer, Integer](3, 50), new Tuple2[Integer, Integer](1, 70),

      new Tuple2[Integer, Integer](2, 10), new Tuple2[Integer, Integer](3, 40))

    val student = sc.parallelize(studentList)

    val scores = sc.parallelize(scoreList)

    val studentScores = student.join(scores)

    studentScores.foreach(studentScore => println({

      System.out.println("student id：" + studentScore._1)

      System.out.println("student name：" + studentScore._2._1)

      System.out.println("student score：" + studentScore._2._2)

      System.out.println("==============")

    }))

  }

八、cogroup：打印每个学生的成绩

8.1 Java

/**

     * cogroup算子：打印学生成绩

     */

    private static void cogroup() {

        //创建SparkConf

        SparkConf conf = new SparkConf()

                .setAppName("cogroup")

                .setMaster("local");

        //创建JavaSparkContext

        JavaSparkContext sc = new JavaSparkContext(conf);

        //学生集合

        List<Tuple2<Integer, String>> studentList = Arrays.asList(

                new Tuple2<>(1, "leo"),

                new Tuple2<>(2, "tom"),

                new Tuple2<>(3, "marry"));

        //分数集合

        List<Tuple2<Integer, Integer>> scoreList = Arrays.asList(

                new Tuple2<>(1, 100),

                new Tuple2<>(2, 80),

                new Tuple2<>(3, 50),

                new Tuple2<>(1, 70),

                new Tuple2<>(2, 10),

                new Tuple2<>(3, 40));

        //并行化两个RDD

        JavaPairRDD<Integer, String> student = sc.<Integer, String>parallelizePairs(studentList);

        JavaPairRDD<Integer, Integer> scores = sc.<Integer, Integer>parallelizePairs(scoreList);

        //cogroup与join不同

        //相当于是，一个key join上的所有value，都给放到一个Iterable里面去了

        JavaPairRDD<Integer, Tuple2<Iterable<String>, Iterable<Integer>>> studentScores = student.<Integer>cogroup(scores);

        //打印sortedScored RDD

        studentScores.foreach(new VoidFunction<Tuple2<Integer, Tuple2<Iterable<String>, Iterable<Integer>>>>() {

            @Override

            public void call(Tuple2<Integer, Tuple2<Iterable<String>, Iterable<Integer>>> t) throws Exception {

                System.out.println("student id：" + t._1);

                System.out.println("student name：" + t._2._1);

                System.out.println("student score：" + t._2._2);

                System.out.println("==============");

            }

        });

        //关闭JavaSparkContext

        sc.close();

    }

九、main函数

9.1 Java

public static void main(String[] args) {

        //map();

        //filter();

        //flatMap();

        //groupByKey();

        //reduceNyKey();

        //sortByKey();

        //join();

        cogroup();

    }

9.2 Scala

def main(args: Array[String]) {

    //map()

    //filter()

    //flatMap()

    //groupByKey()

    //reduceByKey()

    //sortByKey()

    join()

  }

Spark练习之Transformation操作开发的更多相关文章

Spark练习之action操作开发
Spark练习之action操作开发一.reduce 1.1 Java 1.2 Scala 二.collect 2.1 Java 2.2 Scala 三.count 3.1 Java 3.2 Sca ...
05、transformation操作开发实战
1.map:将集合中每个元素乘以2 2.filter:过滤出集合中的偶数 3.flatMap:将行拆分为单词 4.groupByKey:将每个班级的成绩进行分组 5.reduceByKey:统计每个班 ...
Spark：常用transformation及action，spark算子详解
常用transformation及action介绍,spark算子详解一.常用transformation介绍 1.1 transformation操作实例二.常用action介绍 2.1 act ...
Spark RDD概念学习系列之transformation操作
不多说,直接上干货! transformation操作惰性求值 (1)RDD 的转化操作都是惰性求值的.这意味着在被调用行动操作之前Spark不会开始计算. (2)读取数据到RDD的操作也是惰性的. ...
Spark RDD概念学习系列之Pair RDD的transformation操作
不多说,直接上干货! Pair RDD的transformation操作 Pair RDD转换操作1 Pair RDD 可以使用所有标准RDD 上转化操作,还提供了特有的转换操作. Pair RDD转 ...
54、Spark Streaming:DStream的transformation操作概览
一. transformation操作概览 Transformation Meaning map 对传入的每个元素,返回一个新的元素 flatMap 对传入的每个元素,返回一个或多个元素 filter ...
Spark学习笔记--Transformation 和 action
转自:http://my.oschina.net/hanzhankang/blog/200275 附:各种操作的逻辑执行图 https://github.com/JerryLead/SparkInte ...
【转】Spark Streaming和Kafka整合开发指南
基于Receivers的方法这个方法使用了Receivers来接收数据.Receivers的实现使用到Kafka高层次的消费者API.对于所有的Receivers,接收到的数据将会保存在Spark ...
Spark Streaming和Kafka整合开发指南(二)
在本博客的<Spark Streaming和Kafka整合开发指南(一)>文章中介绍了如何使用基于Receiver的方法使用Spark Streaming从Kafka中接收数据.本文将介绍 ...

随机推荐

第十五章节 BJROBOT cartographer 算法构建地图【ROS全开源阿克曼转向智能网联无人驾驶车】
建地图前说明:请确保你的小车已经校正好 IMU.角速度.线速度,虚拟机配置好 ROS 网络的前提进行,否则会造成构建地图无边界.虚拟机端无法正常收到小车主控端发布的话题数据等异常情况!! 1.把小车平 ...
9条消除if...else的锦囊妙计，助你写出更优雅的代码
前言最近在做代码重构,发现了很多代码的烂味道.其他的不多说,今天主要说说那些又臭又长的if...else要如何重构. 在介绍更更优雅的编程之前,让我们一起回顾一下,不好的if...else代码一. ...
linux串口通信接收信息不完整读取不全
类似这种 ready.o是我用来读取串口信息的一个程序执行结果如下: [root@localhost testPlc]# ./ready.o 0 02 1 30 2 30 3 46 4 46 5 3 ...
PO，BO，VO，DTO，POJO，DAO，DO是什么？
PO (Persistent Object) 持久化对象,表示实体数据.BO (Business Object) 业务对象,主要是把逻辑业务封装为一个对象 .VO (Value/Vi ...
TypeLoadException: 未能从程序集“ECS.GUI.Define, Version=1.0.0.0, Culture=neutral, PublicKeyToken=null”中加载类型“ECS.GUI.Define.ArmgAimPos”，因为它在 4 偏移位置处包含一个对象字段，该字段已由一个非对象字段不正确地对齐或重叠
TypeLoadException: 未能从程序集"ECS.GUI.Define, Version=1.0.0.0, Culture=neutral, PublicKeyToken=null ...
[Java基础]——String类
此篇博客主要整理Java中的String类的使用. 一.String 1.1 String 的定义上图是jdk中对String类的定义,得到的信息有: ①.String类声明为final的, ...
一条查询SQl是怎样执行的
MySQL的逻辑架构图大体来说,MySQL可以分为Server层和存储引擎层两部分. Server层包括连接器.查询缓存.分析器,优化器等,涵盖MySQL的大多核心服务功能,以及所有的内置函数,存储 ...
wpf 中用 C# 代码创建 PropertyPath ,以对间接目标进行 Storyboard 动画.
如图,一个 Rectangle 一个 Button ,点击按钮时要通过动画完成对 Rectangle填充色的渐变动画. Xaml: 1 <Window 2 x:Class="WpfAp ...
logback为不同的包或类指定输出日志文件
对日志分割的常见需求是,需要按不同的等级进行输出,这个的配置方式类似如下,在appender节点内添加内容 <appender name="FILE-INFO" class= ...
【Spring】Spring中的Bean - 4、Bean的生命周期
Bean的生命周期简单记录-Java EE企业级应用开发教程(Spring+Spring MVC+MyBatis)-Spring中的Bean 了解Spring中Bean的生命周期有何意义? 了解Sp ...

Spark练习之Transformation操作开发

Spark练习之Transformation操作开发

一、map：将集合中的每个元素乘以2

1.1 Java

1.2 Scala

二、filter：过滤出集合中的偶数

2.1 Java

2.2 Scala

三、flatMap：将行拆分为单词

3.1 Java

3.2 Scala

四、groupByKey：将每个班级的成绩进行分组

4.1 Java

2.2 Scala

五、reduceByKey：统计每个班级的总分

5.1 Java

5.2 Scala

六、sortByKey：将学生分数进行排序

6.1 Java

6.2 Scala

七、join：打印每个学生的成绩

7.1 Java

7.2 Scala

八、cogroup：打印每个学生的成绩

8.1 Java

九、main函数

9.1 Java

9.2 Scala

Spark练习之Transformation操作开发的更多相关文章

随机推荐

热门专题