~~

前置

~~

Spark Streaming 常常对接 :本地文件、HDFS、端口、flume、kafka

  1. package february.streaming
  2. import org.apache.spark.SparkConf
  3. import org.apache.spark.streaming.{Seconds, StreamingContext}
  4. /**
  5. * ==== Spark Streaming可以监听本地文件、HDFS、端口、flume、kafka =====
  6. *
  7. *
  8. * Description: 使用Spark Streaming处理文件系统(local/hdfs)的数据
  9. * 通过 SparkStreaming 来实现WordCount
  10. * Spark Streaming
  11. *
  12. * 提交代码
  13. * spark-submit --master spark://spark001:7077 --deploy-mode client --class february.streaming.SparkStreamingWordCount /home/liuge36/jars/SparkDayDemo.jar
  14. *
  15. * @Author: 留歌36
  16. * @Date: 2019/2/21 17:27
  17. */
  18. object SparkStreamingWordCount {
  19. def main(args: Array[String]): Unit = {
  20. val sparkConf = new SparkConf()
  21. .setMaster("local[2]") //local[2] 或local也都可以
  22. .setAppName(this.getClass.getSimpleName)
  23. //拿到StreamingContext 这个上下文对象
  24. val ssc = new StreamingContext(sparkConf, Seconds(5))
  25. // 读取Windows 10电脑上的文件目录,没有成功,可能是因为moving的原因吧
  26. // val input = ssc.textFileStream("file:///f:\\tmp")
  27. // 读取centos local 从源码中也可以看出,需要移动文件到指定目录下,才能检测到
  28. val input = ssc.textFileStream("file:///home/liuge36/feb/")
  29. // 读取Linux服务器的文件目录
  30. // val lines = ssc.textFileStream("file:///")
  31. val lines = input.flatMap(line => line.split(","))
  32. val count = lines.map(word => (word, 1)).reduceByKey{case (x, y)=> x+y }
  33. // 输出结果
  34. println("==================华丽分割线开始============================")
  35. count.print()
  36. //启动主程序,
  37. ssc.start()
  38. //阻塞 等待主程序被关闭
  39. ssc.awaitTermination()
  40. }
  41. }

更多相关小demo:每天一个程序:https://blog.csdn.net/liuge36/column/info/34094

WordCount程序【Spark Streaming版本】的更多相关文章

  1. Spark Streaming数据限流简述

      Spark Streaming对实时数据流进行分析处理,源源不断的从数据源接收数据切割成一个个时间间隔进行处理:   流处理与批处理有明显区别,批处理中的数据有明显的边界.数据规模已知:而流处理数 ...

  2. Spark Streaming状态管理函数updateStateByKey和mapWithState

    Spark Streaming状态管理函数updateStateByKey和mapWithState 一.状态管理函数 二.mapWithState 2.1关于mapWithState 2.2mapW ...

  3. 50、Spark Streaming实时wordcount程序开发

    一.java版本 package cn.spark.study.streaming; import java.util.Arrays; import org.apache.spark.SparkCon ...

  4. Spark练习之通过Spark Streaming实时计算wordcount程序

    Spark练习之通过Spark Streaming实时计算wordcount程序 Java版本 Scala版本 pom.xml Java版本 import org.apache.spark.Spark ...

  5. 编写Spark的WordCount程序并提交到集群运行[含scala和java两个版本]

    编写Spark的WordCount程序并提交到集群运行[含scala和java两个版本] 1. 开发环境 Jdk 1.7.0_72 Maven 3.2.1 Scala 2.10.6 Spark 1.6 ...

  6. 55、Spark Streaming:updateStateByKey以及基于缓存的实时wordcount程序

    一.updateStateByKey 1.概述 SparkStreaming 7*24 小时不间断的运行,有时需要管理一些状态,比如wordCount,每个batch的数据不是独立的而是需要累加的,这 ...

  7. 52、Spark Streaming之输入DStream之基础数据源以及基于HDFS的实时wordcount程序

    一.概述 1.Socket:之前的wordcount例子,已经演示过了,StreamingContext.socketTextStream() 2.HDFS文件 基于HDFS文件的实时计算,其实就是, ...

  8. 大数据笔记(二十八)——执行Spark任务、开发Spark WordCount程序

    一.执行Spark任务: 客户端 1.Spark Submit工具:提交Spark的任务(jar文件) (*)spark提供的用于提交Spark任务工具 (*)example:/root/traini ...

  9. Spark Streaming的wordcount案例

    之前测试的一些spark案例都是采用离线处理,spark streaming的流处理一样可以运行经典的wordcount. 基本环境: spark-2.0.0 scala-2.11.0 IDEA-15 ...

随机推荐

  1. lua_基本语法

    学习lua,首先应该了解热更新. 热更新:可以在不重新下载客户端的情况下更新软件内容.在使用软件过程中,我们经常会遇到这种情况:升级软件,没错,这就使用的是热更新. C#不能直接热更新,原因为:C#脚 ...

  2. Leetcode之二分法专题-374. 猜数字大小(374. Guess Number Higher or Lower)

    Leetcode之二分法专题-374. 猜数字大小(374. Guess Number Higher or Lower) 我们正在玩一个猜数字游戏. 游戏规则如下:我从 1 到 n 选择一个数字. 你 ...

  3. unicode的编码与解码

  4. lightoj 1126 - Building Twin Towers(dp,递推)

    题目链接:http://www.lightoj.com/volume_showproblem.php?problem=1126 题解:一道基础的dp就是简单的递推可以设dp[height_left][ ...

  5. SpringDataJpa入门案例及查询详细解析

    SpringDataJpaSpring Data JPA 让我们解脱了DA0层的操作,基本上所有CRUD都可以依赖于它来实现,在实际的工作工程中,推荐使用Spring Data JPA+ORM(如:h ...

  6. SpringBoot 参数校验的方法

    Introduction 有参数传递的地方都少不了参数校验.在web开发中,前端的参数校验是为了用户体验,后端的参数校验是为了安全.试想一下,如果在controller层中没有经过任何校验的参数通过s ...

  7. Day005作业

    1,有如下变量(tu是个元祖),请实现要求的功能 tu = ("alex", [11, 22, {"k1": 'v1', "k2": [&q ...

  8. Hello, OpenWrite

    目录 Markdown For Typora Overview Block Elements Paragraph and line breaks Headers Blockquotes Lists T ...

  9. 小程序组件 scroll-view 横向滚动条无效

    小程序组件 scroll-view 中分别有上下竖向滑动和左右横向滑动,在这次项目中刚好需要用到横向滑动,但在测试过程中发现横向滑动没有了效果(静止在那里没移动过,并且换行了),经调试发现: 1.sc ...

  10. Flink入门宝典(详细截图版)

    本文基于java构建Flink1.9版本入门程序,需要Maven 3.0.4 和 Java 8 以上版本.需要安装Netcat进行简单调试. 这里简述安装过程,并使用IDEA进行开发一个简单流处理程序 ...