Spark Streaming 单词计数

Receiver

从数据源接收数据，然后把数据存储在内存中供spark streaming使用，在本地运行spark streaming不能设置master为local或者local[1]，此时运行的线程只有一个，因为需要一个线程去运行Receiver接收数据，因此，就没有线程去处理数据了

代码

def main(args: Array[String]) {

    val conf = new SparkConf()

    conf.setAppName("SparkStreamDemo")
    // 不能使用local或者local[1]，k必须大于1，准确的说是大于Receiver的数量

    conf.setMaster("local[*]")

    val sc = new SparkContext(conf)

    // 创建StreamingContext 第二个参数是多长时间产生一个RDD

    val ssc = new StreamingContext(sc, Seconds(1))

    // 创建DStream

    val lines = ssc.socketTextStream("m1", 9050);

    val wordCounts = lines.flatMap(_.split(" ")).map((_, 1)).reduceByKey(_+_)

    wordCounts.print()

    // 启动spark streaming

    ssc.start()

    // 等待计算结束

    ssc.awaitTermination()

  }

使用nc命令向m1 9050端口发送数据

如果nc命令不存在，首先安装nc命令

1、sudo yum list nc,发现nc命令在nc.x86_64中
2、安装nc， sudo yum -y install nc.x86_64

nc -lk 9050

然后一直输入数据，就可以看到控制台的数据输出

Spark Streaming 单词计数的更多相关文章

Spark Streaming 002 统计单词的例子
1.准备事先在hdfs上创建两个目录: 保存上传数据的目录:hdfs://alamps:9000/library/SparkStreaming/data checkpoint的目录:hdfs://a ...
2、 Spark Streaming方式从socket中获取数据进行简单单词统计
Spark 1.5.2 Spark Streaming 学习笔记和编程练习 Overview 概述 Spark Streaming is an extension of the core Spark ...
【Spark】通过SparkStreaming实现从socket接受数据，并进行简单的单词计数
文章目录步骤一.创建maven工程并导入jar包二.安装并启动生产者三.开发SparkStreaming代码四.查看结果步骤一.创建maven工程并导入jar包 <properti ...
Spark: 单词计数(Word Count)的MapReduce实现(Java/Python)
1 导引我们在博客<Hadoop: 单词计数(Word Count)的MapReduce实现 >中学习了如何用Hadoop-MapReduce实现单词计数,现在我们来看如何用Spark来 ...
flume+kafka+spark streaming整合
1.安装好flume2.安装好kafka3.安装好spark4.流程说明: 日志文件->flume->kafka->spark streaming flume输入:文件 flume输 ...
Spark入门实战系列--7.Spark Streaming（上）--实时流计算Spark Streaming原理介绍
[注]该系列文章以及使用到安装包/测试数据可以在<倾情大奉送--Spark入门实战系列>获取 .Spark Streaming简介 1.1 概述 Spark Streaming 是Spa ...
Spark入门实战系列--7.Spark Streaming（下）--实时流计算Spark Streaming实战
[注]该系列文章以及使用到安装包/测试数据可以在<倾情大奉送--Spark入门实战系列>获取 .实例演示 1.1 流数据模拟器 1.1.1 流数据说明在实例演示中模拟实际情况,需要源源 ...
Apache Spark 2.2.0 中文文档 - Spark Streaming 编程指南 | ApacheCN
Spark Streaming 编程指南概述一个入门示例基础概念依赖初始化 StreamingContext Discretized Streams (DStreams)(离散化流) Inp ...
Spark Streaming编程指南
Overview A Quick Example Basic Concepts Linking Initializing StreamingContext Discretized Streams (D ...

随机推荐

Task5.PyTorch实现L1，L2正则化以及Dropout
1.了解知道Dropout原理深度学习网路中,参数多,可能出现过拟合及费时问题.为了解决这一问题,通过实验,在2012年,Hinton在其论文<Improving neural network ...
layer.open()中属性content在IE 8中提示“网页无法显示”
将图中的${ctx}值为将${ctx}更改为BASEURI 如图: 若是在IE8上中弹出框中还是显示网页无法显示.可以改为 content:‘http://127.0.0.1:8081/projec ...
普通用户sudo权限
需求: 1>创建一个saipu普通用户,不允许使用 rm 和 passwd root 和 sudo su - root 命令,其他命令均允许且 sudo 时不用输入密码 2>创建一个lwd ...
SQLSTATE[HY000] [2002] No such file or directory
正常的解决办法.. 只需将laravel配置文件中的host 127.0.0.1改成localhost就可以: 'mysql' => array( 'driver' ...
MySQL闪回工具之myflash 和 binlog2sql
MySQL闪回工具之:binlog2sql https://github.com/danfengcao/binlog2sql MYSQL Binglog分析利器:binlog2sql使用详解 :h ...
MySQL高可用架构之MySQL5.7组复制MGR
MySQL高可用架构之MySQL5.7组复制MGR########################################################################### ...
设计模式-Runoob：设计模式简介
ylbtech-设计模式-Runoob:设计模式简介 1.返回顶部 1. 设计模式简介设计模式(Design pattern)代表了最佳的实践,通常被有经验的面向对象的软件开发人员所采用.设计模式是 ...
阶段1 语言基础+高级_1-3-Java语言高级_03-常用API第二部分_第1节 Object类_1_Object类的toString方法
任何一个类都可以使用Object类中的方法 ## 1.1 概述 `java.lang.Object`类是Java语言中的根类,即所有类的父类.它中描述的所有方法子类都可以使用.在对象实例化的时候,最终 ...
类BigInteger
BigInteger类可以让超过Integer范围内的数据进行运算构造方法 public BigIntege(String val); package com.jacky; import java ...
您配置文件中的设置 (空密码的 root) 与 MySQL 默认管理员账户对应...的解决办法
您配置文件中的设置 (空密码的 root) 与 MySQL 默认管理员账户对应.……解决办法很简单:1.修改root@localhost权限的密码. 打开wamp的phpmyadmin,进入它的管理界 ...

Spark Streaming 单词计数

Receiver

Spark Streaming 单词计数的更多相关文章

随机推荐

热门专题