067 HA与updateStateByKey结合

　　是HA与updateStateByKey相结合的程序。

　　有点问题，有点奇怪，重启项目后运行没有问题，但是第三次启动的时候，就不会在打印数据了，有点问题。

1.程序

 package com.stream.it

 import org.apache.spark.streaming.kafka.KafkaUtils

 import org.apache.spark.streaming.{Seconds, StreamingContext}

 import org.apache.spark.{SparkConf, SparkContext}

 /**

   * 通过HA管理KAFKA的offset偏移量

   * Created by ibf on 03/04.

   */

 object HAAndUpdateStateByKey {

   def main(args: Array[String]): Unit = {

     val conf = new SparkConf()

       .setAppName("StreamingHAOfKafkaDirect")

       .setMaster("local[*]")

     val sc = SparkContext.getOrCreate(conf)

     val checkpointDir = "hdfs://linux-hadoop01.ibeifeng.com:8020/beifeng/spark/streaming/012"

     // ========================================

     /**

       * 创建一个StreamingContext对象

       *

       * @return

       */

     def createingStreamingContextFunc(): StreamingContext = {

       val kafkaParams = Map("metadata.broker.list" -> "linux-hadoop01.ibeifeng.com:9092,linux-hadoop01.ibeifeng.com:9093,linux-hadoop01.ibeifeng.com:9094", "auto.offset.reset" -> "smallest")

       val topics = Set("beifeng")

       val ssc = new StreamingContext(sc, Seconds(1))

       val dstream = KafkaUtils.createDirectStream[String, String, kafka.serializer.StringDecoder, kafka.serializer.StringDecoder](ssc, kafkaParams, topics)

       val resultDStream = dstream

         .filter(_._2.nonEmpty)

         .mapPartitions(iter => {

           iter.flatMap(_._2.split(" ").map((_, 1)))

         })

         .updateStateByKey(

           (values: Seq[Int], state: Option[Long]) => {

             // 获取当前key的累加值

             val currentSum = values.sum

             // 获取之前批次的累加值

             val preSum = state.getOrElse(0L)

             // 返回结果

             Some(currentSum + preSum)

           }

         )

       // 打印一下

       resultDStream.print()

       // ssc设置checkpoint

       ssc.checkpoint(checkpointDir)

       // 返回对象

       ssc

     }

     val ssc = StreamingContext.getOrCreate(

       checkpointPath = checkpointDir,

       creatingFunc = createingStreamingContextFunc

     )

     // 将ssc传给其它管理Streaming关闭的对象==>其它线程(当前线程做数据的接收处理工作)

     shutdownStreaming(ssc)

     // start ===spark.streaming.stopGracefullyOnShutdown为true的时候，当jvm退出的时候，自动关闭

     ssc.start()

     ssc.awaitTermination() // 阻塞操作

   }

   /**

     * 进行shutdown操作

     *

     * @param ssc

     */

   def shutdownStreaming(ssc: StreamingContext): Unit = {

     new Thread(new Runnable {

       override def run(): Unit = {

         println("你好......")

         // 当某个条件被触发的时候，streamingcontext关闭

         // 这里假设停留10秒中

         Thread.sleep(10000)

         // 关闭操作

         ssc.stop(true, true)

         println("你好")

       }

     }).start()

   }

 }

2.效果

067 HA与updateStateByKey结合的更多相关文章

Hadoop 2.7.4 HDFS+YRAN HA部署
实验环境主机名称 IP地址角色统一安装目录统一安装用户 sht-sgmhadoopnn-01 172.16.101.55 namenode,resourcemanager /usr/local ...
HA 高可用软件系统保养指南
又过了一年 618,六月是公司一年一度的大促月,一般提前一个月各系统就会减少需求和功能的开发,转而更多去关注系统可用性.稳定性和管控性等方面的非功能需求.大促前的准备工作一般叫作「备战」,可以把线上运 ...
MySQL： Fabric 搭建 HA
搭建好Fabric之后,就可以在它的基础上创建HA Group. Shard Group.HA+Shard Group等.这里来说明一下如何快速的搭建HA环境. Fabric 192.168.2.23 ...
zookeeper集群的搭建以及hadoop ha的相关配置
1.环境 centos7 hadoop2.6.5 zookeeper3.4.9 jdk1.8 master作为active主机,data1作为standby备用机,三台机器均作为数据节点,yarn资源 ...
使用Nginx+Lua代理Hadoop HA
一.Hadoop HA的Web页面访问 Hadoop开启HA后,会同时存在两个Master组件提供服务,其中正在使用的组件称为Active,另一个作为备份称为Standby,例如HDFS的NameNo ...
hadoop2.7.1 HA安装部署（转）
hadoop集群规划目标:创建2个NameNode,做高可用,一个NameNode挂掉,另一个能够启动:一个运行Yarn,3台DataNode,3台Zookeeper集群,做高可用. 在 hadoo ...
【转】 XenServer架构之HA概述
一.XenServer HA概述 XenServer HA是一套全自动功能设计,规划,安全地恢复出现问题的XenServe 主机上的虚拟机的功能组件. 启用 HA 后,XenServer 将持续监视池 ...
ActiveMQ笔记(3)：基于Networks of Brokers的HA方案
上一篇介绍了基于ZK的ActiveMQ HA方案,虽然理解起来比较容易,但是有二个不足: 1) 占用的节点数过多,1个zk集群至少3个节点,1个activemq集群也至少得3个节点,但其实正常运行时 ...
ActiveMQ笔记(2)：基于ZooKeeper的HA方案
activemq官网给出了3种master/slave的HA方案,详见:http://activemq.apache.org/masterslave.html,基于共享文件目录,db,zookeepe ...

随机推荐

[HTTP] 基本认证的工作流程
HTTP的基本认证涉及两个字段,一个是请求字段 Authorization: Authorization: Basic xxx 一个是响应字段 WWW-Authenticate WWW-Authent ...
html5中如何去掉input type date默认
html5中如何去掉input type date默认样式 2.对日期时间控件的样式进行修改目前WebKit下有如下9个伪元素可以改变日期控件的UI:::-webkit-datetime-edit – ...
使用XIB 或者storyboard 创建imageView 模式 UIViewContentModeScaleAspectFill 图片越界问题
ImageView UIViewContentModeScaleAspectFill 超出边界的问题代码如下 [_photoView setClipsToBounds:Yes]; sto ...
STM32应用实例十四：利用光敏二极管实现光度测量
最近我们在开发臭氧发生器时,需要监测生成的臭氧的浓度,于是想到使用光度计来测量.因为不同浓度的臭氧对管的吸收作用是不相同的,于是检测光照强度的变化就可以得到相应的浓度数据. 1.硬件设计此次光照度检 ...
angular基础巩固
angular中的模块化 //定义模块 []为依赖的模块 moduleName可以使用[]模块中定义的controller filter .. var app=angular.module('modu ...
jQuery之jQuery扩展和事件
一.jQuery事件常用事件 blur([[data],fn]) 失去焦点 focus([[data],fn]) 获取焦点( 搜索框例子) change([[data],fn]) 当select下拉 ...
Linux基础实操二
实操一: 1) 新建用户natasha uid为1000,gid为555,备注信息为“master” 2) 修改natasha用户的家目录为/Natasha 3) 查看用户信息配置文件的最后一行 ca ...
Laravel5.7 跨域解决
先检查app/Http/Middleware/ 下是否有EnableCrossRequestMiddleware.php 这个文件,没有此文件使用此命令创建 php artisan make:midd ...
MySQL监控系统Lepus的搭建
现在流行的监控系统很多,选择一个合适自己的就可以了,例如Zabbix.Nagios:监控MySQL为主的有MySQLMTOP.Lepus.本文主要介绍快速部署lepus以及监控MySQL,因为作为DB ...
80端口被占用导致apach无法启动问题
1.查找是哪个程序占用了80端口 netstat -ano 列出所有进程观察 “本地地址” 列找到对应的PID 我这里是4 简单的办法,打开任务管理器,查看PID是4的是哪个进程. 发现是Sys ...

067 HA与updateStateByKey结合

067 HA与updateStateByKey结合的更多相关文章

随机推荐

热门专题