Storm中的定时任务

1.全局定时器

 import java.util.Map;

 import backtype.storm.Config;

 import backtype.storm.Constants;

 import backtype.storm.LocalCluster;

 import backtype.storm.spout.SpoutOutputCollector;

 import backtype.storm.task.OutputCollector;

 import backtype.storm.task.TopologyContext;

 import backtype.storm.topology.OutputFieldsDeclarer;

 import backtype.storm.topology.TopologyBuilder;

 import backtype.storm.topology.base.BaseRichBolt;

 import backtype.storm.topology.base.BaseRichSpout;

 import backtype.storm.tuple.Fields;

 import backtype.storm.tuple.Tuple;

 import backtype.storm.tuple.Values;

 import backtype.storm.utils.Utils;

 /**

  * 全局定时器

  *

  * 数字累加求和

  * 先添加storm依赖

  *

  * @author Administrator

  *

  */

 public class LocalTopologySumTimer1 {

     /**

      * spout需要继承baserichspout，实现未实现的方法

      * @author Administrator

      *

      */

     public static class MySpout extends BaseRichSpout{

         private Map conf;

         private TopologyContext context;

         private SpoutOutputCollector collector;

         /**

          * 初始化方法，只会执行一次

          * 在这里面可以写一个初始化的代码

          * Map conf：其实里面保存的是topology的一些配置信息

          * TopologyContext context：topology的上下文，类似于servletcontext

          * SpoutOutputCollector collector：发射器，负责向外发射数据(tuple)

          */

         @Override

         public void open(Map conf, TopologyContext context,

                 SpoutOutputCollector collector) {

             this.conf = conf;

             this.context = context;

             this.collector = collector;

         }

         int num = 1;

         /**

          * 这个方法是spout中最重要的方法，

          * 这个方法会被storm框架循环调用，可以理解为这个方法是在一个while循环之内

          * 每调用一次，会向外发射一条数据

          */

         @Override

         public void nextTuple() {

             System.out.println("spout发射："+num);

             //把数据封装到values中，称为一个tuple，发射出去

             this.collector.emit(new Values(num++));

             Utils.sleep(1000);

         }

         /**

          * 声明输出字段

          */

         @Override

         public void declareOutputFields(OutputFieldsDeclarer declarer) {

             //给values中的数据起个名字，方便后面的bolt从这个values中取数据

             //fields中定义的参数和values中传递的数值是一一对应的

             declarer.declare(new Fields("num"));

         }

     }

     /**

      * 自定义bolt需要实现baserichbolt

      * @author Administrator

      *

      */

     public static class MyBolt extends BaseRichBolt{

         private Map stormConf;

         private TopologyContext context;

         private OutputCollector collector;

         /**

          * 和spout中的open方法意义一样

          */

         @Override

         public void prepare(Map stormConf, TopologyContext context,

                 OutputCollector collector) {

             this.stormConf = stormConf;

             this.context = context;

             this.collector = collector;

         }

         int sum = 0;

         /**

          * 是bolt中最重要的方法，当spout发射一个tuple出来，execute也会被调用，需要对spout发射出来的tuple进行处理

          */

         @Override

         public void execute(Tuple input) {

             if(input.getSourceComponent().equals(Constants.SYSTEM_COMPONENT_ID)){

                 //如果满足，就说明这个tuple是系统几倍的组件发送的，也就意味着定时时间到了

                 System.out.println("定时任务执行了。");

             }else{//这个地方必须要做判断,否则让系统级别的tuple去取"num"会取不到报错的.

                 //这个地方的逻辑可以将产生的数据封装成一个map或者是list放在内存中.到达定时任务的时候取出来,使用batch批处理向数据库中操作.

                 //然后再把集合中的数据清空...之后再添加.

                 //input.getInteger(0);//也可以根据角标获取tuple中的数据

                 Integer value = input.getIntegerByField("num");

                 sum+=value;

                 System.out.println("和："+sum);

             }

         }

         /**

          * 声明输出字段

          */

         @Override

         public void declareOutputFields(OutputFieldsDeclarer declarer) {

             //在这没必要定义了，因为execute方法中没有向外发射tuple，所以就不需要声明了。

             //如果nextTuple或者execute方法中向外发射了tuple，那么declareOutputFields必须要声明，否则不需要声明

         }

     }

     /**

      * 注意：在组装topology的时候，组件的id在定义的时候，名称不能以__开头。__是系统保留的

      * @param args

      */

     public static void main(String[] args) {

         //组装topology

         TopologyBuilder topologyBuilder = new TopologyBuilder();

         topologyBuilder.setSpout("spout1", new MySpout());

         //.shuffleGrouping("spout1"); 表示让MyBolt接收MySpout发射出来的tuple

         topologyBuilder.setBolt("bolt1", new MyBolt()).shuffleGrouping("spout1");

         //创建本地storm集群

         LocalCluster localCluster = new LocalCluster();

         Config config = new Config();

         //下面这样设置就是一个全局的定时任务  还有局部的定时任务.

         config.put(Config.TOPOLOGY_TICK_TUPLE_FREQ_SECS, 5);//表示每隔5秒storm会给Topology中的所有bolt发射一个系统级别的tuple

         //前面的单词计数的例子 我们可能只需要在最后一个CountBolt中做定时任务  SpiltBolt中不需要做定时任务  但是两个Bolt中都可以收到这个系统级别的tuple

         //所以需要每个Bolt中都做判断...SplitBolt可以加上一个判断  没有方法体...if(input.getSourceComponent().equals(Constants.SYSTEM_COMPONENT_ID)){  }

         //否则会出错...从系统级别的tuple取你定义的值 取不到 报错.

         localCluster.submitTopology("sumTopology", config, topologyBuilder.createTopology());

     }

 }

局部定时器

 /**

  * 局部定时器

  *

  * 数字累加求和

  * 先添加storm依赖

  *

  * @author Administrator

  *

  */

 public class LocalTopologySumTimer2 {

     /**

      * spout需要继承baserichspout，实现未实现的方法

      * @author Administrator

      *

      */

     public static class MySpout extends BaseRichSpout{

         private Map conf;

         private TopologyContext context;

         private SpoutOutputCollector collector;

         /**

          * 初始化方法，只会执行一次

          * 在这里面可以写一个初始化的代码

          * Map conf：其实里面保存的是topology的一些配置信息

          * TopologyContext context：topology的上下文，类似于servletcontext

          * SpoutOutputCollector collector：发射器，负责向外发射数据(tuple)

          */

         @Override

         public void open(Map conf, TopologyContext context,

                 SpoutOutputCollector collector) {

             this.conf = conf;

             this.context = context;

             this.collector = collector;

         }

         int num = 1;

         /**

          * 这个方法是spout中最重要的方法，

          * 这个方法会被storm框架循环调用，可以理解为这个方法是在一个while循环之内

          * 每调用一次，会向外发射一条数据

          */

         @Override

         public void nextTuple() {

             System.out.println("spout发射："+num);

             //把数据封装到values中，称为一个tuple，发射出去

             this.collector.emit(new Values(num++));

             Utils.sleep(1000);

         }

         /**

          * 声明输出字段

          */

         @Override

         public void declareOutputFields(OutputFieldsDeclarer declarer) {

             //给values中的数据起个名字，方便后面的bolt从这个values中取数据

             //fields中定义的参数和values中传递的数值是一一对应的

             declarer.declare(new Fields("num"));

         }

     }

     /**

      * 自定义bolt需要实现baserichbolt

      * @author Administrator

      *

      */

     public static class MyBolt extends BaseRichBolt{

         private Map stormConf;

         private TopologyContext context;

         private OutputCollector collector;

         /**

          * 和spout中的open方法意义一样

          */

         @Override

         public void prepare(Map stormConf, TopologyContext context,

                 OutputCollector collector) {

             this.stormConf = stormConf;

             this.context = context;

             this.collector = collector;

         }

         int sum = 0;

         /**

          * 是bolt中最重要的方法，当spout发射一个tuple出来，execute也会被调用，需要对spout发射出来的tuple进行处理

          */

         @Override

         public void execute(Tuple input) {

             if(input.getSourceComponent().equals(Constants.SYSTEM_COMPONENT_ID)){

                 //如果满足，就说明这个tuple是系统几倍的组件发送的，也就意味着定时时间到了

                 System.out.println("定时任务执行了。");

             }else{

                 //input.getInteger(0);//也可以根据角标获取tuple中的数据

                 Integer value = input.getIntegerByField("num");

                 sum+=value;

                 System.out.println("和："+sum);

             }

         }

         /**

          * 声明输出字段

          */

         @Override

         public void declareOutputFields(OutputFieldsDeclarer declarer) {

             //在这没必要定义了，因为execute方法中没有向外发射tuple，所以就不需要声明了。

             //如果nextTuple或者execute方法中向外发射了tuple，那么declareOutputFields必须要声明，否则不需要声明

         }

         /**

          * 局部定时任务

          * 只针对当前的bolt  对其他的bolt中没有影响

          * 加对系统级别tuple的判断只需要在当前bolt中判断就可以...其他bolt不需要..

          * 这种在工作中最常用....

          * 全局定时任务在 main方法中 设置  局部的定时任务只需要在Bolt类中覆盖getComponentConfiguration()方法

          * 这个还是比较有用,有意思的

          */

         @Override

         public Map<String, Object> getComponentConfiguration() {

             HashMap<String, Object> hashMap = new HashMap<String, Object>();

             hashMap.put(Config.TOPOLOGY_TICK_TUPLE_FREQ_SECS, 5);

             return hashMap;

         }

     }

     /**

      * 注意：在组装topology的时候，组件的id在定义的时候，名称不能以__开头。__是系统保留的

      * @param args

      */

     public static void main(String[] args) {

         //组装topology

         TopologyBuilder topologyBuilder = new TopologyBuilder();

         topologyBuilder.setSpout("spout1", new MySpout());

         //.shuffleGrouping("spout1"); 表示让MyBolt接收MySpout发射出来的tuple

         topologyBuilder.setBolt("bolt1", new MyBolt()).shuffleGrouping("spout1");

         //创建本地storm集群

         LocalCluster localCluster = new LocalCluster();

         Config config = new Config();

         localCluster.submitTopology("sumTopology", config, topologyBuilder.createTopology());

     }

 }

Storm中的定时任务的更多相关文章

Storm中遇到的日志多次重写问题（一）
业务描述: 统计从kafka spout中读取的数据条数,以及写入redis的数据的条数,写入hdfs的数据条数,写入kafaka的数据条数.并且每过5秒将数据按照json文件的形式写入日志.其中保存 ...
Storm中Spout使用注意事项小结
Storm中Spout用于读取并向计算拓扑中发送数据源,最近在调试一个topology时遇到了系统qps低,处理速度达不到要求的问题,经过排查后发现是由于对Spout的使用模式不当导致的多线程同步等待 ...
storm源码之理解Storm中Worker、Executor、Task关系 + 并发度详解
本文导读: 1 Worker.Executor.task详解 2 配置拓扑的并发度 3 拓扑示例 4 动态配置拓扑并发度 Worker.Executor.Task详解: Storm在集群上运行一个To ...
spring项目中使用定时任务
当我们希望在某个时间点来执行一些业务方法的时候就用到定时任务,在spring的项目中使用定时任务很简单.如下第一步.加入jar包 <dependency> <groupId> ...
Storm中并发程度的理解
Storm中涉及到了很多组件,例如nimbus,supervisor等等,在参考了这两篇文章之后,对这个有了更好的理解. Understanding the parallelism of a Stor ...
用crontab、crond在嵌入式系统中添加定时任务
在嵌入式系统中,定时任务通过crond和cronttab两个系统命令来联合执行. 其中crond是定时任务的守护进程,系统开始时是没有开启的.crontab主要作用是管理用户的crontab file ...
在Java Web项目中添加定时任务
在Java Web程序中加入定时任务,这里介绍两种方式:1.使用监听器注入:2.使用Spring注解@Scheduled注入. 推荐使用第二种形式. 一.使用监听器注入 ①:创建监听器类: impor ...
Spring Boot 中实现定时任务的两种方式
在 Spring + SpringMVC 环境中,一般来说,要实现定时任务,我们有两中方案,一种是使用 Spring 自带的定时任务处理器 @Scheduled 注解,另一种就是使用第三方框架 Qua ...
【Storm篇】--Storm中的同步服务DRPC
一.前述 Drpc(分布式远程过程调用)是一种同步服务实现的机制,在Storm中客户端提交数据请求之后,立刻取得计算结果并返回给客户端.同时充分利用Storm的计算能力实现高密度的并行实时计算. 二. ...

随机推荐

点击文字弹出一个DIV层窗口代码
<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"> <html> <hea ...
Clion 教程书写Hello World,C语言开发;Clion 的C语言开发
一.编译器安装二.项目搭建 1.新建项目 2.项目类型选择(双红圈是项目名称,可以修改) 3.点击create,自动生成项目. 4.运行项目
1.3currentThread()方法
该方法可返回代码段正在被哪个线程调用的信息 package com.cky.test; /** * Created by chenkaiyang on 2017/12/2. */ public cla ...
kafka讲解
转载http://www.jasongj.com/2015/01/02/Kafka深度解析 Kafka是Apache下的一个子项目,是一个高性能跨语言分布式发布/订阅消息队列系统,而Jafka是在Ka ...
[au3]复制选择性粘贴文本到excel
案例:在一张网页上有许多你要复制的内容,但是你必须一个一个找到他们,然后一个一个复制出来粘贴到excel表格里.时间一长你的眼睛容易花,而且复制多了容易出错. 方法:当然有许多方法可以自动化的做这一件 ...
响应式和移动 web
移动web 教程:http://www.imooc.com/learn/494 iphone5 问题一:6401136的图片,能否在iphone5上完全显示? chrome下 iphone5:3205 ...
SET FOREIGN_KEY_CHECKS=0;在Mysql中取消外键约束
Mysql中如果表和表之间建立的外键约束,则无法删除表及修改表结构. 解决方法是在Mysql中取消外键约束: SET FOREIGN_KEY_CHECKS=0; 然后将原来表的数据导 ...
MCU_存储器
MCU的存储器用途: RAM:数据存储器,和计算机的内存差不多,主要是用来存放程序运行产生的过程数据,掉电后会丢失数据,因此程序在上电后需要进行初始化.程序中的全局变量占据着RAM中的固定空间,局部变 ...
Android-WebView加载网络图片&网页
加载网络图片: 链接地址: http://bcs.link-us.com.cn/directBank/newHX149/directBank/h5/www/dist/img/e113.jpg 确保链 ...
Android-Kotlin-递归与尾递归
递归: 阶乘计算: /** * 阶乘: * 1的阶乘是1,因为1往下走一个楼梯就是0了 * 2的阶乘是 2*1 * 3的继承是 3*2*1 * 4的继承是 4*3*2*1 * 5的阶乘是 5*4*2 ...

Storm中的定时任务

Storm中的定时任务的更多相关文章

随机推荐

热门专题