Storm中的定时任务

1.全局定时器

 import java.util.Map;

 import backtype.storm.Config;

 import backtype.storm.Constants;

 import backtype.storm.LocalCluster;

 import backtype.storm.spout.SpoutOutputCollector;

 import backtype.storm.task.OutputCollector;

 import backtype.storm.task.TopologyContext;

 import backtype.storm.topology.OutputFieldsDeclarer;

 import backtype.storm.topology.TopologyBuilder;

 import backtype.storm.topology.base.BaseRichBolt;

 import backtype.storm.topology.base.BaseRichSpout;

 import backtype.storm.tuple.Fields;

 import backtype.storm.tuple.Tuple;

 import backtype.storm.tuple.Values;

 import backtype.storm.utils.Utils;

 /**

  * 全局定时器

  *

  * 数字累加求和

  * 先添加storm依赖

  *

  * @author Administrator

  *

  */

 public class LocalTopologySumTimer1 {

     /**

      * spout需要继承baserichspout，实现未实现的方法

      * @author Administrator

      *

      */

     public static class MySpout extends BaseRichSpout{

         private Map conf;

         private TopologyContext context;

         private SpoutOutputCollector collector;

         /**

          * 初始化方法，只会执行一次

          * 在这里面可以写一个初始化的代码

          * Map conf：其实里面保存的是topology的一些配置信息

          * TopologyContext context：topology的上下文，类似于servletcontext

          * SpoutOutputCollector collector：发射器，负责向外发射数据(tuple)

          */

         @Override

         public void open(Map conf, TopologyContext context,

                 SpoutOutputCollector collector) {

             this.conf = conf;

             this.context = context;

             this.collector = collector;

         }

         int num = 1;

         /**

          * 这个方法是spout中最重要的方法，

          * 这个方法会被storm框架循环调用，可以理解为这个方法是在一个while循环之内

          * 每调用一次，会向外发射一条数据

          */

         @Override

         public void nextTuple() {

             System.out.println("spout发射："+num);

             //把数据封装到values中，称为一个tuple，发射出去

             this.collector.emit(new Values(num++));

             Utils.sleep(1000);

         }

         /**

          * 声明输出字段

          */

         @Override

         public void declareOutputFields(OutputFieldsDeclarer declarer) {

             //给values中的数据起个名字，方便后面的bolt从这个values中取数据

             //fields中定义的参数和values中传递的数值是一一对应的

             declarer.declare(new Fields("num"));

         }

     }

     /**

      * 自定义bolt需要实现baserichbolt

      * @author Administrator

      *

      */

     public static class MyBolt extends BaseRichBolt{

         private Map stormConf;

         private TopologyContext context;

         private OutputCollector collector;

         /**

          * 和spout中的open方法意义一样

          */

         @Override

         public void prepare(Map stormConf, TopologyContext context,

                 OutputCollector collector) {

             this.stormConf = stormConf;

             this.context = context;

             this.collector = collector;

         }

         int sum = 0;

         /**

          * 是bolt中最重要的方法，当spout发射一个tuple出来，execute也会被调用，需要对spout发射出来的tuple进行处理

          */

         @Override

         public void execute(Tuple input) {

             if(input.getSourceComponent().equals(Constants.SYSTEM_COMPONENT_ID)){

                 //如果满足，就说明这个tuple是系统几倍的组件发送的，也就意味着定时时间到了

                 System.out.println("定时任务执行了。");

             }else{//这个地方必须要做判断,否则让系统级别的tuple去取"num"会取不到报错的.

                 //这个地方的逻辑可以将产生的数据封装成一个map或者是list放在内存中.到达定时任务的时候取出来,使用batch批处理向数据库中操作.

                 //然后再把集合中的数据清空...之后再添加.

                 //input.getInteger(0);//也可以根据角标获取tuple中的数据

                 Integer value = input.getIntegerByField("num");

                 sum+=value;

                 System.out.println("和："+sum);

             }

         }

         /**

          * 声明输出字段

          */

         @Override

         public void declareOutputFields(OutputFieldsDeclarer declarer) {

             //在这没必要定义了，因为execute方法中没有向外发射tuple，所以就不需要声明了。

             //如果nextTuple或者execute方法中向外发射了tuple，那么declareOutputFields必须要声明，否则不需要声明

         }

     }

     /**

      * 注意：在组装topology的时候，组件的id在定义的时候，名称不能以__开头。__是系统保留的

      * @param args

      */

     public static void main(String[] args) {

         //组装topology

         TopologyBuilder topologyBuilder = new TopologyBuilder();

         topologyBuilder.setSpout("spout1", new MySpout());

         //.shuffleGrouping("spout1"); 表示让MyBolt接收MySpout发射出来的tuple

         topologyBuilder.setBolt("bolt1", new MyBolt()).shuffleGrouping("spout1");

         //创建本地storm集群

         LocalCluster localCluster = new LocalCluster();

         Config config = new Config();

         //下面这样设置就是一个全局的定时任务  还有局部的定时任务.

         config.put(Config.TOPOLOGY_TICK_TUPLE_FREQ_SECS, 5);//表示每隔5秒storm会给Topology中的所有bolt发射一个系统级别的tuple

         //前面的单词计数的例子 我们可能只需要在最后一个CountBolt中做定时任务  SpiltBolt中不需要做定时任务  但是两个Bolt中都可以收到这个系统级别的tuple

         //所以需要每个Bolt中都做判断...SplitBolt可以加上一个判断  没有方法体...if(input.getSourceComponent().equals(Constants.SYSTEM_COMPONENT_ID)){  }

         //否则会出错...从系统级别的tuple取你定义的值 取不到 报错.

         localCluster.submitTopology("sumTopology", config, topologyBuilder.createTopology());

     }

 }

局部定时器

 /**

  * 局部定时器

  *

  * 数字累加求和

  * 先添加storm依赖

  *

  * @author Administrator

  *

  */

 public class LocalTopologySumTimer2 {

     /**

      * spout需要继承baserichspout，实现未实现的方法

      * @author Administrator

      *

      */

     public static class MySpout extends BaseRichSpout{

         private Map conf;

         private TopologyContext context;

         private SpoutOutputCollector collector;

         /**

          * 初始化方法，只会执行一次

          * 在这里面可以写一个初始化的代码

          * Map conf：其实里面保存的是topology的一些配置信息

          * TopologyContext context：topology的上下文，类似于servletcontext

          * SpoutOutputCollector collector：发射器，负责向外发射数据(tuple)

          */

         @Override

         public void open(Map conf, TopologyContext context,

                 SpoutOutputCollector collector) {

             this.conf = conf;

             this.context = context;

             this.collector = collector;

         }

         int num = 1;

         /**

          * 这个方法是spout中最重要的方法，

          * 这个方法会被storm框架循环调用，可以理解为这个方法是在一个while循环之内

          * 每调用一次，会向外发射一条数据

          */

         @Override

         public void nextTuple() {

             System.out.println("spout发射："+num);

             //把数据封装到values中，称为一个tuple，发射出去

             this.collector.emit(new Values(num++));

             Utils.sleep(1000);

         }

         /**

          * 声明输出字段

          */

         @Override

         public void declareOutputFields(OutputFieldsDeclarer declarer) {

             //给values中的数据起个名字，方便后面的bolt从这个values中取数据

             //fields中定义的参数和values中传递的数值是一一对应的

             declarer.declare(new Fields("num"));

         }

     }

     /**

      * 自定义bolt需要实现baserichbolt

      * @author Administrator

      *

      */

     public static class MyBolt extends BaseRichBolt{

         private Map stormConf;

         private TopologyContext context;

         private OutputCollector collector;

         /**

          * 和spout中的open方法意义一样

          */

         @Override

         public void prepare(Map stormConf, TopologyContext context,

                 OutputCollector collector) {

             this.stormConf = stormConf;

             this.context = context;

             this.collector = collector;

         }

         int sum = 0;

         /**

          * 是bolt中最重要的方法，当spout发射一个tuple出来，execute也会被调用，需要对spout发射出来的tuple进行处理

          */

         @Override

         public void execute(Tuple input) {

             if(input.getSourceComponent().equals(Constants.SYSTEM_COMPONENT_ID)){

                 //如果满足，就说明这个tuple是系统几倍的组件发送的，也就意味着定时时间到了

                 System.out.println("定时任务执行了。");

             }else{

                 //input.getInteger(0);//也可以根据角标获取tuple中的数据

                 Integer value = input.getIntegerByField("num");

                 sum+=value;

                 System.out.println("和："+sum);

             }

         }

         /**

          * 声明输出字段

          */

         @Override

         public void declareOutputFields(OutputFieldsDeclarer declarer) {

             //在这没必要定义了，因为execute方法中没有向外发射tuple，所以就不需要声明了。

             //如果nextTuple或者execute方法中向外发射了tuple，那么declareOutputFields必须要声明，否则不需要声明

         }

         /**

          * 局部定时任务

          * 只针对当前的bolt  对其他的bolt中没有影响

          * 加对系统级别tuple的判断只需要在当前bolt中判断就可以...其他bolt不需要..

          * 这种在工作中最常用....

          * 全局定时任务在 main方法中 设置  局部的定时任务只需要在Bolt类中覆盖getComponentConfiguration()方法

          * 这个还是比较有用,有意思的

          */

         @Override

         public Map<String, Object> getComponentConfiguration() {

             HashMap<String, Object> hashMap = new HashMap<String, Object>();

             hashMap.put(Config.TOPOLOGY_TICK_TUPLE_FREQ_SECS, 5);

             return hashMap;

         }

     }

     /**

      * 注意：在组装topology的时候，组件的id在定义的时候，名称不能以__开头。__是系统保留的

      * @param args

      */

     public static void main(String[] args) {

         //组装topology

         TopologyBuilder topologyBuilder = new TopologyBuilder();

         topologyBuilder.setSpout("spout1", new MySpout());

         //.shuffleGrouping("spout1"); 表示让MyBolt接收MySpout发射出来的tuple

         topologyBuilder.setBolt("bolt1", new MyBolt()).shuffleGrouping("spout1");

         //创建本地storm集群

         LocalCluster localCluster = new LocalCluster();

         Config config = new Config();

         localCluster.submitTopology("sumTopology", config, topologyBuilder.createTopology());

     }

 }

Storm中的定时任务的更多相关文章

Storm中遇到的日志多次重写问题（一）
业务描述: 统计从kafka spout中读取的数据条数,以及写入redis的数据的条数,写入hdfs的数据条数,写入kafaka的数据条数.并且每过5秒将数据按照json文件的形式写入日志.其中保存 ...
Storm中Spout使用注意事项小结
Storm中Spout用于读取并向计算拓扑中发送数据源,最近在调试一个topology时遇到了系统qps低,处理速度达不到要求的问题,经过排查后发现是由于对Spout的使用模式不当导致的多线程同步等待 ...
storm源码之理解Storm中Worker、Executor、Task关系 + 并发度详解
本文导读: 1 Worker.Executor.task详解 2 配置拓扑的并发度 3 拓扑示例 4 动态配置拓扑并发度 Worker.Executor.Task详解: Storm在集群上运行一个To ...
spring项目中使用定时任务
当我们希望在某个时间点来执行一些业务方法的时候就用到定时任务,在spring的项目中使用定时任务很简单.如下第一步.加入jar包 <dependency> <groupId> ...
Storm中并发程度的理解
Storm中涉及到了很多组件,例如nimbus,supervisor等等,在参考了这两篇文章之后,对这个有了更好的理解. Understanding the parallelism of a Stor ...
用crontab、crond在嵌入式系统中添加定时任务
在嵌入式系统中,定时任务通过crond和cronttab两个系统命令来联合执行. 其中crond是定时任务的守护进程,系统开始时是没有开启的.crontab主要作用是管理用户的crontab file ...
在Java Web项目中添加定时任务
在Java Web程序中加入定时任务,这里介绍两种方式:1.使用监听器注入:2.使用Spring注解@Scheduled注入. 推荐使用第二种形式. 一.使用监听器注入 ①:创建监听器类: impor ...
Spring Boot 中实现定时任务的两种方式
在 Spring + SpringMVC 环境中,一般来说,要实现定时任务,我们有两中方案,一种是使用 Spring 自带的定时任务处理器 @Scheduled 注解,另一种就是使用第三方框架 Qua ...
【Storm篇】--Storm中的同步服务DRPC
一.前述 Drpc(分布式远程过程调用)是一种同步服务实现的机制,在Storm中客户端提交数据请求之后,立刻取得计算结果并返回给客户端.同时充分利用Storm的计算能力实现高密度的并行实时计算. 二. ...

随机推荐

无法重启oracle数据库监听
一.报错 TNS-12541: TNS:no listener TNS-12560: TNS:protocol adapter error TNS-00511: No listener Linu ...
prometheus+telegraf无法监控网络流量的问题
原因是prometheus缺少以下紫色框的部分解决办法: 比如要监控的机器ip为172.16.12.7,机器内部安装了telegraf. 1)先查看机器的网卡:ifconfig 发现ip地址位于网 ...
MFC事件和线程
HANDLE WINAPI CreateThread ( __in_opt LPSECURITY_ATTRIBUTES lpThreadAttributes, // 指向SECURITY_ATTRIB ...
IntelliJ IDEA 2017版 spring-boot 2.03后 Pageable用法;Pageable用法，PageRequest过时，新用法；Pageable过时问题；
1.旧版本Pageable用法: 但是会显示,这个版本已经过时,这时可以查看源码. 一般,一个方法过时,就会在其附近形成一个新的同名的但是其他用法的方法.按照这个理念,来找这个源码.很幸运,蒙对了,我 ...
重启随机游走算法（RWR：Random Walk with Restart）
1 pagerank算法的基本原理 Pagerank算法是Google的网页排名算法,由拉里佩奇发明.其基本思想是民主表决.在互联网上,如果一个网页被很多其他网页所链接,说明它受到普遍的承认和信赖,那 ...
记录：CSS特殊性——权值规则
浏览器是根据权值来判断使用哪种css样式的,权值高的就使用哪种css样式. 下面是权值的规则: 标签的权值为1,类选择符的权值为10,ID选择符的权值最高为100.例如下面的代码: p{color:r ...
Android自定义视图一：扩展现有的视图，添加新的XML属性
这个系列是老外写的,干货!翻译出来一起学习.如有不妥,不吝赐教! Android自定义视图一:扩展现有的视图,添加新的XML属性 Android自定义视图二:如何绘制内容 Android自定义视图三: ...
适配android和iOS上position:absolute和input问题
//适配android上absolute和input的问题var oHeight = $(document).height(); //屏幕当前的高度$(window).resize(function( ...
C#期末大作业消消乐 2017-06-01 18:11 275人阅读评论(0) 收藏
邻近期末,忙于刷题之余意识到期末大作业来不及了,匆匆赶下了作业,虽说做的很是粗糙,但完全原创的下载链接 https://pan.baidu.com/s/1cCNLr4 大体的做大约3天完成了: 第一 ...
jvm虚拟机---执行引擎子系统
Java虚拟机只与Class文件相关联,它规定了Class文件应该具有的格式,而不论该文件是由什么语言编写并编译而来.所以,任何语言只要能够最终编译成符合Java虚拟机要求的Class文件,就可以运行 ...

Storm中的定时任务

Storm中的定时任务的更多相关文章

随机推荐

热门专题