一. 简介
     storm作为流计算,处理数据通常以数据驱动。即只有当spout发射数据才会进行计算。那么如果想要做定时任务如何处理哪,例如有的bolt需要输出一段时间统计的结果,这里一段时间可能是几秒、几分钟或者几小时。如果还是以数据进行驱动的话必然会输出时间不可确定。同样也可以启一个线程一段时间执行一次,这也是一种解决方案。但是我希望有种更优雅的解决方案,就是这里说的tick。tick是由storm框架进行计时,到达设定时间会发送一个特殊的tuple:ticktuple,此时处理定时任务就可以了。
二. 代码
     如果是某一个bolt由定时需求的话,可以按照一下方式设置
  1. 继承BaseBasicBolt
  2. getComponentConfiguration方法设置发送ticktuple间隔时间(单位s)
  3. execute方法判断tuple类型,如果为ticktuple处理定时任务,如果不是处理其他任务。
以下是wordCount中CountBolt代码,每5s输出各单词统计的数据。
 //继承 BaseBasicBolt
public class CountTickBolt extends BaseBasicBolt {
private static final Logger logger = LoggerFactory.getLogger(CountTickBolt.class);
private Map<String, Integer> count;
private Long time; @Override
public Map<String, Object> getComponentConfiguration() {
//设置发送ticktuple的时间间隔
Config conf = new Config();
conf.put(conf.TOPOLOGY_TICK_TUPLE_FREQ_SECS, 5);
return conf;
} @Override
public void prepare(Map stormConf, TopologyContext context) {
super.prepare(stormConf, context);
count = new HashMap<String, Integer>();
time = System.currentTimeMillis();
} @Override
public void cleanup() {
super.cleanup();
} @Override
public void execute(Tuple input, BasicOutputCollector collector) {
//判断是否为tickTuple
if (input.getSourceComponent().equals(Constants.SYSTEM_COMPONENT_ID) &&
input.getSourceStreamId().equals(Constants.SYSTEM_TICK_STREAM_ID)){
//是,处理定时任务
Long nowTime = System.currentTimeMillis();
Long useTime = nowTime - time;
StringBuffer sb = new StringBuffer();
sb.append("======== Use Time :" + useTime + "========\r\n");
for (Map.Entry wordCount : count.entrySet()){
sb.append(wordCount.getKey() + "------>" + wordCount.getValue() + "\r\n");
}
Long nnTime = System.currentTimeMillis();
logger.info(sb.toString() + (nnTime - nowTime) );
time = nnTime;
}else {
//否,处理其他数据
String word = input.getString(0);
if (count.containsKey(word)){
int thisWordCont = count.get(word);
count.put(word, ++thisWordCont);
}else {
count.put(word,1);
}
}
} @Override
public void declareOutputFields(OutputFieldsDeclarer declarer) { }
三. 总结
     以上是一个简单的介绍,需要说明的是由于设置时间间隔是秒级的,所以在处理时会有毫秒级的误差,通常是± 2ms。
  以下是没有介绍或者测试到的地方,在以后会补上。
  1. 如何设置此拓扑中所有的spout和bolt都定时处理。
  2. 由于是tuple类型数据,当正常tuple数据量过大时是否会造成tickTuple延时消费。

storm定时任务【tick】的更多相关文章

  1. Storm编程入门API系列之Storm的定时任务实现

    概念,见博客 Storm概念学习系列之storm的定时任务 Storm的定时任务,分为两种实现方式,都是可以达到目的的. 我这里,分为StormTopologyTimer1.java   和  Sto ...

  2. Storm编程入门API系列之Storm的Topology的stream grouping

    概念,见博客 Storm概念学习系列之stream grouping(流分组) Storm的stream grouping的Shuffle Grouping 它是随机分组,随机派发stream里面的t ...

  3. Storm编程入门API系列之Storm的可靠性的ACK消息确认机制

    概念,见博客 Storm概念学习系列之storm的可靠性  什么业务场景需要storm可靠性的ACK确认机制? 答:想要保住数据不丢,或者保住数据总是被处理.即若没被处理的,得让我们知道. publi ...

  4. Spark Streaming笔记——技术点汇总

    目录 目录 概况 原理 API DStream WordCount示例 Input DStream Transformation Operation Output Operation 缓存与持久化 C ...

  5. Spark学习笔记(三)-Spark Streaming

    Spark Streaming支持实时数据流的可扩展(scalable).高吞吐(high-throughput).容错(fault-tolerant)的流处理(stream processing). ...

  6. Storm框架:如何实现crontab定时任务

    Storm除了能对消息流进行处理,还能实现crontab定时任务. 只要在bolt中配置TOPOLOGY_TICK_TUPLE_FREQ_SECS项即可实现. @Override public Map ...

  7. 关于Storm tick

    关于Storm tick 1. tick的功能 Apache Storm中内置了一种定时机制——tick,它能够让任何bolt的所有task每隔一段时间(精确到秒级,用户可以自定义)收到一个来自__s ...

  8. Storm中的定时任务

    1.全局定时器 import java.util.Map; import backtype.storm.Config; import backtype.storm.Constants; import ...

  9. storm的定时任务

    应用场景: 第一种方法 参考代码StormTopologyTimer1.java package yehua.storm; import java.util.Map; import org.apach ...

随机推荐

  1. OpenGL 的空间变换(上):矩阵在空间几何中的应用

    在使用 OpenGL 的应用程序中,当我们指定了模型的顶点后,顶点依次会变换到不同的 OpenGL 空间中,最后才会被显示到屏幕上.在变换的过程中,通过使用矩阵,我们更高效地来完成这些变换工作. 本篇 ...

  2. 开发Angular库的简单指导(译)

    1. 最近工作上用到Angular,需要查阅一些英文资料,虽然英文非常烂,但是种种原因又不得不硬着头皮上,只是每次看英文都很费力,因此决定将一些比较重要的特别是需要反复阅读的资料翻译一下,以节约再次阅 ...

  3. JavaEE开发之SpringMVC中的静态资源映射及服务器推送技术

    在上篇博客中,我们聊了<JavaEE开发之SpringMVC中的自定义拦截器及异常处理>.本篇博客我们继续的来聊SpringMVC的东西,下方我们将会聊到js.css这些静态文件的加载配置 ...

  4. MOSFET使用与H桥驱动问题

    0.小叙闲言 最开始学习三极管的时候,很注重它的工作原理,后来到了实际应用,就直接把三极管或MOSFET直接当作一个开关器件使用.直到前这几天,接触到MOSFET组成的H桥驱动电路时,发现它纯当作一个 ...

  5. Intellij IDEA注册server

    版权声明:本文为博主原创文章,未经博主允许不得转载.转载请注明来源:http://blog.csdn.net/mingjie1212.欢迎交流学习!对于Intellij IDEA 2016.3.4   ...

  6. IDEA第三章----idea常用配置

    前两章讲解了idea的git.maven.jdk.tomcat.编码等基本配置,可以让你的项目正常运行,这一章将讲解idea的一些常用设置,这些也正是idea可爱之处,大大提高了开发的效率. 第一节: ...

  7. stl_alloc.h分配器

    五.分配器:5.1.头文件: 5.1.1.include<stl_alloc.h> //内存的分配. 5.1.2.include<stl_construct.h> //对象的构 ...

  8. [Git]03 如何查看提交历史

     在提交了若干更新之后,又或者克隆了某个项目,想回顾下提交历史,可以使用 gitlog 命令查看. 常用命令 1.查看提交历史 $ git log 2.查看某个文件或者某个目录的递交历史 $ gi ...

  9. dubbox的provider端嵌套调用问题

    今天遇到了一个问题,查了半天...,情况是这样的,我用的是dubbox,想做一个精简的全链路跟踪,一个消费者通过dubbox调用一个Service, service 里另外调用了两个service: ...

  10. OC的内存管理(二)ARC

    指针: 指向内存的地址指针变量 存放地址的变量指针变量值 变量中存放的值(地址值)指针变量指向的内存单元值 内存地址指向的值1):强指针:默认的情况下,所有的指针都是强指针,关键字strong ):弱 ...