Storm的BaseBasicBolt源码解析ack机制

我们在学习ack机制的时候，我们知道Storm的Bolt有BaseBasicBolt和BaseRichBolt。
在BaseBasicBolt中，BasicOutputCollector在emit数据的时候，会自动和输入的tuple相关联，而在execute方法结束的时候那个输入tuple会被自动ack。
在使用BaseRichBolt需要在emit数据的时候，显示指定该数据的源tuple要加上第二个参数anchor tuple，以保持tracker链路，即collector.emit(oldTuple, newTuple);并且需要在execute执行成功后调用OutputCollector.ack(tuple), 当失败处理时，执行OutputCollector.fail(tuple);

那么我们来看看BasicBolt的源码是不是这样的，不能因为看到别人的帖子说是这样的，我们就这样任务，以讹传讹，我们要To see is to believe。

为了方便看源代码，我先上我们的继承类：

public class SplitSentenceBolt extends BaseBasicBolt {  public void prepare(Map stormConf, TopologyContext context) {

        super.prepare(stormConf, context);

    }

    
　　//5：执行我们自己的逻辑处理方法，接收传入的参数。
　　public void execute(Tuple input, BasicOutputCollector collector) {

        String sentence = (String)input.getValueByField("sentence");

        String[] words = sentence.split(" ");

        for (String word : words) {

            word = word.trim();

            word = word.toLowerCase();

            collector.emit(new Values(word,1));//这个地方就是调用OutputCollector的包装类，来发消息

        }

    }

    public void declareOutputFields(OutputFieldsDeclarer declarer) {

        declarer.declare(new Fields("word","num"));

    }

}

通过打断点，我们发现，bolt的task会创建这个类下面会标准执行顺序

public class BasicBoltExecutor implements IRichBolt {

    public static Logger LOG = LoggerFactory.getLogger(BasicBoltExecutor.class);    

    private IBasicBolt _bolt;

    private transient BasicOutputCollector _collector;

    //1：创建该对象，然后把我们写的SplitSentenceBolt对象赋给父类IBasicBolt。

    public BasicBoltExecutor(IBasicBolt bolt) {

        _bolt = bolt;

    }

    public void declareOutputFields(OutputFieldsDeclarer declarer) {

        _bolt.declareOutputFields(declarer);//这里就是调用SplitSentenceBolt对象的方法了。

    }

  　//2:给BasicOutputCollector _collector字段赋值，BasicOutputCollector就是对OutputCollector类的包装。

    public void prepare(Map stormConf, TopologyContext context, OutputCollector collector) {

        _bolt.prepare(stormConf, context);

        _collector = new BasicOutputCollector(collector);

    }

　　//3：然后程序执行该方法，input的值source: spout1:4, stream: default, id: {}, [+ - * % /]

    public void execute(Tuple input) {

        _collector.setContext(input);//把接收到的tuple值设置给BasicOutputCollector中inputTuple字段。

        try {

            _bolt.execute(input, _collector);//这个地方是调用我们实现类SplitSentenceBolt的ececute方法。

            _collector.getOutputter().ack(input);//这个地方就是响应

        } catch(FailedException e) {

            if(e instanceof ReportedFailedException) {

                _collector.reportError(e);

            }

            _collector.getOutputter().fail(input);//这个地方就是响应

        }

    }

    public void cleanup() {

        _bolt.cleanup();

    }

    public Map<String, Object> getComponentConfiguration() {

        return _bolt.getComponentConfiguration();

    }

}

public class BasicOutputCollector implements IBasicOutputCollector {

    private OutputCollector out;

    private Tuple inputTuple;

    public BasicOutputCollector(OutputCollector out) {

        this.out = out;

    }
    //4:把收到的tuple数据赋值给inputTuple，这个时候BasicOutputCollector对象的字段都具有值了。

  　public void setContext(Tuple inputTuple) {

        this.inputTuple = inputTuple;

    }
　　 //6:这里我们发送新的（转换后的）tuple数据，看他内部的调用，其实他也会发送一个anchor tuple来保持tracker链路，
而这个anchor tuple就是bolt接收到转换前的源tuple数据。
 　　public List<Integer> emit(List<Object> tuple) { 
　　　　  return emit(Utils.DEFAULT_STREAM_ID, tuple);  
　　 }

    public List<Integer> emit(String streamId, List<Object> tuple) {

        return out.emit(streamId, inputTuple, tuple);

    }

   public void emitDirect(int taskId, String streamId, List<Object> tuple) {

        out.emitDirect(taskId, streamId, inputTuple, tuple);

    }

    public void emitDirect(int taskId, List<Object> tuple) {

        emitDirect(taskId, Utils.DEFAULT_STREAM_ID, tuple);

    }

    protected IOutputCollector getOutputter() {

        return out;

    }

    public void reportError(Throwable t) {

        out.reportError(t);

    }

}

这里大家不要纠结bolt的启动时从哪里开始的，我后面会讲的，这里我们关注的是，BasicBoltExecutor对象创建后的执行过程，以这我们来看执行的过程。在BasicBoltExecutor的execute方法中，我们看到了ack和fail方法会被自动调用的，当我们的程序抛出异常则会执行fail方法的。

这个

Storm的BaseBasicBolt源码解析ack机制的更多相关文章

Netty源码解析 -- ChannelPipeline机制与读写过程
本文继续阅读Netty源码,解析ChannelPipeline事件传播原理,以及Netty读写过程. 源码分析基于Netty 4.1 ChannelPipeline Netty中的ChannelPip ...
Storm可靠性实例解析——ack机制
对于Storm,它有一个很重要的特性:“Guarantee no data loss” ——可靠性很显然,要做到这个特性,必须要track每个data的去向和结果.Storm是如何做到的呢——ack ...
Flink 源码解析 —— 深度解析 Flink 序列化机制
Flink 序列化机制 https://t.zsxq.com/JaQfeMf 博客 1.Flink 从0到1学习 -- Apache Flink 介绍 2.Flink 从0到1学习 -- Mac 上搭 ...
[源码解析] 并行分布式框架 Celery 之容错机制
[源码解析] 并行分布式框架 Celery 之容错机制目录 [源码解析] 并行分布式框架 Celery 之容错机制 0x00 摘要 0x01 概述 1.1 错误种类 1.2 失败维度 1.3 应 ...
Android -- 从源码解析Handle+Looper+MessageQueue机制
1,今天和大家一起从底层看看Handle的工作机制是什么样的,那么在引入之前我们先来了解Handle是用来干什么的 handler通俗一点讲就是用来在各个线程之间发送数据的处理对象.在任何线程中,只要 ...
[Spark內核] 第42课：Spark Broadcast内幕解密：Broadcast运行机制彻底解密、Broadcast源码解析、Broadcast最佳实践
本课主题 Broadcast 运行原理图 Broadcast 源码解析 Broadcast 运行原理图 Broadcast 就是将数据从一个节点发送到其他的节点上; 例如 Driver 上有一张表,而 ...
jquery源码解析：jQuery数据缓存机制详解2
上一课主要讲了jQuery中的缓存机制Data构造方法的源码解析,这一课主要讲jQuery是如何利用Data对象实现有关缓存机制的静态方法和实例方法的.我们接下来,来看这几个静态方法和实例方法的源码解 ...
jquery源码解析：jQuery数据缓存机制详解1
jQuery中有三种添加数据的方法,$().attr(),$().prop(),$().data().但是前面两种是用来在元素上添加属性值的,只适合少量的数据,比如:title,class,name等 ...
【Java实战】源码解析Java SPI（Service Provider Interface ）机制原理
一.背景知识在阅读开源框架源码时,发现许多框架都支持SPI(Service Provider Interface ),前面有篇文章JDBC对Driver的加载时应用了SPI,参考[Hibernate ...

随机推荐

Unknown lifecycle phase "mvn". You must specify a valid lifecycle phase or a goal in the format <plugin-prefix>:<goal> or <plugin-group-id>:<plugin-artifact-id>[:<plugin-version>]:<goal>
在用maven命令启动storm时候,命令行是:mvn exec:java -Dexec.mainClass="TopologyMain" -Dexec.args="sr ...
PowerDesigner最基础的使用方法入门学习
1:入门级使用PowerDesigner软件创建数据库(直接上图怎么创建,其他的概念知识可自行学习) 我的PowerDesigner版本是16.5的,如若版本不一样,请自行参考学习即可.(打开软件即是 ...
SQL Server 2014新特性探秘(2)-SSD Buffer Pool Extension
简介 SQL Server 2014中另一个非常好的功能是,可以将SSD虚拟成内存的一部分,来供SQL Server数据页缓冲区使用.通过使用SSD来扩展Buffer-Pool,可以使得大量随 ...
轻量级前端MVVM框架avalon - 执行流程2
接上一章执行流程1 在这一大堆扫描绑定方法中应该会哪些实现? 首先我们看avalon能帮你做什么? 数据填充,比如表单的一些初始值,切换卡的各个面板的内容({{xxx}},{{xxx|html}}, ...
JavaScript 中的类方法，对象方法，Prototype方法
<script type="text/javascript"> function baseClass() { this.showMsg = function() { a ...
herbnate session.createSQLQuery(sql) 和 session.createQuery(sql)使用
public class DistributeDao implements Serializable{ private SessionFactory sessionFactory; public Se ...
（第六天）DOM
概念文档对象模型(DOM)是表示和操作HTML和XML文档内容的基础API. 选取文档元素 (1)通过ID选取元素 var id = document.getElementById("se ...
DOM扩展-HTML5、专有扩展
HTML5 与类相关的扩充 1.getElementsByClassName()方法改方法接受一个参数,即一个包含一或多个类名的字符串,返回带有指定类的所有元素的NodeList.传入多个类型时, ...
跌倒了，再爬起来：ASP.NET 5 Identity
"跌倒了"指的是这一篇博文:爱与恨的抉择:ASP.NET 5+EntityFramework 7 如果想了解 ASP.NET Identity 的"历史"及&q ...
从客户端(&)中检测到有潜在危险的 Request.Path 值
首先,这个问题出现在 ASP.NET MVC 应用程序中,所以下面的解决方式都是在这个环境下. 关于这个问题,网上又很多的答案,当时也搜了一些: A potentially dangerous Req ...

Storm的BaseBasicBolt源码解析ack机制

Storm的BaseBasicBolt源码解析ack机制的更多相关文章

随机推荐

热门专题