spout详解

spout放在每个executer执行，我们先从spoutExecutors的初始化开始往下看，spoutExecutors是在一个worker中管理其中的tasks，在SpoutExecutors的构造函数中初始化一些组件：taskId，topologyId，spout等，在这个线程中，除了一些常见的属性，可以看到还会去创建并设置两个对象，将待执行的task信息传入：

1、TaskTransfer

2、TaskHeartbeatTrigger

构造完成之后，init方法进行一些初始化，在这里执行spout的open方法同时进行事件注册：

    this.spout.open(storm_conf, userTopologyCtx, outputCollector);

    LOG.info("Successfully open SpoutExecutors " + idStr);

    taskHbTrigger.register();

    int delayRun = ConfigExtension.getSpoutDelayRunSeconds(storm_conf);

    // wait other bolt is ready
    JStormUtils.sleepMs(delayRun * 1000);

    if (taskStatus.isRun()) {
        spout.activate();
    } else {
        spout.deactivate();
    }

    LOG.info(idStr + " is ready ");

}

在spout调用open初始化完成之后，spout需要根据配置文件每10秒读取一次数据，这个是怎么实现的呢？发现在调用open之后，会调用taskHbTrigger.register()，taskHeartbeatTrigger是一个TimerTrigger的继承类,他会根据配置，通过ScheduledExecutorService设置每隔一段时间执行task。

Spout.emit过程：

真正执行emit的是SpoutCollector.sendMsg

public List<Integer> sendMsg(String out_stream_id, List<Object> values, Object message_id, Integer out_task_id,  ICollectorCallback callback) {
    final long startTime = emitTotalTimer.getTime();
    try {
        boolean needAck = (message_id != null) && (ackerNum > 0); //needAck满足的两个条件
        Long root_id = getRootId(message_id);//如果需要ack,随机生成rootId，并对rootId做一次去重校验
        java.util.List<Integer> out_tasks;

        if (out_task_id != null) {
            out_tasks = sendTargets.get(out_task_id, out_stream_id, values, null, root_id);
        } else {
            out_tasks = sendTargets.get(out_stream_id, values, null, root_id);
        }
        if (out_tasks.size() == 0) {
            // don't need send tuple to other task
            return out_tasks;
        }

        List<Long> ackSeq = new ArrayList<Long>();
        for (Integer t : out_tasks) {
            MessageId msgid;
            if (needAck) {
                // Long as = MessageId.generateId();
                Long as = MessageId.generateId(random);
                msgid = MessageId.makeRootId(root_id, as);
                ackSeq.add(as);
            } else {
                msgid = MessageId.makeUnanchored();
            }

            TupleImplExt tp = new TupleImplExt(topology_context, values, task_id, out_stream_id, msgid);
            tp.setTargetTaskId(t);
            transfer_fn.transfer(tp);
        }
        sendMsgToAck(out_stream_id, values,  message_id,  root_id, ackSeq, needAck);
        if (callback != null)
            callback.execute(out_tasks);
        return out_tasks;
    } finally {
        emitTotalTimer.updateTime(startTime);
    }
}

spout详解的更多相关文章

Storm配置项详解【转】
Storm配置项详解 ——阿里数据平台技术博客:storm配置项详解什么是Storm? Storm是twitter开源的一套实时数据处理框架,基于该框架你可以通过简单的编程来实现对数据流的实时处理变 ...
JStorm第一个程序WordCount详解
一.Strom基本知识(回顾) 1,首先明确Storm各个组件的作用,包括Nimbus,Supervisor,Spout,Bolt,Task,Worker,Tuple nimbus是整个storm任务 ...
storm源码之理解Storm中Worker、Executor、Task关系 + 并发度详解
本文导读: 1 Worker.Executor.task详解 2 配置拓扑的并发度 3 拓扑示例 4 动态配置拓扑并发度 Worker.Executor.Task详解: Storm在集群上运行一个To ...
大数据入门第十六天——流式计算之storm详解（二）常用命令与wc实例
一.常用命令 1.提交命令提交任务命令格式:storm jar [jar路径] [拓扑包名.拓扑类名] [拓扑名称] torm jar examples/storm-starter/storm-st ...
大数据入门第十六天——流式计算之storm详解（一）入门与集群安装
一.概述今天起就正式进入了流式计算.这里先解释一下流式计算的概念离线计算离线计算:批量获取数据.批量传输数据.周期性批量计算数据.数据展示代表技术:Sqoop批量导入数据.HDFS批量存储数据 ...
Storm概念、原理详解及其应用（一）BaseStorm
本文借鉴官文,添加了一些解释和看法,其中有些理解,写的比较粗糙,有问题的地方希望大家指出.写这篇文章,是想把一些官文和资料中基础.重点拿出来,能总结出便于大家理解的话语.与大多数“wordcount” ...
Storm 第三章 Storm编程案例及Stream Grouping详解
1 功能说明设计一个topology,来实现对文档里面的单词出现的频率进行统计.整个topology分为三个部分: SentenceSpout:数据源,在已知的英文句子中,随机发送一条句子出去. S ...
Storm的wordCounter计数器详解
原文:http://www.maoxiangyi.cn/index.php/archives/362 拓扑点击(此处)折叠或打开 package cn.jd.storm; import backty ...
Storm 学习之路（二）—— Storm核心概念详解
一.Storm核心概念 1.1 Topologies(拓扑) 一个完整的Storm流处理程序被称为Storm topology(拓扑).它是一个是由Spouts 和Bolts通过Stream连接起来的 ...

随机推荐

crontab Job权限重要
在撰写JOb时,需要将SH目录及文件设为777,方可正常执行~
Spring事务属性的介绍
Spring声明式事务让我们从复杂的事务处理中得到解脱.使得我们再也无需要去处理获得连接.关闭连接.事务提交和回滚等这些操作.再也无需要我们在与事务相关的方法中处理大量的try-catch-final ...
Javascript学习笔记：3种检测变量类型的方法
①typeof检测变量类型 console.log(typeof 1);//number console.log(typeof "a");//string console.log( ...
使用 CSS3 绘制 Hello Kitty
偶然间看到了 SegmentFault 上的一篇文章,感觉这个 Hello Kitty 画的还不错,心血来潮也用 CSS3 画了个 Hello Kitty,现在在这里记录一下详细的绘制过程.想要源码. ...
unreal slate 创建 window
testWindow = SNew(SWindow) .Title(LOCTEXT("Asset Window", "Asset Window")) .Clie ...
Java资源大全中文版（Awesome最新版）（转载）
原文地址:http://www.cnblogs.com/best/p/5876559.html 目录业务流程管理套件字节码操作集群管理代码分析编译器生成工具构建工具外部配置工具约束满足 ...
译\Node.js应用的持续部署
Node.js应用的持续部署翻译前翻译自:https://blog.risingstack.com/continuous-deployment-of-node-js-applications/ 正 ...
Less2css error 终极解决方案（转载）
用到less时遇到的问题 ,然后复制过来的使用sublime Text3 的时候,安装less2Css后,和很多人一样以为大功告成,开始要运行编译less文件,结果开始发现于是乎开始搜索问题和解决 ...
footer绝对定位但是不在页面最下边解决方案
方案一 html { height: 100%; } body { position: relative; min-height: 100%; box-sizing: border-box; padd ...
mysql字符串函数(转载)
对于针对字符串位置的操作,第一个位置被标记为1. ASCII(str) 返回字符串str的最左面字符的ASCII代码值.如果str是空字符串, 返回0.如果str是NULL,返回NULL. mysq ...

spout详解

spout详解的更多相关文章

随机推荐

热门专题