Storm 中什么是-acker，acker工作流程介绍

概述

我们知道storm一个很重要的特性是它能够保证你发出的每条消息都会被完整处理，完整处理的意思是指：

一个tuple被完全处理的意思是：这个tuple以及由这个tuple所导致的所有的tuple都被成功处理。而一个tuple会被认为处理失败了如果这个消息在timeout所指定的时间内没有成功处理。

也就是说对于任何一个spout-tuple以及它的所有子孙到底处理成功失败与否我们都会得到通知。关于如果做到这一点的原理，可以看看Twitter Storm如何保证消息不丢失这篇文章。从那篇文章里面我们可以知道，storm里面有个专门的acker来跟踪所有tuple的完成情况。这篇文章就来讨论acker的详细工作流程。

源代码列表

这篇文章涉及到的源代码主要包括:

backtype.storm.daemon.acker
backtype.storm.daemon.task
backtype.storm.task.OutputCollectorImpl

算法简介

acker对于tuple的跟踪算法是storm的主要突破之一，这个算法使得对于任意大的一个tuple树，它只需要恒定的20字节就可以进行跟踪了。原理很简单：acker 对于每个spout-tuple保存一个ack-val的校验值，它的初始值是0，然后每发射一个tuple/ack一个tuple，那么tuple的id都要跟这个校验值异或一下，并且把得到的值更新为ack-val的新值。那么假设每个发射出去的tuple都被ack了，那么最后ack-val一定是0(因为一个数字跟自己异或得到的值是0)。

进入正题

那么下面我们从源代码层面来看看哪些组件在哪些时候会给acker发送什么样的消息来共同完成这个算法的。acker对消息进行处理的主要是下面这块代码：

(let [id (.getValue tuple 0)

^TimeCacheMap pending @pending

curr (.get pending id)

curr (condp = (.getSourceStreamId tuple)

ACKER-INIT-STREAM-ID (-> curr

(update-ack id)

(assoc :spout-task (.getValue tuple 1)))

ACKER-ACK-STREAM-ID (update-ack

curr (.getValue tuple 1))

ACKER-FAIL-STREAM-ID (assoc curr :failed true))]

...)

Spout创建一个新的tuple的时候给acker发送消息

消息格式(看上面代码的第1行和第7行对于tuple.getValue()的调用)助

(spout-tuple-id, task-id)

消息的streamId是__ack_init(ACKER-INIT-STREAM-ID)

这是告诉acker, 一个新的spout-tuple出来了，你跟踪一下，它是由id为task-id的task创建的(这个task-id在后面会用来通知这个task：你的tuple处理成功了/失败了)。处理完这个消息之后， acker会在它的pending这个map(类型为TimeCacheMap)里面添加这样一条记录:

{spout-tuple-id {:spout-tasktask-id :valack-val)}

这就是acker对spout-tuple进行跟踪的核心数据结构，对于每个spout-tuple所产生的tuple树的跟踪都只需要保存上面这条记录。acker后面会检查:val什么时候变成0，变成0，说明这个spout-tuple产生的tuple都处理完成了。

Bolt发射一个新tuple的时候会给acker发送消息么？

任何一个bolt在发射一个新的tuple的时候,是不会直接通知acker的，如果这样做的话那么每发射一个消息会有三条消息了：

Bolt创建这个tuple的时候，把它发给下一个bolt的消息
Bolt创建这个tuple的时候，发送给acker的消息
ack tuple的时候发送的ack消息

事实上storm里面只有第一条和第三条消息，它把第二条消息省掉了，怎么做到的呢？storm这点做得挺巧妙的，bolt在发射一个新的bolt的时候会把这个新tuple跟它的父tuple的关系保存起来。然后在ack 每个tuple的时候，storm会把要ack的tuple的id, 以及这个tuple新创建的所有的tuple的id的异或值发送给acker。这样就给每个tuple省掉了一个消息(具体看下一节)。

Tuple被ack的时候给acker发送消息

每个tuple在被ack的时候，会给acker发送一个消息，消息格式是:助

(spout-tuple-id, tmp-ack-val)

消息的streamId是__ack_ack(ACKER-ACK-STREAM-ID)

注意，这里的tmp-ack-val是要ack的tuple的id与由它新创建的所有的tuple的id异或的结果：

tuple-id ^ (child-tuple-id1 ^ child-tuple-id2 ... )

我们可以从task.clj里面的send-ack方法看出这一点：

(defn- send-ack [^TopologyContext topology-context

^Tuple input-tuple

^List generated-ids send-fn]

(let [ack-val (bit-xor-vals generated-ids)]

(doseq [

[anchor id] (.. input-tuple

getMessageId

getAnchorsToIds)]

(send-fn (Tuple. topology-context

[anchor (bit-xor ack-val id)]

(.getThisTaskId topology-context)

ACKER-ACK-STREAM-ID))

)))

这里面的generated-ids参数就是这个input-tuple的所有子tuple的id，从代码可以看出storm会给这个tuple的每一个spout-tuple发送一个ack消息。

为什么说这里的generated-ids是input-tuple的子tuple呢？这个send-ack是被OutputCollectorImpl里面的ack方法调用的：

public void ack(Tuple input) {

List generated = getExistingOutput(input);

// don't just do this directly in case

// there was no output

_pendingAcks.remove(input);

_collector.ack(input, generated);

}

generated是由getExistingOutput(input)方法计算出来的，我们再来看看这个方法的定义:

private List getExistingOutput(Tuple anchor) {

if(_pendingAcks.containsKey(anchor)) {

return _pendingAcks.get(anchor);

} else {

List ret = new ArrayList();

_pendingAcks.put(anchor, ret);

return ret;

}

_pendingAcks里面存的是什么东西呢？

private Tuple anchorTuple(Collection< Tuple > anchors,

String streamId,

List< Object > tuple) {

// The simple algorithm in this function is the key

// to Storm. It is what enables Storm to guarantee

// message processing.

// 这个map存的东西是 spout-tuple-id到ack-val的映射

Map< Long, Long > anchorsToIds

= new HashMap<Long, Long>();

// anchors 其实就是它的所有父亲：spout-tuple

if(anchors!=null) {

for(Tuple anchor: anchors) {

long newId = MessageId.generateId();

// 告诉每一个父亲，你们又多了一个儿子了。

getExistingOutput(anchor).add(newId);

for(long root: anchor.getMessageId()

.getAnchorsToIds().keySet()) {

Long curr = anchorsToIds.get(root);

if(curr == null) curr = 0L;

// 更新spout-tuple-id的ack-val

anchorsToIds.put(root, curr ^ newId);

}

return new Tuple(_context, tuple,

_context.getThisTaskId(),

streamId,

MessageId.makeId(anchorsToIds));

}

从上面代码里面的红色部分我们可以看出， _pendingAcks里面维护的其实就是tuple到自己儿子的对应关系。

Tuple处理失败的时候会给acker发送失败消息

acker会忽略这种消息的消息内容(消息的streamId为ACKER-FAIL-STREAM-ID), 直接将对应的spout-tuple标记为失败(最上面代码第9行)

最后Acker发消息通知spout-tuple对应的Worker

最后， acker会根据上面这些消息的处理结果来通知这个spout-tuple对应的task：

(when (and curr

(:spout-task curr))

(cond (= 0 (:val curr))

;; ack-val == 0 说明这个tuple的所有子孙都

;; 处理成功了（都发送ack消息了)

;; 那么发送成功消息通知创建这个spout-tuple的task.

(do

(.remove pending id)

(acker-emit-direct @output-collector

(:spout-task curr)

ACKER-ACK-STREAM-ID

[id]

))

;; 如果这个spout-tuple处理失败了

;; 发送失败消息给创建这个spout-tuple的task

(:failed curr)

(do

(.remove pending id)

(acker-emit-direct @output-collector

(:spout-task curr)

ACKER-FAIL-STREAM-ID

[id]

))

Storm 中什么是-acker，acker工作流程介绍的更多相关文章

KMP算法的工作流程介绍
最近又想起了KMP算法,原来一直没搞明白工作原理,现在总算是开点窍了,推荐大家看这篇文章,写的很简单易懂推荐理由:简单明了,是我看过介绍KMP算法流程的所有文章中,最易懂的一篇(这篇文章仅仅是介绍了 ...
OSG 中相交測试模块工作流程及原理
主要涉及三个类: 1. osgUtil::PolytopeIntersector // 详细不同算法实现类 2. osgUtil::IntersectionVisitor //用来遍历节点树的每一个节 ...
Asp.net MVC的Model Binder工作流程以及扩展方法(1) - Custom Model Binder
在Asp.net MVC中, Model Binder是生命周期中的一个非常重要的部分.搞清楚Model Binder的流程,能够帮助理解Model Binder的背后发生了什么.同时该系列文章会列举 ...
Asp.net MVC的Model Binder工作流程以及扩展方法(1)
Asp.net MVC的Model Binder工作流程以及扩展方法(1)2014-03-19 08:02 by JustRun, 523 阅读, 4 评论, 收藏, 编辑在Asp.net MVC中 ...
kafka工作流程| 命令行操作
1. 概述数据层:结构化数据+非结构化数据+日志信息(大部分为结构化) 传输层:flume(采集日志--->存储性框架(如HDFS.kafka.Hive.Hbase))+sqoop(关系型数 ...
MapReduce与Yarn 的详细工作流程分析
MapReduce详细工作流程之Map阶段如上图所示首先有一个200M的待处理文件切片:在客户端提交之前,根据参数配置,进行任务规划,将文件按128M每块进行切片提交:提交可以提交到本地工作环 ...
【Struts2】工作流程
转发两篇文章一个请求在Struts2框架中的处理分为以下几个步骤: 1.客户端发出一个指向servlet容器的请求(tomcat): 2.这个请求会经过图中的几个过滤器,最后会到达FilterDis ...
[旧][Android] ButterKnifeProcessor 工作流程分析
备注原发表于2016.05.21,资料已过时,仅作备份,谨慎参考前言在 [Android] ButterKnife 浅析中,我们了解了 ButterKnife 的用法,比较简单. 本次文章我们 ...
tornado 学习笔记10 Web应用中模板（Template）的工作流程分析
第8,9节中,我们分析Tornado模板系统的语法.使用以及源代码中涉及到的相关类,而且对相关的源代码进行了分析.那么,在一个真正的Web应用程序中,模板到底是怎样使用?怎样被渲染? ...

随机推荐

C语言回文
#include <stdio.h> #include <string.h> int main() { ]; int i,j; printf("Please inpu ...
css垂直居中方法盘点
1.单行文字垂直居中利用 line-height 即可轻松实现,如下示例: height:45px;line-height:45px; 2.多行文本固定高度垂直居中1 利用 display:tabl ...
HTTP状态码
http状态码负责表示客户端HTTP请求的返回结果.标记服务器端的处理是否正常.通知出现的错误等工作. 状态码类别分组如下: 1. 1XX: informational(信息性状态码) 接收的请求正 ...
windows 安装 mongodb
windows 安装 mongodb 下载首先到官网下载合适的安装包,下载地址为 https://www.mongodb.com/download-center MongoDB for Window ...
应用市场中包名(package name)的唯一性
一般的应用商店,在开发者上传应用(APP)的时候,都会对应用的包名进行唯一性的校验.如果此时,用户上传的应用的包名与数据库中的已有的APP的包名一样,那么正常情况下,该应用就不能上传,而弹出提示说,该 ...
java多线程wait notify join
wait notify 几个注意点: wait 与 notify/notifyAll 方法必须在同步代码块中使用,即要先对调用对象加锁. 当线程执行wait()时,会把当前的锁释放,然后让出CPU,进 ...
Nginx + Tomcat Windows下的负载均衡配置
Nginx + Tomcat Windows下的负载均衡配置一.为什么需要对Tomcat服务器做负载均衡? Tomcat服务器作为一个Web服务器,其并发数在300-500之间,如果超过50 ...
Delphi中DBChart的数据库应用
一:属性相关:Series选项: (1)Format页(数据柱的风格) 在Color Each中打勾,就可使用多种颜色显示,color按钮用于设置颜色,Style用于设置图表的风格(Rectangle ...
SMP、NUMA、MPP(Teradata)体系结构介绍
从系统架构来看,目前的商用服务器大体可以分为三类,即对称多处理器结构 (SMP : Symmetric Multi-Processor) ,非一致存储访问结构 (NUMA : Non-Uniform ...
C#语言实现定时开启或禁用网卡小程序
C#语言实现定时开启/禁用网卡程序运行效果图程序实现主要代码源代码工程文件(VS2013工程文件编译通过) 查看网卡名称附图 1.win7旗舰版运行效果图: 2.程序实现主要代码: /// 网卡 ...

Storm 中什么是-acker，acker工作流程介绍

Storm 中什么是-acker，acker工作流程介绍的更多相关文章

随机推荐

热门专题