Storm是一个分布式的、高容错的实时计算系统。Storm适用的场景:

  1. Storm可以用来用来处理源源不断的消息,并将处理之后的结果保存到持久化介质中。
  2. 由于Storm的处理组件都是分布式的,而且处理延迟都极低,所以可以Storm可以做为一个通用的分布式RPC框架来使用。(实时计算?)

Storm集群架构

Storm集群采用主从架构方式,主节点是Nimbus,从节点是Supervisor,有关调度相关的信息存储到ZooKeeper集群中,架构如下图所示

  • Nimbus:Storm集群的Master节点,负责分发用户代码,指派给具体的Supervisor节点上的Worker节点,去运行Topology对应的组件(Spout/Bolt)的Task。
  • Supervisor:Storm集群的从节点,负责管理运行在Supervisor节点上的每一个Worker进程的启动和终止。
  • ZooKeeper:
    • 存储客户端提供的topology任务信息,nimbus负责将任务分配信息写入Zookeeper,supervisor从Zookeeper上读取任务分配信息
    • 存储supervisor和worker的心跳(包括它们的状态),使得nimbus可以监控整个集群的状态, 从而重启一些挂掉的worker
    • 存储整个集群的所有状态信息和配置信息。

组件抽象

我们先看一下,Topology提交到Storm集群后的运行时部署分布图,如下图所示:



通过上图我们可以看出,一个Topology的Spout/Bolt对应的多个Task可能分布在多个Supervisor的多个Worker内部。而每个Worker内部又存在多个Executor,根据实际对Topology的配置在运行时进行计算并分配。

  • Topology:Storm对一个分布式计算应用程序的抽象,目的是通过一个实现Topology能够完整地完成一件事情(从业务角度来看)。一个Topology是由一组静态程序组件(Spout/Bolt)、组件关系Streaming Groups这两部分组成。
  • Spout:描述了数据是如何从外部系统(或者组件内部直接产生)进入到Storm集群
  • Bolt:描述了与业务相关的处理逻辑。
  • Task:Spout/Bolt在运行时所表现出来的实体,都称为Task(多个)
  • Worker:运行时Task所在的一级容器,Executor运行于Worker中,一个Worker对应于Supervisor上创建的一个JVM实例(和Spark一样的概念)
  • Executor:运行时Task所在的直接容器,在Executor中执行Task的处理逻辑

数据流

storm是流式计算框架,数据源源不断地到来。storm中,每条消息称为元组,我们可以把这条消息灵活地看作KV结构。

容错

一般而言,数据在节点间的传递次数氛围以下三种,storm根据用户指定,选择这三种类型的数据保证:

  1. 至少一次:节点收到相同的数据一次或者多次
  2. 至多一次:节点最多收到一次数据(S4),没有容错
  3. 只有一次:计算正确性的必须保证(strom特有的可以选择数据只被计算一次,防止有些有状态的任务,多次计算后出错)

至少送达一次

storm在保证数据被传递到所有节点方面做得非常巧妙。

  1. 对于每条消息i,赋予64bit长度的ID。同时,在一张表T(表是逻辑上的,通过一致性hash来找到对应的消息)上记录这条消息的初始ID di = ID。
  2. 在每个后继节点上,每产生一条消息,就会生成一个随机ID。然后更新di = di ^ 消息输入ID ^ (消息输出ID1 ^ 消息输出ID2 ……)
  3. 当di = 0,说明已经成功处理消息。
  4. storm定期扫描T,对于没有成功更新为0的消息,重新发送。对于这种机制,我们可以发现,存在误判的概率2^(-64)

上面说得有点抽象,举例:



上面图12-10不对,系统表T是这样的

header 1 header 2
d1 [11011->0]
d2 [11101->0]

原理:每一条消息ID,我们都会异或两次,一次是前驱节点在产生这条消息的时候,一次是在后继节点消费这条消息后。

Trident

通过Trident API同时实现了状态持久化和“恰好送达一次”

  1. 将多条数据封装为一个batch(这不成批处理了吗),每个batch都有一个递增的ID(要有一个全局递增ID,需要zookeeper的帮助啊)。通过前面的至少发送一次机制,发现某个ID的batch处理失败,重新发送这个batch,ID不变
  2. 各个计算节点在计算过程中通过ID提交状态,如果发现已经有这个ID的状态,则放弃本次计算。
  3. ID必须顺序提交

storm高可用性(HA)

  • 如果woker挂了,supervisor会重新创建

    • bolt任务失败直接重新启动
    • Spout任务失败,会再次从数据源拿数据
  • 如果机器节点挂了,nimbus会把该节点上的task转移到其他节点
  • 如果nimbus或者supervisor挂了,重启就行了。nimbus和supervisor被设计成无状态,- 状态都被存到zookeeper里面了
  • 为防止nimbus挂掉,worker节点也挂掉,导致任务无法被nimbus转移到其他机器。nimbus也被设计成HA的,利用主从结构保证主节点挂了之后从节点一样能服务

Stream Groupings(shuffle)

Storm中最重要的抽象,应该就是Stream grouping了,它能够控制Spot/Bolt对应的Task以什么样的方式来分发Tuple,将Tuple发射到目的Spot/Bolt对应的Task,如下图所示:

  1. Shuffle Grouping:随机分组,跨多个Bolt的Task,能够随机使得每个Bolt的Task接收到大致相同数目的Tuple,但是Tuple不重复
  2. Fields Grouping:根据指定的Field进行分组 ,同一个Field的值一定会被发射到同一个Task上
  3. Partial Key Grouping:与Fields grouping 类似,根据指定的Field的一部分进行分组分发
  4. All Grouping:所有Bolt的Task都接收同一个Tuple(这里有复制的含义)
  5. Global Grouping:所有的流都指向一个Bolt的同一个Task(也就是Task ID最小的)
  6. None Grouping:不需要关心Stream如何分组,等价于Shuffle grouping
  7. Direct Grouping:由Tupe的生产者来决定发送给下游的哪一个Bolt的Task ,这个要在实际开发编写Bolt代码的逻辑中进行精确控制
  8. Local or Shuffle Grouping:如果目标Bolt有1个或多个Task都在同一个Worker进程对应的JVM实例中,则Tuple只发送给这些Task

最常用的应该是Shuffle Grouping(随机)、Fields Grouping(哈希)、Direct Grouping(用户指定)这三种

Topology并行度计算

conf.setNumWorkers(2); // 该Topology运行在Supervisor节点的2个Worker进程中

topologyBuilder.setSpout("blue-spout", new BlueSpout(), 2); // 设置并行度为2,则Task个数为2*1

topologyBuilder.setBolt("green-bolt", new GreenBolt(), 2)
.setNumTasks(4)
.shuffleGrouping("blue-spout"); // 设置并行度为2,设置Task个数为4 ,则Task个数为4 topologyBuilder.setBolt("yellow-bolt", new YellowBolt(), 6)
.shuffleGrouping("green-bolt"); // 设置并行度为6,则Task个数为6*1

一共有12个任务,10的并行度,2个work。所以一个work里面有5个executor,6个task(分别是1蓝,2绿,3黄),storm会把同类型的Task尽量放到同一个Executor中运行,Task个数最少的开始分配。

work和excutor内部构造

  • 同一work不同executor的两个task消息传递

  • 不同work不同executor的两个task消息传递

上图我们还能看出同一executor不同task之间的消息传递

总结:

  1. 同一work之内的消息传递都要通过executor的消息收发线程
  2. 不同work的消息传递要通过work的收发线程
  3. 每个Executor应该维护Task与所在的Executor之间的关系,这样才能正确地将Tuple传输到目的Bolt Task进行处理。

Storm:分布式流式计算框架的更多相关文章

  1. 【流处理】Kafka Stream-Spark Streaming-Storm流式计算框架比较选型

    Kafka Stream-Spark Streaming-Storm流式计算框架比较选型 elasticsearch-head Elasticsearch-sql client NLPchina/el ...

  2. 分布式流式计算平台——S4

    本文是作者在充分阅读和理解Yahoo!最新发布的技术论文<S4:Distributed Stream Computing Platform>的基础上,所做出的知识分享. S4是Yahoo! ...

  3. Faust——python分布式流式处理框架

    摘要 Faust是用python开发的一个分布式流式处理框架.在一个机器学习应用中,机器学习算法可能被用于数据流实时处理的各个环节,而不是仅仅在推理阶段,算法也不仅仅局限于常见的分类回归算法,而是会根 ...

  4. 分布式流式处理框架:storm简介 + Storm术语解释

    简介: Storm是一个免费开源.分布式.高容错的实时计算系统.它与其他大数据解决方案的不同之处在于它的处理方式.Hadoop 在本质上是一个批处理系统,数据被引入 Hadoop 文件系统 (HDFS ...

  5. Storm 流式计算框架

    1. 简介 是一个分布式, 高容错的 实时计算框架 Storm进程常驻内存, 永久运行 Storm数据不经过磁盘, 在内存中流转, 通过网络直接发送给下游 流式处理(streaming) 与 批处理( ...

  6. 实时流式计算框架Storm 0.9.0发布通知(中文版)

    Storm0.9.0发布通知中文翻译版(2013/12/10 by 富士通邵贤军 有错误一定告诉我 shaoxianjun@hotmail.com^_^) 我们很高兴宣布Storm 0.9.0已经成功 ...

  7. 实时流式计算框架——JStorm

    1.本地调试 a.步骤:生成Topology——实现Spout接口——实现Bolt接口——编译运行 b.加入依赖 <!-- JStorm --> <dependency> &l ...

  8. Storm简介——实时流式计算介绍

    概念 实时流式计算: 大数据环境下,流式数据将作为一种新型的数据类型,这种数据具有连续性.无限性和瞬时性.是实时数据处理所面向的数据类型,对这种流式数据的实时计算就是实时流式计算. 特征 实时流式计算 ...

  9. 流式计算(一)-Java8Stream

    大约各位看官君多少也听说了Storm/Spark/Flink,这些都是大数据流式处理框架.如果一条手机组装流水线上不同的人做不同的事,有的装电池,有的装屏幕,直到最后完成,这就是典型的流式处理.如果手 ...

随机推荐

  1. GeoServer中配置GeoWebCache切片缓存目录

    war版的GeoServer中,默认情况下,GeoWebCache切片会缓存在C盘某目录下.该目录比较隐蔽,并且随着切片缓存的增多,所占空间也会越来越大,所以建议手动配置其切换缓存目录. 配置方式:在 ...

  2. ovs 下流表port 1进入,port 1出去

    问题:ovs流量从in_port=1进入,然后从output:1出去,就是说,流量从哪个端口进来,然后从哪个端口出去 流表: ovs-ofctl add-flow br-int in_port=10, ...

  3. 复制表结构和内容到另一张表中的SQL语句

    1.复制表结构及数据到新表 CREATE TABLE 新表 SELECT * FROM 旧表 2.只复制表结构到新表 CREATE TABLE 新表 SELECT * FROM 旧表 WHERE 1= ...

  4. Redhead安装VMware Tools

    Redhead安装VMware Tools VMware Tools 是款插件,便于在图形化界面中移动鼠标和复制拖动文件,对于redhead等命令符界面用处不大. 2.挂载光盘安装方法

  5. Ubuntu“无法打开锁文件(Could not get lock)”问题解决

    用apt-get安装软件时提示: 无法获得锁 /var/lib/dpkg/lock - open(11:资源暂时不可用) 无法锁定管理目录(/var/lib/dpkg/),是否有其他进程正占用它? 其 ...

  6. 【xsy1147】 异或(xor) 可持久化trie

    我的脑回路可能比较奇怪. 我们对这些询问离线,将所得序列${a}$的后缀和建$n$棵可持久化$trie$. 对于一组询问$(l,r,x)$,我们在主席树上询问第$l$棵树$-$第r$+1$棵树中与$s ...

  7. 【xsy1154】 DNA配对 FFT

    题目大意:给你一个字符串$s$和字符串$w$,字符集为${A,T,C,G}$,你要在字符串$s$中选出一个与$w$长度相同的子串,使得这两个串的差异度最小. 两个字符$c1$,$c2$的差异度为给定的 ...

  8. UIScrollView之isTracking delaysContentTouches canCancelContentTouches

    UIScrollView有一个BOOL类型的tracking属性,用来返回用户是否已经触及内容并打算开始滚动,我们从这个属性开始探究UIScrollView的工作原理: 当手指触摸到UIScrollV ...

  9. YYYY-mm-dd HH:MM:SS 时间格式

    YYYY-mm-dd HH:MM:SS部分解释 d               月中的某一天.一位数的日期没有前导零.    dd             月中的某一天.一位数的日期有一个前导零.   ...

  10. sql_auoload_regiester() 解释(转载)

    在了解这个函数之前先来看另一个函数:__autoload. 一.__autoload 这是一个自动加载函数,在PHP5中,当我们实例化一个未定义的类时,就会触发此函数.看下面例子: 运行index.P ...