一、Storm相关术语:

  • Nimbus: Storm集群主节点,负责资源的分配和任务的调度
  • Supervisor:Storm集群工作节点,接受Nimbus分配的任务,管理Worker
  • Worker:Supervisor下的工作进程,具体任务执行
  • Task:Worker下的工作线程
  • Topology:实时计算逻辑,计算拓扑,由spout和bolt组成的图状结构
  • Spout:Storm编程模型中的消息源
  • Bolt:Storm编程模型中的处理组件,定义execute方法进行实际的数据逻辑处理
  • Stream:拓扑中的消息流,传输的对象是Tuple
  • Tuple:一次消息传递的基本单元

一、Storm几个常用的操作命令:

  • storm active : 激活指定任务;
  • storm drpc:启动一个DRPC进程;
  • storm deactivate: 暂停storm的任务;
  • storm kill:通过任务名称kill一个任务;
  • storm list:列出正在运行的topologies和状态;
  • storm nimbus: 启动一个nimbus进程;
  • storm supervisor: 启动一个supervisor进程;
  • storm ui : 启动监控页面UI的后台进程;
  • storm rebalance: 节点扩展后进行负载均衡;

二、Storm编程模型

1、消息源Spout->继承BaseRichSpout类或者实现IRichSpout接口:

  • open方法,初始化动作;
  • nextTuple方法,消息接入,执行数据的发射;
  • ack方法,tuple成功处理后调用;
  • fail方法,tuple处理失败时调用;
  • declareOutputFields方法,声明输出字段。

2、处理单元Bolt->继承BaseBasicBolt类或者实现IRichBolt接口:

  • prepare方法,worker启动时初始化;
  • execute方法,接受一个tuple并执行逻辑处理,发射出去;
  • cleanup方法,关闭前调用;
  • declareOutputFields方法,字段申明。

三、Storm应用实例的实现步骤

1、根据自己业务需求进行方案及拓扑的设计,并通过代码来实现拓扑

2、将编写好的源代码进行打包(最好用maven来操作)

$ mvn package // 这种打包方式将不包含依赖包 
$ mvn assembly:assembly //包含依赖包

3、将拓扑提交到集群上运行

$ storm jar [jar包的名称] [包中实现topology的类的地址] [自定义的topology的名称]

4、进行拓扑UI的监控

$ nohup storm ui &

以下是UI界面监控的集群及Topology的情况:

以下是Topology的详细情况:

最后是Storm执行Topology任务后的输出结果:

Storm 使用手册的更多相关文章

  1. Storm官方帮助手册翻译(下)

    使用其他语言编写Bolt Bolt可以使用任意语言编写.用另外一种语言编写Bolt来作为子进程运行.Storm会在标准输入输出的基础上使用Json来与子进程通信.通信协议之需要一个100行的适配器库, ...

  2. Storm官方帮助手册翻译(上)

    Storm作为当前最流行的实时计算框架,自Twitter将其开源后就一直备受关注.由于其具有先天的稳定性以及便捷性,目前被许多大公司所采用,国外像雅虎.雅虎日本.Twitter.OOYALA.Spot ...

  3. Storm中遇到的日志多次重写问题(一)

    业务描述: 统计从kafka spout中读取的数据条数,以及写入redis的数据的条数,写入hdfs的数据条数,写入kafaka的数据条数.并且每过5秒将数据按照json文件的形式写入日志.其中保存 ...

  4. Storm 实战:构建大数据实时计算

    Storm 实战:构建大数据实时计算(阿里巴巴集团技术丛书,大数据丛书.大型互联网公司大数据实时处理干货分享!来自淘宝一线技术团队的丰富实践,快速掌握Storm技术精髓!) 阿里巴巴集团数据平台事业部 ...

  5. storm源码之storm代码结构【译】【转】

    [原]storm源码之storm代码结构[译]  说明:本文翻译自Storm在GitHub上的官方Wiki中提供的Storm代码结构描述一节Structure of the codebase,希望对正 ...

  6. storm环境搭建

    备注——使用: 1.单机版本: 启动zkServer.nimbus.supervisor.ui服务: zkServer.sh start zkServer.sh status #查看zkserver是 ...

  7. 【原】storm源码之storm代码结构【译】

    说明:本文翻译自Storm在GitHub上的官方Wiki中提供的Storm代码结构描述一节Structure of the codebase,希望对正在基于Storm进行源码级学习和研究的朋友有所帮助 ...

  8. storm入门教程 第一章 前言[转]

    1.1   实时流计算 互联网从诞生的第一时间起,对世界的最大的改变就是让信息能够实时交互,从而大大加速了各个环节的效率.正因为大家对信息实时响应.实时交互的需求,软件行业除了个人操作系统之外,数据库 ...

  9. storm源码之storm代码结构【译】

    storm源码之storm代码结构[译] 说明:本文翻译自Storm在GitHub上的官方Wiki中提供的Storm代码结构描述一节Structure of the codebase,希望对正在基于S ...

随机推荐

  1. Redis——windows下如何连接Linux(centos7.x)虚拟机的Redis——【二】

    我的虚拟网络使用的是桥接网络和windows主机IP为同一网段,做下面步骤之前请确保网络通畅. 使用cmd的ping来测试 软件 https://redisdesktop.com/download 下 ...

  2. 用牛顿-拉弗森法定义平方根函数(Newton-Raphson method Square Root Python)

    牛顿法(Newton’s method)又称为牛顿-拉弗森法(Newton-Raphson method),是一种近似求解实数方程式的方法.(注:Joseph Raphson在1690年出版的< ...

  3. Iroha and a Grid AtCoder - 1974(思维水题)

    就是一个组合数水题 偷个图 去掉阴影部分  把整个图看成上下两个矩形 对于上面的矩形求出起点到每个绿点的方案 对于下面的矩形 求出每个绿点到终点的方案 上下两个绿点的方案相乘后相加 就是了 想想为什么 ...

  4. ZOJ 3846 GCD Reduce//水啊水啊水啊水

    GCD Reduce Time Limit: 2 Seconds      Memory Limit: 65536 KB      Special Judge You are given a sequ ...

  5. JLOI2016 简要题解

    「JLOI2016」侦查守卫 题意 有一个 \(n\) 个点的树,有 \(m\) 个关键点需要被监视.可以在其中一些点上插眼,在 \(i\) 号点上放眼需要花费 \(w_i\) 的代价,可以监视距离 ...

  6. Swarm stack

    什么是 stack ?例如:首先创建 secret. 然后创建 MySQL service,这是 WordPress 依赖的服务. 最后创建 WordPress service. 也就是说,这个应用包 ...

  7. Bomb HDU - 5934 (Tarjan)

    #include<map> #include<set> #include<ctime> #include<cmath> #include<stac ...

  8. 【mysql】mysql null值

    在数据表我们有时候有些表字段会为null,表示空.其实在mysql中null值是占用空间的. mysql手册如下解释 NULL columns require additional space in ...

  9. HDU5985 Lucky Coins 概率dp

    题意:给你N种硬币,每种硬币有Si个,有Pi 概率朝上,每次抛所有硬币抛起,所有反面的拿掉,问每种硬币成为最后的lucky硬币的概率. 题解:都知道是概率dp,但是模拟赛时思路非常模糊,很纠结,dp[ ...

  10. Cannot set property 'innerHTML' of null

    异常处理汇总-前端系列 http://www.cnblogs.com/dunitian/p/4523015.html 看如下错误代码: 知道是加载的问题就好解决了