Storm集群启动流程分析

Storm集群启动流程分析

程序员

1、客户端运行storm nimbus时，会调用storm的python脚本，该脚本中为每个命令编写了一个方法，每个方法都可以生成一条相应的Java命令。

命令格式：java -server xxx.ClassName -args

nimbus--->Running:/export/servers/jdk/bin/java -server backtype.storm.daemon.nimbus

supervisor--->Running:/export/servers/jdk/bin/java -server backtype.storm.daemon.supervisor

nimbus

2、nimbus启动之后，接受客户端提交任务

命令格式：storm jar xxx.jar xxx.驱动类参数

Running:/export/servers/jdk/bin/java -client -Dstorm.jar=/export/servers/storm/examples/storm-master/storm-master-topologies-0.9.5.jar org.apache.storm.starter.WordCountTopology wordcount-2017-5-20

该命令会执行storm-starter-topologies-0.9.5.jar中的storm-starter-topologies-0.9.5.jar的main方法，main方法中会执行以下代码：

StormSubmitter.submitTopology("mywordcount",config,topologyBuilder.createTopology());

topologyBuilder.createTopology(),会将程序员编写的spout对象和bolt对象进行序列化。

会将用户的jar上传到nimbus物理节点的/export/data/storm/workdir/nimbus/inbox目录下。并且改名，改名的规则是添加了一个UUID字符串。

在nimbus物理节点的/export/data/storm/workdir/nimbus/stormdist目录下。有当前正在运行的topology的jar包和配置文件，序列化对象文件。

3、接收到任务之后，会将任务进行分配，分配会产生一个assignment对象，该对象会保存到Zookeeper中，目录是/storm/assignments,该目录只保存正在运行的topology任务。

supervisor

4、supervisor通过watch机制，感知到nimbus在zookeeper上的任务分配信息，从zookeeper上拉取任务信息，分辨出属于自己的任务。

5、supervisor根据自己的任务信息，启动自己的worker，并分配一个端口。

worker

6、worker启动之后，连接zookeeper，拉取任务。

　　得到对象的几种方式？new className创建对象、class.forName反射对象、clone克隆对象、序列化反序列化对象

　　worker通过反序列化，得到程序自己定义的spout对象和bolt对象。

7、worker根据任务类型，分别执行spout任务或者bolt任务。

　　spout生命周期是：open、nextTuple、declareOutputFields

　　bolt生命周期是：prepare、execute(Tuple)、declareOutputFields

Storm集群启动流程分析的更多相关文章

Hadoop的HA集群启动和停止流程
假设我们有3台虚拟机,主机名分别是hadoop01.hadoop02和hadoop03. 这3台虚拟机的Hadoop的HA集群部署计划如下: 3台虚拟机的Hadoop的HA集群部署计划 hadoop0 ...
大数据处理框架之Strom:Storm集群环境搭建
搭建环境 Red Hat Enterprise Linux Server release 7.3 (Maipo) zookeeper-3.4.11 jdk1.7.0_80 Pyth ...
storm集群安装
1.下载storm安装文件并解压 [root@hadoop01 soft]# wget http://mirrors.hust.edu.cn/apache/storm/apache-storm-1.1 ...
Storm集群部署及单词技术
1. 集群部署的基本流程集群部署的流程:下载安装包.解压安装包.修改配置文件.分发安装包.启动集群注意: 所有的集群上都需要配置hosts vi /etc/hosts 192.168.239.1 ...
Storm集群组件和编程模型
Storm工作原理: Storm是一个开源的分布式实时计算系统,常被称为流式计算框架.什么是流式计算呢?通俗来讲,流式计算顾名思义:数据流源源不断的来,一边来,一边计算结果,再进入下一个流. 比 ...
2.Storm集群部署及单词统计案例
1.集群部署的基本流程 2.集群部署的基础环境准备 3.Storm集群部署 4.Storm集群的进程及日志熟悉 5.Storm集群的常用操作命令 6.Storm源码下载及目录熟悉 7.Storm 单词 ...
Storm入门教程第三章Storm集群安装部署步骤、storm开发环境
一. Storm集群组件 Storm集群中包含两类节点:主控节点(Master Node)和工作节点(Work Node).其分别对应的角色如下: 主控节点(Master Node)上运行一个被称为N ...
Storm 系列（三）Storm 集群部署和配置
Storm 系列(二)Storm 集群部署和配置本章中主要介绍了 Storm 的部署过程以及相关的配置信息.通过本章内容,帮助读者从零开始搭建一个 Storm 集群. 一.Storm 的依赖组件 1 ...
一：Storm集群环境搭建
第一:storm集群环境准备及部署[1]硬件环境准备--->机器数量>=3--->网卡>=1--->内存:尽可能大--->硬盘:无额外需求[2]软件环境准备---& ...

随机推荐

【题解】Luogu P2047 社交网络总结（Floyd算法，最短路计数）
题目描述在社交网络(social network)的研究中,我们常常使用图论概念去解释一些社会现象.不妨看这样的一个问题.在一个社交圈子里有n个人,人与人之间有不同程度的关系.我们将这个关系网络对 ...
angular的一次小错误
前台页面的错误: 在使用angular的时候,发现了标签等不能解析,忙了一个小时没找见错误在哪,最后才发现,原来ng-app,ng-controller等声明错了地方,声明在了div上,而不是在bod ...
在c语言中嵌入汇编语句，对于我来说相当难。
今天早上在csdn论坛上看到一个帖子http://topic.csdn.net/u/20120917/14/82f42e17-977a-4824-95bd-7b79db15d283.html:“C语言 ...
codeblocks调试
1.Next instruction 逐指令 (有可能一行内有多条指令) (Alt+F7) Next line 逐行(有可能一条指令分成多行) (F7) Next instruction: -> ...
Java基础-SSM之mybatis多对多关联
Java基础-SSM之mybatis多对多关联作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.准备测试环境(创建数据库表) 1>.创建teas,stus,links表 u ...
mysql 不同引擎的比较
mysql 支持的默认引擎是InnoDB,其他的常用引擎包括MyISAM等,那么他们有什么差别呢. 首先执行 show engines; 来查看数据库当前支持的引擎. 可以看到mysql支持这么多不同 ...
BZOJ2301：莫比乌斯反演+二维容斥解决GCD范围计数
这个题是刚才刷的第一道反演题的拓展版,加上一个容斥就可以了 #include<cstdio> #include<algorithm> using std::min; ; int ...
那些年的网络通信之 TCP/IP 传输控制协议 ip 加端口客户端上传文件到服务器端服务器端返回上传成功消息
多线程开启, 客户端通过 Socket 流上传文件到服务端的一个小程序练习. 1. 抓住阻塞式方法,去调试 2. 获取对应流对象操作对应的对象这时候自己不能懵,一定要清晰,最好命名就能区别,一搞混 ...
ReactJS -- 初学入门
<!DOCTYPE html> <html> <head> <script src="build/react.js"></sc ...
360 / 小米 / 百度随身wifi Ubuntu 下作为无线网卡使用
这篇文章说得其实很好了,http://www.freemindworld.com/blog/2013/131010_360_wifi_in_linux.shtml 不过因为专利问题,官网貌似不直接提供 ...

Storm集群启动流程分析

Storm集群启动流程分析的更多相关文章

随机推荐

热门专题