JStorm之Topology调度

topology在服务端提交过程中，会经过一系列的验证和初始化：TP结构校验、创建本地文件夹并拷贝序列化文件jar包、生成znode用于存放TP和task等信息，最后一步才进行任务分配。例如以下图：

watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQvbGlobTBfMQ==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/Center" alt="" />
提交主函数位于ServiceHandler.java中

private void makeAssignment(String topologyName, String topologyId,

		TopologyInitialStatus status) throws FailedAssignTopologyException {

	//1、创建topology的分配事件

	TopologyAssignEvent assignEvent = new TopologyAssignEvent();

	assignEvent.setTopologyId(topologyId);

	assignEvent.setScratch(false);

	assignEvent.setTopologyName(topologyName);

	assignEvent.setOldStatus(Thrift

			.topologyInitialStatusToStormStatus(status));

  //2、丢入事件处理队列

	TopologyAssign.push(assignEvent);

  //3、等待时间返回

	boolean isSuccess = assignEvent.waitFinish();

	if (isSuccess == true) {

		LOG.info("Finish submit for " + topologyName);

	} else {

		throw new FailedAssignTopologyException(

				assignEvent.getErrorMsg());

	}

}

这当中最基本的是事件丢入队列后兴许的处理过程。事件分配由TopologyAssign线程处理，这个线程的流程非常清晰，监听事件队列。一旦有事件进入，立即取出，进行doTopologyAssignment，例如以下：

public void run() {

	LOG.info("TopologyAssign thread has been started");

	runFlag = true;

	while (runFlag) {

		TopologyAssignEvent event;

		try {

			event = queue.take();

		} catch (InterruptedException e1) {

			continue;

		}

		if (event == null) {

			continue;

		}

		boolean isSuccess = doTopologyAssignment(event);

		..............

}

任务分配的核心代码位于TopologyAssign.java中

public Assignment mkAssignment(TopologyAssignEvent event) throws Exception {

	String topologyId = event.getTopologyId();

	LOG.info("Determining assignment for " + topologyId);

	TopologyAssignContext context = prepareTopologyAssign(event);

	Set<ResourceWorkerSlot> assignments = null;

	if (!StormConfig.local_mode(nimbusData.getConf())) {

		IToplogyScheduler scheduler = schedulers

				.get(DEFAULT_SCHEDULER_NAME);

		//開始进行作业的调度

		assignments = scheduler.assignTasks(context);

	} else {

		assignments = mkLocalAssignment(context);

	}

	............

}

调用栈例如以下：

分配原理是首先获得全部可用的supervisor，推断supervisor可用的标准是是否有空暇的slot，也就是是否全部supervisor.slots.ports指定port都被占用，然后计算出须要分配几个woker。由于一个woker相应一个port，当然这些信息的採集都是来自Zookeeper，如今我们来分析分配的核心代码：
WorkerMaker.java
//注意參数，result是这个作业须要的槽位。传入前仅仅知道须要槽位的数量，详细分配到哪台supervisor上还没指定
//supervisors指当前集群中全部可用的supervisor。即有空暇port的

private void putWorkerToSupervisor(List<ResourceWorkerSlot> result,

		List<SupervisorInfo> supervisors) {

	int key = 0;

	//按所需槽位遍历，每次分配一个

	for (ResourceWorkerSlot worker : result) {

		//首先进行必要的推断和置位

		if (supervisors.size() == 0)

			return;

		if (worker.getNodeId() != null)

			continue;

		if (key >= supervisors.size())

			key = 0;

		//1、取出第一个supervisor

		SupervisorInfo supervisor = supervisors.get(key);

		worker.setHostname(supervisor.getHostName());

		worker.setNodeId(supervisor.getSupervisorId());

		worker.setPort(supervisor.getWorkerPorts().iterator().next());

		//槽位用完则从集合中删除，不再參与分配

		supervisor.getWorkerPorts().remove(worker.getPort());

		if (supervisor.getWorkerPorts().size() == 0)

			supervisors.remove(supervisor);

		//当一个supervisor分配完后便不再使用。除非supervisor不够用

		key++;

	}

}

从上面的代码中我们能够看到，眼下槽位分配没考虑机器负载，槽位的分配并不一定平均，比方第一个supervisor有10个槽位，剩下的supervisor仅仅有两个，那么还是要每一个supervisor分配一个woker的。

注意一个问题，在上面代码中supervisors这个集合是经过排序的，排序规则例如以下：

private void putAllWorkerToSupervisor(List<ResourceWorkerSlot> result,

		List<SupervisorInfo> supervisors) {

	...........

	supervisors = this.getCanUseSupervisors(supervisors);

	Collections.sort(supervisors, new Comparator<SupervisorInfo>() {

		@Override

		public int compare(SupervisorInfo o1, SupervisorInfo o2) {

			// TODO Auto-generated method stub

			return -NumberUtils.compare(o1.getWorkerPorts().size(), o2

					.getWorkerPorts().size());

		}

	});

	this.putWorkerToSupervisor(result, supervisors);

	.............

}

能够看到。当前排序规则是按slot多少的，我们兴许版本号中可能会考虑机器负载的一些因素吧。

JStorm之Topology调度的更多相关文章

流量计算-Jstorm提交Topology过程(下一个)
马上部分流量计算-Jstorm提交Topology过程(上), 5.上篇任务已经ServiceHandler.submitTopologyWithOpts()方法.在该方法中,会实例化一个Topolo ...
流式计算-Jstorm提交Topology过程(上)
Topology是Jstorm对有向无环图的抽象,内部封装了数据来源spout和数据处理单元bolt,以及spout和bolt.bolt和bolt之间的关系.它能够被提交到Jstorm集群. 本文以J ...
Storm和JStorm(阿里的流处理框架)
本文导读: 1.What——JStorm是什么? 1.1 概述 .2优点 .3应用场景 .4JStorm架构 2.Why——为什么启动JStorm项目?(与storm的区别) .1storm的现状.缺 ...
阿里jstorm和storm区别
转自:https://www.cnblogs.com/cn-leodream/p/6497277.html 看介绍文档貌似挺好:https://github.com/alibaba/jstorm ...
jstorm之于storm
关于流处理框架,在先前的文章汇总已经介绍过Strom,今天学习的是来自阿里的的流处理框架JStorm.简单的概述Storm就是:JStorm 比Storm更稳定,更强大,更快,Storm上跑的程序,一 ...
阿里的STORM——JSTORM
看介绍文档貌似挺好:https://github.com/alibaba/jstorm 阿里拥有自己的实时计算引擎类似于hadoop 中的MR 开源storm响应太慢开源社区的速度完全跟不上A ...
JStorm学习
一.简介 JStorm是一个分布式实时计算引擎.JStorm是一个类似于Hadoop MapReduce的系统,用户按照指定的接口实现一个任务,然后将这个任务交给JStorm系统,JStorm将这个任 ...
JStorm：概念与编程模型
1.集群架构 JStorm从设计的角度,就是一个典型的调度系统,简单集群的架构如下图所示,其中Nimbus可增加一个备节点,多个Supervisor节点组成任务执行集群. 1.1.Nimbus Nim ...
让Storm插上CEP的翅膀 - Siddhi调研和集成
什么是 Siddhi? Siddhi 是一种 lightweight, easy-to-use, open source CEP(Complex Event Processing)引擎,由wso2公司 ...

随机推荐

软件測试、ios中的測试概念以及步骤
软件測试: 软件測试的目标是应该服务于软件项目的目标,能够通过建议反馈使用更加高效的方法和工具,提升软件开发效率以及软件开发质量.同一时候还能够通过过一些手段,更早.更快.很多其它地发现缺陷.从容减少 ...
【翻译自mos文章】11.2.0.4及更高版本号的asm实例中MEMORY_TARGET 和 MEMORY_MAX_TARGET的默认值和最小值
[翻译自mos文章]11.2.0.4及更高版本号的asm实例中MEMORY_TARGET 和 MEMORY_MAX_TARGET的默认值和最小值来源于: Default and Minimum ME ...
【opencv】opencv在vs下的配置（持续更新）
经常使用配置记录,会更新下去. 1.去掉ipch及.sdf文件 opencv在vs编译会得到很多文件.当中.dsf和ipch文件就有几十M.总是非常占空间,而这都是用来保存C++预编译的头文件和Int ...
2015.04.21,外语,读书笔记-《Word Power Made Easy》 11 “如何辱骂敌人” SESSION 31
1.no reverence iconoclast([ai'kɔnәklæst] n. 毁坏宗教神像的人, 提倡打破旧习的人)藐视传统.在青年的反叛期很容易出现iconoclasm([ai'kɔnә ...
POJ 2299 离散化线段树
点击打开链接 Ultra-QuickSort Time Limit: 7000MS Memory Limit: 65536K Total Submissions: 40827 Accepted ...
pyspark MLlib踩坑之model predict+rdd map zip，zip使用尤其注意啊啊啊！
Updated:use model broadcast, mappartition+flatmap,see: from pyspark import SparkContext import numpy ...
NEUOJ 1702 撩妹全靠魅力值 (三维偏序)
题目链接:http://acm.neu.edu.cn/hustoj/problem.php?id=1702 题目大意:就是问每个人三个属性同时不低于另外几个人....人不分先后经典的三维偏序问题解 ...
ubuntu软件卸载方法
一.查看软件包 1.查看已安装的软件包 dpkg --list 2.查看不知道要删除软件的具体名称 dpkg --get-selections | grep <软件相关名称> 二.卸载 1 ...
BZOJ 1989 概率相关
思路: 一条边免费的概率为 (经过它的路/总路径条数)^2 DFS即可有个地方没有用 long long炸了好久- //By SiriusRen #include <cstdio> us ...
构建工具系列一--Travis-cli
本文地址: http://www.cnblogs.com/blackmanba/articles/continuous-integration-tool-travis-cli.html或者http:/ ...

JStorm之Topology调度

JStorm之Topology调度的更多相关文章

随机推荐

热门专题