hadoop作业调度策略

一个Mapreduce作业是通过JobClient向master的JobTasker提交的(JobTasker一直在等待JobClient通过RPC协议提交作业)，JobTasker接到JobClient的请求后把其加入作业队列中。
DataNode节点的TaskTracker一直通过RPC(RPC--远程过程调用协议它是一种通过网络从远程计算机上请求服务，而不需要了解底层网络技术的协议)向JobTasker发送heartbeat询问有没有任务做，如果有则让其派发任务过来，TaskTracker在其本地发起Task，执行任务。

作业调度策略有三种：

1、默认调度算法--FIFO队列策略：

hadoop默认调度器，它先按照作业优先级的高低，再按照到达时间的先后来选择被执行的作业。

优点：调度算法简单，JobTracker工作负担轻。

缺点：忽略了不同作业的需求差异。例如如果类似于对海量数据进行统计分析的作业长期占据计算资源，那么在其后提交的交互型作业有可能迟迟得不到处理，从而影响用户体验。

2、计算能力调度算法Capacity Scheduler(Yahoo 开发)

(1)Capacity Scheduler 中可以定义多个作业队列，作业提交时将直接放入到一个队列中，每个队列中采用的调度策略是FIFO算法。

(2)每个队列都可以通过配置获得一定数量的task tracker资源用于处理map/reduce操作，调度算法将按照配置文件为队列分配相应的计算资源量。

(3)该调度默认情况下不支持优先级，但是可以在配置文件中开启此选项，如果支持优先级，调度算法就是带有优先级的FIFO。

(4)不支持优先级抢占，一旦一个工作开始执行，在执行完之前它的资源不会被高优先级作业所抢占。

(5)对队列中同一用户提交的作业能够获得的资源百分比进行了限制以使同属于一用户的作业不能出现独占资源的情况.

Capacity Scheduler内存管理

Capacity Scheduler能有效地对hadoop集群的内存资源进行管理，以支持内存密集型应用。作业对内存资源需求高时，调度算法将把该作业的相关任务分配到内存资源充足的task tracker上。在作业选择过程中，Capacity Scheduler会检查空闲的tasktracker上的内存资源是否满足作业要求。Tasktracker上的空闲资源（内存）数量值可以通过tasktracker的内存资源总量减去当前已经使用的内存数量得到，而后者包含在tasktracker向jobtracker发送的周期性心跳信息中。

配置Capacity Scheduler

步骤：

1、cd $HADOOP_HOME/contrib/capacity-scheduler

2、cp hadoop-capacity-scheduler-0.20.2-cdh3u2.jar $HADOOP_HOME/lib

配置$HADOOP_HOME/conf下的map-site.xml,增加

 <property>

 　　　　<name>map.jobtracker.taskScheduler</name>

 3　　　　 <value>org.apache.hadoop.mapred.CapacityTaskScheduler</value> <!--这个就是刚才拷过去的jar里面的类-->

 </property>

 <property>

 　　　　<name>mapred.queue.names</name> <!--定义队列-->

 　　　　<value>default,bean</value><!--两个队列一个default(默认)bean队列-->

 </property>

 <!--修改$HADOOP_HOME/conf下cpacity-scheduler.xml增加属性如下-->

 <property>

 　　　　<name>mapred.capacity-scheduler.queue.default.capacity</name>

 　　　　<vaule>100</value>

 </property>

 <property>

 　　　　<name>mapred.capacity-schelduler.queue.bean.capacity</name>

 　　　　<value>100</value>

 </property>

选择队列(执行前需要做)：

set mapred.job.queue.name = bean（对列的名字）

3、公平份额调度算法Fair Scheduler(Facebook开发)

Facebook要处理生产型作业(数据统计分析，hive)、大批处理作业(数据挖掘、机器学习)、小型交互型作业(hive查询),不同用户提交的作业型在计算时间、存储空间、数据流量和相应时间上都有不同需求。为使hadoop mapreduce框架能够应对多种类型作业并行执行，使得用户具有良好的体验，Facebook公司提出该算法。

Fair Scheduler调度中，只有一个作业执行时，它将独占集群所有资源。有其他作业被提交时会有TaskTracker被释放并分配给新提交的作业，以保证所有的作业都能够获得大体相同的计算资源。

作业池：

为每一个用户建立一个作业池，用户提交的作业将会放进一个能够公平共享资源的pool(池)中，每个作业池设定了一个最低资源保障，当一个池中包含job时，它至少可以获得minmum share的资源(最低保障资源份额机制)。

池中的作业获得一定份额的资源，可以通过配置文件限制每个池中作业数量，缺省情况下，每个作业池中选择将要执行的作业的策略是FIFO策略，先按照优先级高低排序，然后再按照提交时间排序。

Deficit(赤字，不足)：

Fair Scheldure为每个作业定义了一个deficit指标，Deficit是一个作业在理想情况下的获得的计算资源和实际中获得的计算资源之间的差距。Fair Scheduler会每隔几百毫秒观察每个作业有多少任务已经在这个时间间隔内执行，并将结果与它的资源份额比较，一更新该作业的deficit值。一旦有空闲的task tracker出现，首先分配给当前具有最高deficit值得作业。

例如：如果系统中存在着尚未获得最低资源保障的作业池，那么该池中的作业将会优先调度，而选择池中的作业需要根据他们的deficit来决定。这样做是为了尽可能满足作业池最低保障资源份额的限制。

配置：

cd $HADOOP_HOME/contrib/fairscheduler

cp *.jar $HADOOP_HOME/lib

注：一般版本里，lib下包含这个包

配置$HADOOP_HOME/conf下的map-site.xml,增加

 <property>

 　　　　<name>mapred.jobtracker.taskScheduler</name> <!--加载jar包中的类-->

 　　　　<value>org.apache.hadoop.mapred.FairScheduler</value>

 </property>

 <property>

 　　　　<name>mapred.fairscheduler.allocation.file</name>

 　　　　<value>$HADOOP_HOME/conf/fair-scheduler.xml</value>

 </property>

 <property>

 　　　　<name>mapred.queue.names</name><!--定义队列-->

 　　　　<value>default,bean</value><!--两个池一个default(默认)bean池-->

 </property>

 <!--加上这么一个-->

 <property>

15　　　　 <name>mapred.fairscheduler.preemption</name>

 　　　　<value>true</value>

 </property>

fair-schelduler.xml根据文件里面给的例子配置就可以了。

选择队列(执行前需要做)：set mapred.job.queue.name = bean（池的名字）

注：配置可能会出错，可能是不能用$HADOOP_HOME把它改问绝对路径。

hadoop作业调度策略的更多相关文章

【hadoop代码笔记】hadoop作业提交之汇总
一.概述在本篇博文中,试图通过代码了解hadoop job执行的整个流程.即用户提交的mapreduce的jar文件.输入提交到hadoop的集群,并在集群中运行.重点在代码的角度描述整个流程,有些 ...
Hadoop作业提交之TaskTracker获取Task
[Hadoop代码笔记]Hadoop作业提交之TaskTracker获取Task 一.概要描述在上上一篇博文和上一篇博文中分别描述了jobTracker和其服务(功能)模块初始化完成后,接收JobC ...
Spark和Hadoop作业之间的区别
Spark目前被越来越多的企业使用,和Hadoop一样,Spark也是以作业的形式向集群提交任务,那么在内部实现Spark和Hadoop作业模型都一样吗?答案是不对的. 熟悉Hadoop的人应该都知道 ...
【Hadoop代码笔记】Hadoop作业提交之TaskTracker获取Task
一.概要描述在上上一篇博文和上一篇博文中分别描述了jobTracker和其服务(功能)模块初始化完成后,接收JobClient提交的作业,并进行初始化.本文着重描述,JobTracker如何选择作业 ...
大数据 --> Spark和Hadoop作业之间的区别
Spark和Hadoop作业之间的区别熟悉Hadoop的人应该都知道,用户先编写好一个程序,我们称为Mapreduce程序,一个Mapreduce程序就是一个Job,而一个Job里面可以有一个或多个 ...
hadoop作业调优参数整理及原理
hadoop作业调优参数整理及原理 10/22. 2013 1 Map side tuning参数 1.1 MapTask运行内部原理当map task开始运算,并产生中间数据时,其产生的中间结果并 ...
Hadoop作业性能指标及參数调优实例（三）Hadoop作业性能參数调优方法
作者: Shu, Alison Hadoop作业性能调优的两种场景: 一.用户观察到作业性能差,主动寻求帮助. (一)eBayEagle作业性能分析器 1. Hadoop作业性能异常指标 2. Had ...
Hadoop作业性能指标及參数调优实例（二）Hadoop作业性能调优7个建议
作者:Shu, Alison Hadoop作业性能调优的两种场景: 一.用户观察到作业性能差,主动寻求帮助. (一)eBayEagle作业性能分析器 1. Hadoop作业性能异常指标 2. Hado ...
Hadoop作业JVM堆大小设置优化 [转]
前段时间,公司Hadoop集群整体的负载很高,查了一下原因,发现原来是客户端那边在每一个作业上擅自配置了很大的堆空间,从而导致集群负载很高.下面我就来讲讲怎么来现在客户端那边的JVM堆大小的设置.我们 ...

随机推荐

C++ std::map
std::map template < class Key, // map::key_type class T, // map::mapped_type class Compare = less ...
Android笔记——Matrix
转自:http://www.cnblogs.com/qiengo/archive/2012/06/30/2570874.html#translate Matrix的数学原理在Android中,如果你 ...
基于Caffe的Large Margin Softmax Loss的实现（上）
小喵的唠叨话:在写完上一次的博客之后,已经过去了2个月的时间,小喵在此期间,做了大量的实验工作,最终在使用的DeepID2的方法之后,取得了很不错的结果.这次呢,主要讲述一个比较新的论文中的方法,L- ...
解析大型.NET ERP系统高质量.NET代码设计模式
1 缓存 Cache 系统中大量的用到缓存设计模式,对系统登入之后不变的数据进行缓存,不从数据库中直接读取.耗费一些内存,相比从SQL Server中再次读取数据要划算得多.缓存的基本设计模式参考下面 ...
谈谈我的微软特约稿：《SQL Server 2014 新特性：IO资源调控》
一.本文所涉及的内容(Contents) 本文所涉及的内容(Contents) 背景(Contexts) 撰写经历(Experience) 特约稿正文(Content-body) 第一部分:生活中资源 ...
用spm2构建seajs项目的过程
前言 Javascript模块化规范有CommonJs规范,和主要适用于浏览器环境的AMD规范,以及国内的CMD规范,它是SeaJs遵循的模块化规范.因为以前项目中用SeaJs做过前端的模块管理工具, ...
Geotrellis系列文章链接
本文存放了我在博客园中撰写的Geotrellis系列文章链接,方便查阅! 一.geotrellis使用初探二.geotrellis使用(二)geotrellis-chatta-demo以及geotr ...
在WPF按钮删除默认的鼠标悬停效果
如果你想在应用程序的所有按钮将此风格,那么这种风格可以插入Application.Resources部分的App.xaml页面. <Window.Resources> <Style ...
C++ map的基本操作和使用
原文地址:http://blog.sina.com.cn/s/blog_61533c9b0100fa7w.html Map是c++的一个标准容器,她提供了很好一对一的关系,在一些程序中建立一个map可 ...
redis的安装配置
主要讲下redis的安装配置,以及以服务的方式启动redis 1.下载最新版本的redis-3.0.7 到http://redis.io/download中下载最新版的redis-3.0.7 下载后 ...

hadoop作业调度策略

hadoop作业调度策略的更多相关文章

随机推荐

热门专题