MapReduce调度与执行原理之作业提交

前言：本文旨在理清在Hadoop中一个MapReduce作业（Job）在提交到框架后的整个生命周期过程，权作总结和日后参考，如有问题，请不吝赐教。本文不涉及Hadoop的架构设计，如有兴趣请参考相关书籍和文献。在梳理过程中，我对一些感兴趣的源码也会逐行研究学习，以期强化基础。

作者
：Jaytalent

开始日期
：2013年9月9日

参考资料：【1】《Hadoop技术内幕--深入解析MapReduce架构设计与实现原理》董西成

【2】Hadoop 1.0.0 源码

【3】《Hadoop技术内幕--深入解析Hadoop Common和HDFS架构设计与实现原理》蔡斌陈湘萍

一个MapReduce作业的生命周期大体分为5个阶段
【1】：

1.
作业提交与初始化

2. 任务调度与监控

3. 任务运行环境准备

4. 任务执行

5. 作业完成

现逐一学习。

由于作业提交是在客户端完成，而初始化在JobTracker完成，本文只关注前者，后者留待下一篇文章学习研究。

一、作业提交与初始化

以WordCount作业为例，先看作业提交的代码片段：

    Job job = new Job(conf, "word count");

    job.setJarByClass(WordCount.class);

    job.setMapperClass(TokenizerMapper.class);

    job.setCombinerClass(IntSumReducer.class);

    job.setReducerClass(IntSumReducer.class);

    job.setOutputKeyClass(Text.class);

    job.setOutputValueClass(IntWritable.class);

    FileInputFormat.addInputPath(job, new Path(otherArgs[0]));

    FileOutputFormat.setOutputPath(job, new Path(otherArgs[1]));

    System.exit(job.waitForCompletion(true) ? 0 : 1);

这里使用的新的MapReduce API。job.waitForCompletion(true)函数调用开始作业提交过程。接下来，依次调用：job.submit --> JobClient.submitJobInternal方法，真正实现作业提交。在JobClient.submitJobInternal方法中，主要有以下准备工作：

1. 获取作业ID

JobID jobId = jobSubmitClient.getNewJobId();

作业ID时从JobTracker获取的，这是一次RPC调用，方法为getNewJobId，定义在JobSubmissionProtocol接口。

private JobSubmissionProtocol jobSubmitClient;

Hadoop的RPC机制是基于动态代理实现的。客户端代码使用RPC类提供的代理对象调用服务器的方法。MapReduce中定义了一系列协议接口用于RPC通信。这些协议包括：

a. JobSubmissionProtocol

b. RefreshUserMappingsProtocol

c. RefreshAuthorizationPolicyProtocol

d. AdminOperationsProtocol

e. InterTrackerProtocol

f. TaskUmbilicalProtocol

前面四个协议用于客户端，最后两个协议位于MapReduce内部。这里使用的getNewJobId方法即协议JobSubmissionProtocol所定义：

/**

   * Allocate a name for the job.

   * @return a unique job name for submitting jobs.

   * @throws IOException

   */

  public JobID getNewJobId() throws IOException;

用户使用该协议通过JobTracker提交作业，查看作业状态等。

2. 作业文件上传

JobClient会根据作业配置信息将作业所需文件上传到JobTracker的文件系统，通常是HDFS。配置信息由JobConf类对象维护。在新的API中，JobConf对象作为JobContext对象的组成部分，作业类Job即继承于JobContext类。

在上传文件前，需要在HDFS上创建必要的目录。上传文件的具体过程从 JobClient.submitJobInternal方法中这句调用开始：

copyAndConfigureFiles(jobCopy, submitJobDir);

在配置了提交副本数（mapred.submit.replication，默认为10）等信息后，主要代码分析如下（为了清晰起见，省略了一些日志和异常处理）：

    // Retrieve command line arguments placed into the JobConf

    // by GenericOptionsParser.

    String files = job.get("tmpfiles");

    String libjars = job.get("tmpjars");

    String archives = job.get("tmparchives");

首先，从配置中获取不同类型文件的名称和路径，这些配置在作业提交时从命令行（Hadoop Shell）指定。files表示作业依赖的普通文件，比如文本文件；libjars表示应用程序依赖的第三方jar包；archives表示应用程序使用的多个文件打包而成的压缩文件。

    // Create a number of filenames in the JobTracker's fs namespace

    FileSystem fs = submitJobDir.getFileSystem(job);

    submitJobDir = fs.makeQualified(submitJobDir);

    FsPermission mapredSysPerms = new FsPermission(JobSubmissionFiles.JOB_DIR_PERMISSION);

    FileSystem.mkdirs(fs, submitJobDir, mapredSysPerms);

    Path filesDir = JobSubmissionFiles.getJobDistCacheFiles(submitJobDir);

    Path archivesDir = JobSubmissionFiles.getJobDistCacheArchives(submitJobDir);

    Path libjarsDir = JobSubmissionFiles.getJobDistCacheLibjars(submitJobDir);

接下来，在JobTracker的文件系统（通常为HDFS）的命名空间创建一系列文件路径名，其中包括前述三种文件类型。
有了路径名后，在HDFS上创建路径并将这些文件拷贝到对应的目录中，代码如下：

    // add all the command line files/ jars and archive

    // first copy them to jobtrackers filesystem 

    if (files != null) {

      FileSystem.mkdirs(fs, filesDir, mapredSysPerms);

      String[] fileArr = files.split(",");

      for (String tmpFile: fileArr) {

        URI tmpURI;

        tmpURI = new URI(tmpFile);

        Path tmp = new Path(tmpURI);

        Path newPath = copyRemoteFiles(fs,filesDir, tmp, job, replication);

        URI pathURI = getPathURI(newPath, tmpURI.getFragment());

        DistributedCache.addCacheFile(pathURI, job);

        DistributedCache.createSymlink(job);

      }

    }

    if (libjars != null) {

      FileSystem.mkdirs(fs, libjarsDir, mapredSysPerms);

      String[] libjarsArr = libjars.split(",");

      for (String tmpjars: libjarsArr) {

        Path tmp = new Path(tmpjars);

        Path newPath = copyRemoteFiles(fs, libjarsDir, tmp, job, replication);

        DistributedCache.addArchiveToClassPath

          (new Path(newPath.toUri().getPath()), job, fs);

      }

    }

    if (archives != null) {

     FileSystem.mkdirs(fs, archivesDir, mapredSysPerms);

     String[] archivesArr = archives.split(",");

     for (String tmpArchives: archivesArr) {

       URI tmpURI;

       tmpURI = new URI(tmpArchives);

       Path tmp = new Path(tmpURI);

       Path newPath = copyRemoteFiles(fs, archivesDir, tmp, job, replication);

       URI pathURI = getPathURI(newPath, tmpURI.getFragment());

       DistributedCache.addCacheArchive(pathURI, job);

       DistributedCache.createSymlink(job);

     }

注意，MapReduce作业文件的上传和下载是通过DistributedCache工具完成的，它是一个数据分发工具。用户指定的文件会被分发到各个TaskTracker上以运行Task。这里暂不涉及该工具的细节，留待日后讨论。

最后，将作业对应的jar文件拷贝到HDFS中：

    String originalJarPath = job.getJar();

    if (originalJarPath != null) {           // copy jar to JobTracker's fs

      // use jar name if job is not named.

      if ("".equals(job.getJobName())){

        job.setJobName(new Path(originalJarPath).getName());

      }

      Path submitJarFile = JobSubmissionFiles.getJobJar(submitJobDir);

      job.setJar(submitJarFile.toString());

      fs.copyFromLocalFile(new Path(originalJarPath), submitJarFile);

      fs.setReplication(submitJarFile, replication);

      fs.setPermission(submitJarFile,

          new FsPermission(JobSubmissionFiles.JOB_FILE_PERMISSION));

    }

注意，在每次上传一种类型的文件后，都会将这种文件的路径配置到JobConf对象中，具体的工作由

DistributedCache.addCacheFile(pathURI, job);

DistributedCache.addArchiveToClassPath(new Path(newPath.toUri().getPath()), job, fs);

DistributedCache.addCacheArchive(pathURI, job);

job.setJar(submitJarFile.toString());

这四行代码完成。顺便提一句，Path类Hadoop文件系统在java.net.URI的基础上抽象了文件系统中的路径【3】。Java的File类和URL类分别抽象了不同的事物，Path可以说将二者统一起来。

3. 生成InputSplit文件

JobClient调用InputFormat的getSplits方法将用户提交的输入文件生成InputSplit相关信息。

// Create the splits for the job

   FileSystem fs = submitJobDir.getFileSystem(jobCopy);

   int maps = writeSplits(context, submitJobDir);

   jobCopy.setNumMapTasks(maps);

jobCopy是一个JobConf对象。其中，writeSplits方法会实际调用InputSplit.getSplits方法生成splits信息，并将splits原始信息和元信息写入HDFS对应的目录和文件中。有关split的生成过程日后研究，这里不展开了。最后，将作业对应的JobConf对象以XML配置文件形式写入到HDFS中：

    // Write job file to JobTracker's fs

    FSDataOutputStream out =

       FileSystem.create(fs, submitJobFile,

           new FsPermission(JobSubmissionFiles.JOB_FILE_PERMISSION));

    try {

       jobCopy.writeXml(out);

     } finally {

       out.close();

     }

至此，作业文件上传才算正式完毕。
接下来，作业将被提交到JobTracker，请关注下篇文章：

MapReduce调度与执行原理之作业初始化

MapReduce调度与执行原理之作业提交的更多相关文章

MapReduce调度与执行原理之作业初始化
前言 :本文旨在理清在Hadoop中一个MapReduce作业(Job)在提交到框架后的整个生命周期过程,权作总结和日后参考,如有问题,请不吝赐教.本文不涉及Hadoop的架构设计,如有兴趣请参考相关 ...
MapReduce调度与执行原理系列文章
转自:http://blog.csdn.net/jaytalent?viewmode=contents MapReduce调度与执行原理系列文章一.MapReduce调度与执行原理之作业提交二.M ...
MapReduce调度与执行原理之任务调度
前言 :本文旨在理清在Hadoop中一个MapReduce作业(Job)在提交到框架后的整个生命周期过程,权作总结和日后参考,如有问题,请不吝赐教.本文不涉及Hadoop的架构设计,如有兴趣请参考相关 ...
MapReduce调度与执行原理之任务调度（续）
前言 :本文旨在理清在Hadoop中一个MapReduce作业(Job)在提交到框架后的整个生命周期过程,权作总结和日后参考,如有问题,请不吝赐教.本文不涉及Hadoop的架构设计,如有兴趣请参考相关 ...
hadoop2 作业执行过程之作业提交
hadoop2.2.0.centos6.5 hadoop任务的提交常用的两种,一种是测试常用的IDE远程提交,另一种就是生产上用的客户端命令行提交通用的任务程序提交步骤为: 1.将程序打成jar包: ...
MapReduce源码分析之新API作业提交（二）：连接集群
MapReduce作业提交时连接集群是通过Job的connect()方法实现的,它实际上是构造集群Cluster实例cluster,代码如下: private synchronized void co ...
Spark作业提交至Yarn上执行的一个异常
(1)控制台Yarn(Cluster模式)打印的异常日志: client token: N/A diagnostics: Application application_1584359 ...
【hadoop代码笔记】hadoop作业提交之汇总
一.概述在本篇博文中,试图通过代码了解hadoop job执行的整个流程.即用户提交的mapreduce的jar文件.输入提交到hadoop的集群,并在集群中运行.重点在代码的角度描述整个流程,有些 ...
【Hadoop代码笔记】Hadoop作业提交之客户端作业提交
1. 概要描述仅仅描述向Hadoop提交作业的第一步,即调用Jobclient的submitJob方法,向Hadoop提交作业. 2. 详细描述Jobclient使用内置的JobS ...

随机推荐

正确的lnamp支持SSI的方法！即支持SHTML和include调用！
正确的lnamp支持SSI的方法!即支持SHTML和include调用! 个地方:一个是apache和nginx里的conf文件第一步:修改apache里的httpd.conf文件查找:AddTy ...
[HDU 1973]--Prime Path(BFS,素数表)
题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=1973 Prime Path Time Limit: 5000/1000 MS (Java/Others ...
HDU 3899 简单树形DP
题意:一棵树,给出每个点的权值和每条边的长度, 点j到点i的代价为点j的权值乘以连接i和j的边的长度.求点x使得所有点到点x的代价最小,输出虽然还是不太懂树形DP是什么意思,先把代码贴出来把. 这道 ...
POJ2069 最小球体覆盖, 模拟退火
只是套了个模板,模拟退火具体的过程真心不懂阿 //#pragma comment(linker, "/STACK:16777216") //for c++ Compiler #in ...
php __autoload使用
官方介绍: void __autoload ( string $class ) 你可以通过定义这个函数来启用类的自动加载. 转载一篇文章: PHP autoload机制详解 (1) autoload机 ...
评侯捷的＜深入浅出MFC＞和李久进的＜MFC深入浅出＞
侯捷的<深入浅出mfc>相信大家都已经很熟悉了,论坛上也有很多介绍,这里我就不多说了. 而李久进的<mfc深入浅出>,听说的人可能就少得多.原因听说是这本书当时没有怎么宣传,而 ...
UVA 10041 (13.08.25)
Problem C: Vito's family Background The world-known gangster Vito Deadstone is moving to New York. ...
C++11 thread::detach(2)
原文地址:http://www.cplusplus.com/reference/thread/thread/detach/ public member function <thread> ...
Aizu 1335 Eequal sum sets
Let us consider sets of positive integers less than or equal to n. Note that all elements of a set a ...
netbeans 将项目打包生成单个可执行的 jar
原文:netbeans 打包生成 jar 文件页里找到build.xml文件,打开在</project>前加入以下代码保存之 <target name="package- ...

MapReduce调度与执行原理之作业提交

MapReduce调度与执行原理之作业提交的更多相关文章

随机推荐

热门专题