hadoop2 作业执行过程之map过程

在执行MAP任务之前，先了解一下它的容器和它容器的领导：container和nodemanager

NodeManager

NodeManager(NM)是YARN中每个节点上的代理，它管理Hadoop集群中的单个计算节点，包括与ResourceManager保持通信，监督Container的生命周期管理，监控每个Container的资源使用（内存、CPU等）情况，追踪节点健康状况，管理日志和不同应用程序用到的附属服务（auxiliary service）

它包含以下几大组件：

1.NodeStatusUpdater

当NM启动时，该组件向RM注册，并发送节点上的可用资源。接下来，NM与RM通信，汇报Container的状态更新，包括节点上正在运行的Container、已完成的Container等，此外，RM可能向NodeStatusUpdater发信号，杀死处于运行中的Container

NodeStatusUpdater是NM和RM通信的唯一通道，周期性地调用RPC函数nodeHeartbeat()向RM汇报节点上的各种信息

2.ContainerManager

它是NM中的核心组件，实现类是ContainerManagerImpl。它有几个组件组成，各自负责一部分功能，意管理运行在该节点上的所有Container

2.1RPC Server

它负责从AM上接收RPC请求以启动Container或者停止。

供AM使用的接口分别是：startContainer()、stopContainer()、getContainerStatus()

2.2ResourceLocalizationService

负责（从HDFS）安全下载（采用多线程）和组织Container需要的各种文件资源。

2.3ContainerLauncher

维护了一个线程池，随时准备并在必要时尽快启动Container。同时会接收来自RM或者AM的清理Container请求，清理相应进程

2.4AuxServices

NM提供了一个框架以通过配置附属服务扩展自己的功能，这些服务是与NM其他服务隔离开的。

2.5ContainerMonitor

当一个Container启动以后，该组件便开始观察它在运行过程中的资源利用。NM启动一个Container后，ContainerMonitor会将改Container进程对应的一个pid添加到监控列表中

2.6LogHandler

一个可插拔组件，用户通过它可以宣传将Container日志写到本地磁盘或者打包上传到一个文件系统中。

3.ContainerExecutor

与地产操作系统交互，安全存放Container需要的文件和目录，进而以以一种安全的方式启动或者清除Container进程

4.NodeHealthCheckerService

周期性地运行一个配置好的脚步检查节点的健康状况，任何系统健康方面的改变都会通知NodeStatusUpdater传递给RM

5.Security

5.1ApplicationACLsManager 为所有面向用户的API提供安全检查

5.2ContainerTokenSecretManager 检查收到各种请求的合法性，确保这些请求已被RM授权

6.WebServer

web展示

Container

Container的概念

首先它和Linux的Container完全不同。它的使用是启动AM的时候和运行Task的时候，但是它的涉及则是RM向资源调度器申请启动AM的资源时和AM向RM的资源调度器申请启动Task资源时；

当向资源调度器申请资源时，需向它发送一个ResourceRequest列表，其中描述了一个资源单元的详细请求，而资源调度器为之返回分配的资源来描述Container。每个ResourceRequest可看做一个可序列化的Java对象

message ResourceRequestProto {

　　optional PriorityProto priority = 1; // 资源优先级

　　optional string resource_name = 2; // 资源名称（期望资源所在的host、rack名称等）

　　optional ResourceProto capability = 3; // 资源量（仅支持CPU和内存两种资源）

　　optional int32 num_containers = 4; // 满足以上条件的资源个数

　　optional bool relax_locality = 5 [default = true];  //是否支持本地性松弛

}

这些资源默认是本地松弛的，即申请优先级为10，资源名称为“node11”，资源量为<2GB,1CPU>的5份资源时，如果node11上没有满足要求的资源，则优先找node11同机架上其他资源，继而找其他机架

AM收到一个或者多个Container后，再次将改Container进一步分配给内部的某个任务，一旦确定任务后，AM需将任务运行环境（包括运行命令、环境变量、依赖的外部文件等）连同Container中的资源封装到ContainerLaunchContext对象中，进而与对应的NM通信，以启动该任务

message ContainerLaunchContextProto {

　　repeated StringLocalResourceMapProto localResources = 1; //Container启动以来的外部资源

　　optional bytes tokens = 2;

　　repeated StringBytesMapProto service_data = 3;

　　repeated StringStringMapProto environment = 4; //Container启动所需的环境变量

　　repeated string command = 5; //Container内部运行的任务启动命令，如果是MapReduce的话，Map/Reduce Task启动命令就在该字段中

　　repeated ApplicationACLMapProto application_ACLs = 6;

}

Container启动步骤:

1.资源本地化

在本地拷贝一份运行Container所需的所有资源（通过Distributed Cache实现）；

为Container创建经隔离的工作目录，并在这些目录中准备好所有资源；

YARN将资源分为两类：一类是public级别的资源，放在公共目录下，由所有用户共享，另一类是private级别的资源，这类资源时用户私有的，只能在所属用户的各个作业间共享。

2.启动Container

启动Container是由ContainerLauncher完成的；

3.运行Container

由ContainerExecutor完成

4.资源回收

由ResourceLocalizationService服务完成，该过程与资源本地化正好相反，它负责撤销Container运行过程中使用的各种资源。

MAP

mapper就是在运行Container的时候执行的。主角上场。

Map任务是一类将输入记录转换为中间格式记录集的独立任务。Mapper类中的map方法将输入键值对映射到一组中间格式的键值对集合

Container启动以后会根据AM传过来的任务信息启动一个YarnChild进程来运行任务，YarnChild直接调用分给它的jvmTask，而jvmTask则判断是map任务还是reduce任务来分别执行MapTask和ReduceTask来运行Map过程和Reduce过程

每个task都会使用一个进程占用一个JVM来执行，org.apache.hadoop.mapred.Child方法是具体的JVM启动类

taskFinal.run(job, umbilical); // run the task

if (taskComing) {

      boolean isMap = in.readBoolean();

      if (isMap) {

        t = new MapTask();

      } else {

        t = new ReduceTask();

      }

      t.readFields(in);

    }

这里的taskFinal就是jvmTask

自定义的Map类继承自Mapper，由MapTask的run()方法来运行

   @Override

   public void run(final JobConf job, final TaskUmbilicalProtocol umbilical)

     throws IOException, ClassNotFoundException, InterruptedException {

     this.umbilical = umbilical;

     if (isMapTask()) {

       // If there are no reducers then there won't be any sort. Hence the map

       // phase will govern the entire attempt's progress.

       if (conf.getNumReduceTasks() == 0) {

         mapPhase = getProgress().addPhase("map", 1.0f);

       } else {

         // If there are reducers then the entire attempt's progress will be

         // split between the map phase (67%) and the sort phase (33%).

         mapPhase = getProgress().addPhase("map", 0.667f);

         sortPhase  = getProgress().addPhase("sort", 0.333f);

       }

     }

     TaskReporter reporter = startReporter(umbilical);

     boolean useNewApi = job.getUseNewMapper();

     initialize(job, getJobID(), reporter, useNewApi);

     // check if it is a cleanupJobTask

     if (jobCleanup) {

       runJobCleanupTask(umbilical, reporter);

       return;

     }

     if (jobSetup) {

       runJobSetupTask(umbilical, reporter);

       return;

     }

     if (taskCleanup) {

       runTaskCleanupTask(umbilical, reporter);

       return;

     }

     if (useNewApi) {

       runNewMapper(job, splitMetaInfo, umbilical, reporter);

     } else {

       runOldMapper(job, splitMetaInfo, umbilical, reporter);

     }

     done(umbilical, reporter);

   }

MapTask先判断是否有Reduce任务，如果没有的话，Map任务结束则整个提交的作业结束；如果有的话，当Map任务完成的时候设置当前进度为66.7%，Sort完成的时候设置进度为33.3%；

之后启动TaskReporter，用于更新当前状态；

之后初始化任务，设置当前任务的状态为RUNNING，设置输出目录等；

之后判断任务是不是jobCleanup任务、jobSetup任务、taskCleanup任务，并做相应的处理；

之后判断使用新旧哪套API，因为MapTask要兼容两套API；

确定以后调用runNewMapper方法，执行具体的map；

作业完成以后调用done方法，进行任务的清理、计数器的更新、任务状态更新等；

hadoop2的话是使用runNewMapper()

   @SuppressWarnings("unchecked")

   private <INKEY,INVALUE,OUTKEY,OUTVALUE>

   void runNewMapper(final JobConf job,

                     final TaskSplitIndex splitIndex,

                     final TaskUmbilicalProtocol umbilical,

                     TaskReporter reporter

                     ) throws IOException, ClassNotFoundException,

                              InterruptedException {

     // make a task context so we can get the classes

     org.apache.hadoop.mapreduce.TaskAttemptContext taskContext =

       new org.apache.hadoop.mapreduce.task.TaskAttemptContextImpl(job,

                                                                   getTaskID(),

                                                                   reporter);

     // make a mapper

     org.apache.hadoop.mapreduce.Mapper<INKEY,INVALUE,OUTKEY,OUTVALUE> mapper =

       (org.apache.hadoop.mapreduce.Mapper<INKEY,INVALUE,OUTKEY,OUTVALUE>)

         ReflectionUtils.newInstance(taskContext.getMapperClass(), job);

     // make the input format

     org.apache.hadoop.mapreduce.InputFormat<INKEY,INVALUE> inputFormat =

       (org.apache.hadoop.mapreduce.InputFormat<INKEY,INVALUE>)

         ReflectionUtils.newInstance(taskContext.getInputFormatClass(), job);

     // rebuild the input split

     org.apache.hadoop.mapreduce.InputSplit split = null;

     split = getSplitDetails(new Path(splitIndex.getSplitLocation()),

         splitIndex.getStartOffset());

     LOG.info("Processing split: " + split);

     org.apache.hadoop.mapreduce.RecordReader<INKEY,INVALUE> input =

       new NewTrackingRecordReader<INKEY,INVALUE>

         (split, inputFormat, reporter, taskContext);

     job.setBoolean(JobContext.SKIP_RECORDS, isSkipping());

     org.apache.hadoop.mapreduce.RecordWriter output = null;

     // get an output object

     if (job.getNumReduceTasks() == 0) {

       output =

         new NewDirectOutputCollector(taskContext, job, umbilical, reporter);

     } else {

       output = new NewOutputCollector(taskContext, job, umbilical, reporter);

     }

     org.apache.hadoop.mapreduce.MapContext<INKEY, INVALUE, OUTKEY, OUTVALUE>

     mapContext =

       new MapContextImpl<INKEY, INVALUE, OUTKEY, OUTVALUE>(job, getTaskID(),

           input, output,

           committer,

           reporter, split);

     org.apache.hadoop.mapreduce.Mapper<INKEY,INVALUE,OUTKEY,OUTVALUE>.Context

         mapperContext =

           new WrappedMapper<INKEY, INVALUE, OUTKEY, OUTVALUE>().getMapContext(

               mapContext);

     try {

       input.initialize(split, mapperContext);

       mapper.run(mapperContext);

       mapPhase.complete();

       setPhase(TaskStatus.Phase.SORT);

       statusUpdate(umbilical);

       input.close();

       input = null;

       output.close(mapperContext);

       output = null;

     } finally {

       closeQuietly(input);

       closeQuietly(output, mapperContext);

     }

   }

它的执行过程是：

1.获取配置信息类对象TaskAttemptContextImplement、自己开发的Mapper实例、用户指定的InputFormat对象（默认是TextInputFormat）、任务对应的分片信息split；

2.根据inputFormat构建一个NewTrackingRecordReader对象，这个对象中的RecordReader<K,V> real是LineRecordReader，用于读取分片中的内容，传递给Mapper的map方法处理；

3.执行Mapper中的setup方法；

4.循环执行map方法；

5.执行cleanup方法；

6.最后是输出流的关闭output.close(mapperContext)，该方法会执行MapOutputBuffer.flush()操作，将剩余数据也通过sortAndSpill()方法写入本地文件，并在最后调用mergeParts()方法合并所有的spill文件。

关于spill，spill是map中比较重要的设计

spill过程包括输出、排序、溢写、合并等步骤；

每个Map任务不断的以<key,value>对的形式把数据输出到内存中构造一个环形的数据结构。这个数据结构其实是一个字节数组，叫kvbuffer，这里面不仅有<Key,Value>数据，还有索引数据，并且给放置索引数据的区域起了一个kvmeta的别名

当这个缓冲区满足一定条件后就会对缓冲区kvbuffer中的数据进行排序，先按分区编号partition进行升序，然后按照key进行升序。这样快速排序后数据以分区为单位聚集在一起，且同一分区的所有数据按照key有序。然后通过sortAndSpill方法写到本地文件和索引文件；如果有combiner，spill之前也会做一次聚集操作，等数据跑完通过归并合并所有spill文件和索引文件。

Map阶段的结果都会存储在本地种（如果有reducer的话），非HDFS。

hadoop2 作业执行过程之map过程的更多相关文章

hadoop2 作业执行过程之reduce过程
reduce阶段就是处理map的输出数据,大部分过程和map差不多 //ReduceTask.run方法开始和MapTask类似,包括initialize()初始化,根据情况看是否调用runJobCl ...
hadoop2 作业执行过程之作业提交
hadoop2.2.0.centos6.5 hadoop任务的提交常用的两种,一种是测试常用的IDE远程提交,另一种就是生产上用的客户端命令行提交通用的任务程序提交步骤为: 1.将程序打成jar包: ...
hadoop2 作业执行过程之yarn调度执行
YARN是hadoop系统上的资源统一管理平台,其主要作用是实现集群资源的统一管理和调度(目前还不完善,只支持粗粒度的CPU和内存的的调配): 它的基本思想是将Mapreduce的jobtracker ...
【原创】大数据基础之Hive（2）Hive SQL执行过程之SQL解析过程
Hive SQL解析过程 SQL->AST(Abstract Syntax Tree)->Task(MapRedTask,FetchTask)->QueryPlan(Task集合)- ...
【hadoop代码笔记】Mapreduce shuffle过程之Map输出过程
一.概要描述 shuffle是MapReduce的一个核心过程,因此没有在前面的MapReduce作业提交的过程中描述,而是单独拿出来比较详细的描述. 根据官方的流程图示如下: 本篇文章中只是想尝试从 ...
Python函数式编程之map()
Python函数式编程之map() Python中map().filter().reduce()这三个都是应用于序列的内置函数. 格式: map(func, seq1[, seq2,…]) 第一个参数 ...
spark作业运行过程之--DAGScheduler
DAGScheduler--stage划分和创建以及stage的提交本篇,我会从一次spark作业的运行为切入点,将spark运行过程中涉及到的各个步骤,包括DAG图的划分,任务集的创建,资源分配, ...
Struts2 REST 插件 XStream 远程代码执行漏洞 S2-052 复现过程
v\:* {behavior:url(#default#VML);} o\:* {behavior:url(#default#VML);} w\:* {behavior:url(#default#VM ...
SQL邮件服务（解决各种疑难杂症）+案例 + 使用SQLserver 邮件系统发送SQL代理作业执行警告
首先你需要知道你要做的几部: 1 每个数据库都有自己的 SERVICE BROKER 很多SQL SERVER内部服务依赖它 2 启动 SERVICE BROKER 需要 1 STOP 你的 SQL ...

随机推荐

Android：控件WebView显示网页 -摘自网络
WebView可以使得网页轻松的内嵌到app里,还可以直接跟js相互调用. webview有两个方法:setWebChromeClient 和 setWebClient setWebClient:主要 ...
oracle数据库建表
create or replace directory dumpdir as 'E:\oracle\dumpdir';create temporary tablespace ydxt_temp tem ...
C++11类型推导
[C++11类型推导] auto 关键字.这会依据该初始化子(initializer)的具体类型产生参数: 除此之外,decltype 能够被用来在编译期决定一个表示式的类型. 参考:http://z ...
hdu 2819 Swap
Swap http://acm.hdu.edu.cn/showproblem.php?pid=2819 Special Judge Problem Description Given an N*N m ...
GWT工程架构分析与理解
上一篇文章中介绍了GWT技术的一些理论性的东西,涉及到GWT得一些技术原理及实现.接下来笔者将通过创建一个GWT工程去理解分析GWT工程架构. GWT工程架构解析笔者使用的是Eclipse插 ...
UVa11235 FrequentValues（RMQ）
Problem F: Frequent values You are given a sequence of n integers a1 , a2 , ... , an in non-decreasi ...
Linux目录介绍
/: 根目录,一般根目录下只存放目录,不要存放文件,/etc./bin./dev./lib./sbin应该和根目录放置在一个分区中/bin:/usr/bin: 可执行二进制文件的目录,如常用的命令ls ...
java解析属性文件
-----------------------解析属性文件----------------------------- /** * 获取src下属性文件 * @param params * ...
reactor设计模式
reactor介绍 reactor的工作模式就像它的名字一样,是一种反射模式,当事件发生时,根据发生的事件调用注册的处理器. Reactor的优点和应用 Reactor最常用于非阻塞的socket 传 ...
CriminalIntent程序中Fragment相关内容
Activity中托管UI fragment有两种方式: 添加fragment到acitivity中在activity代码中添加fragment 第一种方法即将fragment添加到acitivit ...

hadoop2 作业执行过程之map过程

hadoop2 作业执行过程之map过程的更多相关文章

随机推荐

热门专题