MapReduce源码分析之JobSplitWriter

JobSplitWriter被作业客户端用于写分片相关文件，包括分片数据文件job.split和分片元数据信息文件job.splitmetainfo。它有两个静态成员变量，如下：

// 分片版本，当前默认为1
private static final int splitVersion = JobSplit.META_SPLIT_VERSION;
// 分片文件头部，为UTF-8格式的字符串"SPL"的字节数组"SPL"
private static final byte[] SPLIT_FILE_HEADER;

并且，提供了一个静态方法，完成SPLIT_FILE_HEADER的初始化，代码如下：

// 静态方法，加载SPLIT_FILE_HEADER为UTF-8格式的字符串"SPL"的字节数组byte[]
static {
try {
SPLIT_FILE_HEADER = "SPL".getBytes("UTF-8");
} catch (UnsupportedEncodingException u) {
throw new RuntimeException(u);
}
}

JobSplitWriter实现其功能的为createSplitFiles()方法，它有三种实现，我们先看其中的public static <T extends InputSplit> void createSplitFiles(Path jobSubmitDir,Configuration conf, FileSystem fs, T[] splits)，代码如下：

// 创建分片文件
public static <T extends InputSplit> void createSplitFiles(Path jobSubmitDir,
Configuration conf, FileSystem fs, T[] splits)
throws IOException, InterruptedException {
// 调用createFile()方法，创建分片文件，并获取文件系统数据输出流FSDataOutputStream实例out，
// 对应路径为jobSubmitDir/job.split，jobSubmitDir为参数yarn.app.mapreduce.am.staging-dir指定的路径/作业所属用户user/.staging/作业ID
FSDataOutputStream out = createFile(fs,
JobSubmissionFiles.getJobSplitFile(jobSubmitDir), conf);
// 调用writeNewSplits()方法，将分片数据写入分片文件，并得到分片元数据信息SplitMetaInfo数组info
SplitMetaInfo[] info = writeNewSplits(conf, splits, out);
// 关闭输出流
out.close();
// 调用writeJobSplitMetaInfo()方法，将分片元数据信息写入分片元数据文件
writeJobSplitMetaInfo(fs,JobSubmissionFiles.getJobSplitMetaFile(jobSubmitDir),
new FsPermission(JobSubmissionFiles.JOB_FILE_PERMISSION), splitVersion,
info);
}

createSplitFiles()方法的逻辑很清晰，大体如下：

1、调用createFile()方法，创建分片文件，并获取文件系统数据输出流FSDataOutputStream实例out，对应路径为jobSubmitDir/job.split，jobSubmitDir为参数yarn.app.mapreduce.am.staging-dir指定的路径/作业所属用户user/.staging/作业ID；

2、调用writeNewSplits()方法，将分片数据写入分片文件，并得到分片元数据信息SplitMetaInfo数组info；

3、关闭输出流out；

4、调用writeJobSplitMetaInfo()方法，将分片元数据信息写入分片元数据文件。

我们先来看下createFile()方法，代码如下：

private static FSDataOutputStream createFile(FileSystem fs, Path splitFile,
Configuration job) throws IOException {
// 调用HDFS文件系统FileSystem的create()方法，获取文件系统数据输出流FSDataOutputStream实例out，
// 对应权限为JobSubmissionFiles.JOB_FILE_PERMISSION，即0644，rw-r--r--
FSDataOutputStream out = FileSystem.create(fs, splitFile,
new FsPermission(JobSubmissionFiles.JOB_FILE_PERMISSION));
// 获取副本数replication，取参数mapreduce.client.submit.file.replication，参数未配置默认为10
int replication = job.getInt(Job.SUBMIT_REPLICATION, 10);
// 通过文件系统FileSystem实例fs的setReplication()方法，设置splitFile的副本数位10
fs.setReplication(splitFile, (short)replication);
// 调用writeSplitHeader()方法写入分片头信息
writeSplitHeader(out);
// 返回文件系统数据输出流out
return out;
}

首先，调用HDFS文件系统FileSystem的create()方法，获取文件系统数据输出流FSDataOutputStream实例out，对应权限为JobSubmissionFiles.JOB_FILE_PERMISSION，即0644，rw-r--r--；

其次，获取副本数replication，取参数mapreduce.client.submit.file.replication，参数未配置默认为10；

接着，通过文件系统FileSystem实例fs的setReplication()方法，设置splitFile的副本数位10；

然后，调用writeSplitHeader()方法写入分片头信息；

最后，返回文件系统数据输出流out。

writeSplitHeader()方法专门用于将分片头部信息写入分片文件，代码如下：

private static void writeSplitHeader(FSDataOutputStream out)
throws IOException {
// 文件系统数据输出流out写入byte[]，内容为UTF-8格式的"SPL"
out.write(SPLIT_FILE_HEADER);
// 文件系统数据输出流out写入int，分片版本号，目前为1
out.writeInt(splitVersion);
}

很简单，首先文件系统数据输出流out写入byte[]，内容为UTF-8格式的"SPL"，然后文件系统数据输出流out写入int，分片版本号，目前为1。

接下来，我们再看下writeNewSplits()方法，它将分片数据写入分片文件，并得到分片元数据信息SplitMetaInfo数组info，代码如下：

@SuppressWarnings("unchecked")
private static <T extends InputSplit>
SplitMetaInfo[] writeNewSplits(Configuration conf,
T[] array, FSDataOutputStream out)
throws IOException, InterruptedException {
// 根据array的大小，构造同等大小的分片元数据信息SplitMetaInfo数组info，
// array其实是传入的分片数组
SplitMetaInfo[] info = new SplitMetaInfo[array.length];
if (array.length != 0) {// 如果array中有数据
// 创建序列化工厂SerializationFactory实例factory
SerializationFactory factory = new SerializationFactory(conf);
int i = 0;
// 获取最大的数据块位置maxBlockLocations，取参数mapreduce.job.max.split.locations，参数未配置默认为10
int maxBlockLocations = conf.getInt(MRConfig.MAX_BLOCK_LOCATIONS_KEY,
MRConfig.MAX_BLOCK_LOCATIONS_DEFAULT);
// 通过输出流out的getPos()方法获取输出流out的当前位置offset
long offset = out.getPos();
// 遍历数组array中每个元素split
for(T split: array) {
// 通过输出流out的getPos()方法获取输出流out的当前位置prevCount
long prevCount = out.getPos();
// 往输出流out中写入String，内容为split对应的类名
Text.writeString(out, split.getClass().getName());
// 获取序列化器Serializer实例serializer
Serializer<T> serializer =
factory.getSerializer((Class<T>) split.getClass());
// 打开serializer，接入输出流out
serializer.open(out);
// 将split序列化到输出流out
serializer.serialize(split);
// 通过输出流out的getPos()方法获取输出流out的当前位置currCount
long currCount = out.getPos();
// 通过split的getLocations()方法，获取位置信息locations
String[] locations = split.getLocations();
if (locations.length > maxBlockLocations) {
LOG.warn("Max block location exceeded for split: "
+ split + " splitsize: " + locations.length +
" maxsize: " + maxBlockLocations);
locations = Arrays.copyOf(locations, maxBlockLocations);
}
// 构造split对应的元数据信息，并加入info指定位置，
// offset为当前split在split文件中的起始位置，数据长度为split.getLength()，位置信息为locations
info[i++] =
new JobSplit.SplitMetaInfo(
locations, offset,
split.getLength());
// offset增加当前split已写入数据大小
offset += currCount - prevCount;
}
}
// 返回分片元数据信息SplitMetaInfo数组info
return info;
}

writeNewSplits()方法的逻辑比较清晰，大体如下：

1、根据array的大小，构造同等大小的分片元数据信息SplitMetaInfo数组info，array其实是传入的分片数组；

2、如果array中有数据：

2.1、创建序列化工厂SerializationFactory实例factory；

2.2、获取最大的数据块位置maxBlockLocations，取参数mapreduce.job.max.split.locations，参数未配置默认为10；

2.3、通过输出流out的getPos()方法获取输出流out的当前位置offset；

2.4、遍历数组array中每个元素split：

2.4.1、通过输出流out的getPos()方法获取输出流out的当前位置prevCount；

2.4.2、往输出流out中写入String，内容为split对应的类名；

2.4.3、获取序列化器Serializer实例serializer；

2.4.4、打开serializer，接入输出流out；

2.4.5、将split序列化到输出流out；

2.4.6、通过输出流out的getPos()方法获取输出流out的当前位置currCount；

2.4.7、通过split的getLocations()方法，获取位置信息locations；

2.4.8、确保位置信息locations的长度不能超过maxBlockLocations，超过则截断；

2.4.9、构造split对应的元数据信息，并加入info指定位置，offset为当前split在split文件中的起始位置，数据长度为split.getLength()，位置信息为locations；

2.4.10、offset增加当前split已写入数据大小；

3、返回分片元数据信息SplitMetaInfo数组info。

其中，序列化split对象时，我们以FileSplit为例来分析，其write()方法如下：

@Override
public void write(DataOutput out) throws IOException {
// 写入文件路径全名
Text.writeString(out, file.toString());
// 写入分片在文件中的起始位置
out.writeLong(start);
// 写入分片在文件中的长度
out.writeLong(length);
}

比较简单，分别写入文件路径全名、分片在文件中的起始位置、分片在文件中的长度三个信息。

综上所述，分片文件job.split文件的内容为：

1、文件头："SPL"+int类型版本号1；

2、分片类信息：String类型split对应类名；

3、分片数据信息：String类型文件路径全名+Long类型分片在文件中的起始位置+Long类型分片在文件中的长度。

而在最后，构造分片元数据信息时，产生的是JobSplit的静态内部类SplitMetaInfo对象，包括分片位置信息locations、split在split文件中的起始位置offset、分片长度split.getLength()。

下面，我们再看下分片的元数据信息文件是如何产生的，让我们来研究下writeJobSplitMetaInfo()方法，代码如下：

// 写入作业分片元数据信息
private static void writeJobSplitMetaInfo(FileSystem fs, Path filename,
FsPermission p, int splitMetaInfoVersion,
JobSplit.SplitMetaInfo[] allSplitMetaInfo)
throws IOException {
// write the splits meta-info to a file for the job tracker
// 调用HDFS文件系统FileSystem的create()方法，生成分片元数据信息文件，并获取文件系统数据输出流FSDataOutputStream实例out，
// 对应文件路径为jobSubmitDir/job.splitmetainfo，jobSubmitDir为参数yarn.app.mapreduce.am.staging-dir指定的路径/作业所属用户user/.staging/作业ID
// 对应权限为JobSubmissionFiles.JOB_FILE_PERMISSION，即0644，rw-r--r--
FSDataOutputStream out =
FileSystem.create(fs, filename, p);
// 写入分片元数据头部信息UTF-8格式的字符串"META-SPL"的字节数组byte[]
out.write(JobSplit.META_SPLIT_FILE_HEADER);
// 写入分片元数据版本号splitMetaInfoVersion，当前为1
WritableUtils.writeVInt(out, splitMetaInfoVersion);
// 写入分片元数据个数，为分片元数据信息SplitMetaInfo数组个数allSplitMetaInfo.length
WritableUtils.writeVInt(out, allSplitMetaInfo.length);
// 遍历分片元数据信息SplitMetaInfo数组allSplitMetaInfo中每个splitMetaInfo，挨个写入输出流
for (JobSplit.SplitMetaInfo splitMetaInfo : allSplitMetaInfo) {
splitMetaInfo.write(out);
}
// 关闭输出流out
out.close();
}

writeJobSplitMetaInfo()方法的主体逻辑也十分清晰，大体如下：

1、调用HDFS文件系统FileSystem的create()方法，生成分片元数据信息文件，并获取文件系统数据输出流FSDataOutputStream实例out，对应文件路径为jobSubmitDir/job.splitmetainfo，jobSubmitDir为参数yarn.app.mapreduce.am.staging-dir指定的路径/作业所属用户user/.staging/作业ID，对应权限为JobSubmissionFiles.JOB_FILE_PERMISSION，即0644，rw-r--r--；

2、写入分片元数据头部信息UTF-8格式的字符串"META-SPL"的字节数组byte[]；

3、写入分片元数据版本号splitMetaInfoVersion，当前为1；

4、写入分片元数据个数，为分片元数据信息SplitMetaInfo数组个数allSplitMetaInfo.length；

5、遍历分片元数据信息SplitMetaInfo数组allSplitMetaInfo中每个splitMetaInfo，挨个写入输出流；

6、关闭输出流out。
我们看下如何序列化JobSplit.SplitMetaInfo，将其写入文件，JobSplit.SplitMetaInfo的write()如下：

public void write(DataOutput out) throws IOException {
// 将分片位置个数写入分片元数据信息文件
WritableUtils.writeVInt(out, locations.length);
// 遍历位置信息，写入分片元数据信息文件
for (int i = 0; i < locations.length; i++) {
Text.writeString(out, locations[i]);
}
// 写入分片元数据信息的起始位置
WritableUtils.writeVLong(out, startOffset);
// 写入分片大小
WritableUtils.writeVLong(out, inputDataLength);
}

每个分片的元数据信息，包括分片位置个数、分片文件位置、分片元数据信息的起始位置、分片大小等内容。

总结

JobSplitWriter被作业客户端用于写分片相关文件，包括分片数据文件job.split和分片元数据信息文件job.splitmetainfo。分片数据文件job.split存储的主要是每个分片对应的HDFS文件路径，和其在HDFS文件中的起始位置、长度等信息，而分片元数据信息文件job.splitmetainfo存储的则是每个分片在分片数据文件job.split中的起始位置、分片大小等信息。

job.split文件内容：文件头 + 分片 + 分片 + ... + 分片

文件头："SPL" + 版本号1

分片：分片类 + 分片数据，分片类=String类型split对应类名，分片数据=String类型HDFS文件路径全名+Long类型分片在HDFS文件中的起始位置+Long类型分片在HDFS文件中的长度

job.splitmetainfo文件内容：文件头 + 分片元数据个数 + 分片元数据 + 分片元数据 + ... + 分片元数据

文件头："META-SPL" + 版本号1

分片元数据个数：分片元数据的个数

分片元数据：分片位置个数+分片位置+在分片文件job.split中的起始位置+分片大小

MapReduce源码分析之JobSplitWriter的更多相关文章

MapReduce源码分析之JobSubmitter（一）
JobSubmitter,顾名思义,它是MapReduce中作业提交者,而实际上JobSubmitter除了构造方法外,对外提供的唯一一个非private成员变量或方法就是submitJobInter ...
MapReduce源码分析之新API作业提交（二）：连接集群
MapReduce作业提交时连接集群是通过Job的connect()方法实现的,它实际上是构造集群Cluster实例cluster,代码如下: private synchronized void co ...
MapReduce源码分析之LocatedFileStatusFetcher
LocatedFileStatusFetcher是MapReduce中一个针对给定输入路径数组,使用配置的线程数目来获取数据块位置的实用类.它的主要作用就是利用多线程技术,每个线程对应一个任务,每个任 ...
mapreduce源码分析总结
一 MapReduce概述 Map/Reduce是一个用于大规模数据处理的分布式计算模型,它最初是由Google工程师设计并实现的,Google已经将它完整的MapReduce论文公开发布了.其中对 ...
MapReduce源码分析之作业Job状态机解析（一）简介与正常流程浅析
作业Job状态机维护了MapReduce作业的整个生命周期,即从提交到运行结束的整个过程.Job状态机被封装在JobImpl中,其主要包括14种状态和19种导致状态发生的事件. 作业Job的全部状态维 ...
MapReduce源码分析之Task中关于对应TaskAttempt存储Map方案的一些思考
我们知道,MapReduce有三层调度模型,即Job——>Task——>TaskAttempt,并且: 1.通常一个Job存在多个Task,这些Task总共有Map Task和Redcue ...
MapReduce源码分析之InputFormat
InputFormat描述了一个Map-Reduce作业中的输入规范.Map-Reduce框架依靠作业的InputFormat实现以下内容: 1.校验作业的输入规范: 2.分割输入文件(可能为多个), ...
Hadoop2源码分析－MapReduce篇
1.概述前面我们已经对Hadoop有了一个初步认识,接下来我们开始学习Hadoop的一些核心的功能,其中包含mapreduce,fs,hdfs,ipc,io,yarn,今天为大家分享的是mapred ...
Yarn源码分析之MRAppMaster上MapReduce作业处理总流程（二）
本文继<Yarn源码分析之MRAppMaster上MapReduce作业处理总流程(一)>,接着讲述MapReduce作业在MRAppMaster上处理总流程,继上篇讲到作业初始化之后的作 ...

随机推荐

Find the Duplicate Number -- LeetCode
Given an array nums containing n + 1 integers where each integer is between 1 and n (inclusive), pro ...
Vue服务端渲染 VS Vue浏览器端渲染)
Vue 2.0 开始支持服务端渲染的功能,所以本文章也是基于vue 2.0以上版本.网上对于服务端渲染的资料还是比较少,最经典的莫过于Vue作者尤雨溪大神的 vue-hacker-news.本人在公司 ...
HTML基础一
正所谓温故而知新, 近期有了总结知识点的想法, 想把之前学习的知识作一个分阶段性的总结, 就从html开始吧!!! 一.浏览器与服务器 1. 浏览器 1.1 浏览器是什么 1.浏览器是一种交互软件(与 ...
VUE -- 十分钟入门 Less
这篇文章来自 Danny Markov, 是我最喜欢的博主之一,实际上我最近翻译的一些文章全是出自他手.在查看本文之前你也可以查看原文. 我们都知道写 CSS 代码是有些枯燥无味的,尤其是面对那些成 ...
kubernetes1.5.2--部署监控服务
本文基于kubernetes 1.5.2版本编写 Heapster是kubernetes集群监控工具.在1.2的时候,kubernetes的监控需要在node节点上运行cAdvisor作为agent收 ...
Hash history cannot PUSH the same path; a new entry will not be added to the history stack
这个是reactr-router的一个提示,当前路由下的history不能push相同的路径.只有开发环境存在,生产环境不存在,目前还没看到官方有去掉的意思.看不惯的话可以采取一些方法关掉这个提示.具 ...
Ubuntu下安装配置JDK
第一步:下载jdk-7-linux-i586.tar.gz wget -c http://download.oracle.com/otn-pub/java/jdk/7/jdk-7-linux-i586 ...
通过CVE-2017-17215学习路由器漏洞分析，从入坑到放弃
1.基本信息: 2017/11/27,Check Point 软件技术部门报告了一个华为 HG532 产品的远程命令执行漏洞(CVE-2017-17215),Mirai的升级版变种中已经使用该漏洞.看 ...
Android - 标准VideoView播放演示样例
标准VideoView播放演示样例本文地址: http://blog.csdn.net/caroline_wendy 在Android SDK中的ApiDemos内, 提供标准播放视频的代码,使用V ...
速查笔记(Linux Shell编程<上>)
转载自: http://www.cnblogs.com/stephen-liu74/archive/2011/11/01/2202027.html 零.shell中的内部变量: 1. $?: ...

MapReduce源码分析之JobSplitWriter

MapReduce源码分析之JobSplitWriter的更多相关文章

随机推荐

热门专题