Mapreduce运行过程分析(基于Hadoop2.4)——(三)
4.4 Reduce类
4.4.1 Reduce介绍
整完了Map,接下来就是Reduce了。YarnChild.main()—>ReduceTask.run()。ReduceTask.run方法開始和MapTask类似,包含initialize()初始化,依据情况看是否调用runJobCleanupTask(),runTaskCleanupTask()等。之后进入正式的工作,主要有这么三个步骤:Copy、Sort、Reduce。
4.4.2 Copy
Copy就是从运行各个Map任务的节点获取map的输出文件。这是由ReduceTask.ReduceCopier 类来负责。ReduceCopier对象负责将Map函数的输出拷贝至Reduce所在机器。假设大小超过一定阈值就写到磁盘,否则放入内存,在远程拷贝数据的同一时候,Reduce Task启动了两个后台线程对内存和磁盘上的文件进行合并,防止内存使用过多和磁盘文件过多。
Step1:
首先在ReduceTask的run方法中,通过例如以下配置来mapreduce.job.reduce.shuffle.consumer.plugin.class装配shuffle的plugin。默认的实现是Shuffle类:
1 Class<? extends ShuffleConsumerPlugin> clazz = job.getClass(MRConfig.SHUFFLE_CONSUMER_PLUGIN, Shuffle.class, ShuffleConsumerPlugin.class);
7 shuffleConsumerPlugin = ReflectionUtils.newInstance(clazz, job);
9 LOG.info("Using ShuffleConsumerPlugin: " + shuffleConsumerPlugin);
Step2:
初始化上述的plugin后,运行其run方法,得到RawKeyValueIterator的实例。
run方法的运行过程例如以下:
Step2.1:
量化Reduce的事件数目:
1 int eventsPerReducer = Math.max(MIN_EVENTS_TO_FETCH, MAX_RPC_OUTSTANDING_EVENTS / jobConf.getNumReduceTasks());
3 int maxEventsToFetch = Math.min(MAX_EVENTS_TO_FETCH, eventsPerReducer);
Step2.2:
生成map的完毕状态获取线程,并启动此线程:
final EventFetcher<K,V> eventFetcher = new EventFetcher<K,V>(reduceId, umbilical, scheduler, this, maxEventsToFetch); eventFetcher.start();
获取已经完毕的Map信息,如Map的host、mapId等放入ShuffleSchedulerImpl中的Set<MapHost>中便于以下进行数据的拷贝传输。
1 URI u = getBaseURI(reduceId, event.getTaskTrackerHttp());
3 addKnownMapOutput(u.getHost() + ":" + u.getPort(),
5 u.toString(),
7 event.getTaskAttemptId());
9 maxMapRuntime = Math.max(maxMapRuntime, event.getTaskRunTime());
Step2.3:
在Shuffle类中启动初始化Fetcher线程组,并启动:
1 boolean isLocal = localMapFiles != null;
2
3 final int numFetchers = isLocal ? 1 :
4
5 jobConf.getInt(MRJobConfig.SHUFFLE_PARALLEL_COPIES, 5);
6
7 Fetcher<K,V>[] fetchers = new Fetcher[numFetchers];
8
9 if (isLocal) {
10
11 fetchers[0] = new LocalFetcher<K, V>(jobConf, reduceId, scheduler,
12
13 merger, reporter, metrics, this, reduceTask.getShuffleSecret(),
14
15 localMapFiles);
16
17 fetchers[0].start();
18
19 } else {
20
21 for (int i=0; i < numFetchers; ++i) {
22
23 fetchers[i] = new Fetcher<K,V>(jobConf, reduceId, scheduler, merger,
24
25 reporter, metrics, this,
26
27 reduceTask.getShuffleSecret());
28
29 fetchers[i].start();
30
31 }
32
33 }
线程的run方法就是进行数据的远程拷贝:
1 try {
3 // If merge is on, block
5 merger.waitForResource();
8
9 // Get a host to shuffle from
11 host = scheduler.getHost();
13 metrics.threadBusy();
17 // Shuffle
19 copyFromHost(host);
21 } finally {
23 if (host != null) {
25 scheduler.freeHost(host);
27 metrics.threadFree();
29 }
31 }
Step2.4:
来看下这个copyFromHost方法。主要是就是使用HttpURLConnection,实现远程数据的传输。
建立连接之后,从接收到的Stream流中读取数据。每次读取一个map文件。
1 TaskAttemptID[] failedTasks = null;
2
3 while (!remaining.isEmpty() && failedTasks == null) {
4
5 failedTasks = copyMapOutput(host, input, remaining);
6
7 }
上面的copyMapOutput方法中,每次读取一个mapid,依据MergeManagerImpl中的reserve函数,检查map的输出是否超过了mapreduce.reduce.memory.totalbytes配置的大小,此配置的默认值
是当前Runtime的maxMemory*mapreduce.reduce.shuffle.input.buffer.percent配置的值,Buffer.percent的默认值为0.90。
假设mapoutput超过了此配置的大小时,生成一个OnDiskMapOutput实例。在接下来的操作中,map的输出写入到local暂时文件里。
假设没有超过此大小,生成一个InMemoryMapOutput实例。在接下来操作中,直接把map输出写入到内存。
最后,运行ShuffleScheduler.copySucceeded完毕文件的copy,调用mapout.commit函数,更新状态或者触发merge操作。
Step2.5:
等待上面全部的拷贝完毕之后,关闭相关的线程。
1 eventFetcher.shutDown();
2
3 // Stop the map-output fetcher threads
4 for (Fetcher<K,V> fetcher : fetchers) {
5 fetcher.shutDown();
6 }
7
8 // stop the scheduler
9 scheduler.close();
10
11 copyPhase.complete(); // copy is already complete
12 taskStatus.setPhase(TaskStatus.Phase.SORT);
13 reduceTask.statusUpdate(umbilical);
Step2.6:
运行终于的merge操作,由Shuffle中的MergeManager完毕:
1 public RawKeyValueIterator close() throws Throwable {
2
3 // Wait for on-going merges to complete
4
5 if (memToMemMerger != null) {
6
7 memToMemMerger.close();
8
9 }
10
11 inMemoryMerger.close();
12
13 onDiskMerger.close();
14
15
16
17 List<InMemoryMapOutput<K, V>> memory =
18
19 new ArrayList<InMemoryMapOutput<K, V>>(inMemoryMergedMapOutputs);
20
21 inMemoryMergedMapOutputs.clear();
22
23 memory.addAll(inMemoryMapOutputs);
24
25 inMemoryMapOutputs.clear();
26
27 List<CompressAwarePath> disk = new ArrayList<CompressAwarePath>(onDiskMapOutputs);
28
29 onDiskMapOutputs.clear();
30
31 return finalMerge(jobConf, rfs, memory, disk);
32
33 }
Step3:
释放资源。
mapOutputFilesOnDisk.clear();
Copy完成。
4.4.3 Sort
Sort(事实上相当于合并)就相当于排序工作的一个延续,它会在全部的文件都拷贝完成后进行。使用工具类Merger归并全部的文件。经过此过程后,会产生一个合并了全部(全部并不准确)Map任务输出文件的新文件,而那些从其它各个server搞过来的 Map任务输出文件会删除。依据hadoop是否分布式来决定调用哪种排序方式。
在上面的4.3.2节中的Step2.4结束之后就会触发此操作。
4.4.4 Reduce
经过上面的步骤之后,回到ReduceTask中的run方法继续往下运行,调用runNewReducer。创建reducer:
1 org.apache.hadoop.mapreduce.Reducer<INKEY,INVALUE,OUTKEY,OUTVALUE> reducer =
2
3 (org.apache.hadoop.mapreduce.Reducer<INKEY,INVALUE,OUTKEY,OUTVALUE>)
4
5 ReflectionUtils.newInstance(taskContext.getReducerClass(), job);
并运行其run方法,此run方法就是我们的org.apache.hadoop.mapreduce.Reducer中的run方法。
1 public void run(Context context) throws IOException, InterruptedException {
2
3 setup(context);
4
5 try {
6
7 while (context.nextKey()) {
8
9 reduce(context.getCurrentKey(), context.getValues(), context);
10
11 // If a back up store is used, reset it
12
13 Iterator<VALUEIN> iter = context.getValues().iterator();
14
15 if(iter instanceof ReduceContext.ValueIterator) {
16
17 ((ReduceContext.ValueIterator<VALUEIN>)iter).resetBackupStore();
18
19 }
20
21 }
22
23 } finally {
24
25 cleanup(context);
26
27 }
28
29 }
30
31 }
while的循环条件是ReduceContext.nextKey()为真,这种方法就在ReduceContext中实现的,这种方法的目的就是处理下一个唯一的key,由于reduce方法的输入数据是分组的,所以每次都会处理一个key及这个key相应的全部value,又由于已经将全部的Map Task的输出拷贝过来并且做了排序,所以key同样的KV对都是挨着的。
nextKey方法中,又会调用nextKeyValue方法来尝试去获取下一个key值,而且假设没数据了就会返回false,假设还有数据就返回true。防止获取反复的数据就在这里做的处理。
接下来就是调用用户自己定义的reduce方法了。
1 public void reduce(Text key, Iterable<IntWritable> values,
2
3 Context context
4
5 ) throws IOException, InterruptedException {
6
7 int sum = 0;
8
9 for (IntWritable val : values) {
10
11 sum += val.get();
12
13 }
14
15 result.set(sum);
16
17 context.write(key, result);
18
19 }
-------------------------------------------------------------------------------
假设您看了本篇博客,认为对您有所收获,请点击右下角的 [推荐]
假设您想转载本博客,请注明出处
假设您对本文有意见或者建议,欢迎留言
感谢您的阅读,请关注我的兴许博客
Mapreduce运行过程分析(基于Hadoop2.4)——(三)的更多相关文章
- Mapreduce运行过程分析(基于Hadoop2.4)——(一)
1 概述 该瞅瞅MapReduce的内部执行原理了,曾经仅仅知道个皮毛,再不搞搞,不然怎么死的都不晓得.下文会以2.4版本号中的WordCount这个经典样例作为分析的切入点.一步步来看里面究竟是个什 ...
- Mapreduce执行过程分析(基于Hadoop2.4)——(三)
4.4 Reduce类 4.4.1 Reduce介绍 整完了Map,接下来就是Reduce了.YarnChild.main()—>ReduceTask.run().ReduceTask.run方 ...
- Mapreduce运行过程分析(基于Hadoop2.4)——(二)
4.3 Map类 创建Map类和map函数.map函数是org.apache.hadoop.mapreduce.Mapper类中的定义的,当处理每一个键值对的时候,都要调用一次map方法,用户须 ...
- Mapreduce执行过程分析(基于Hadoop2.4)——(一)
1 概述 该瞅瞅MapReduce的内部运行原理了,以前只知道个皮毛,再不搞搞,不然怎么死的都不晓得.下文会以2.4版本中的WordCount这个经典例子作为分析的切入点,一步步来看里面到底是个什么情 ...
- Mapreduce执行过程分析(基于Hadoop2.4)——(二)
4.3 Map类 创建Map类和map函数,map函数是org.apache.hadoop.mapreduce.Mapper类中的定义的,当处理每一个键值对的时候,都要调用一次map方法,用户需要覆写 ...
- MapReduce过程详解(基于hadoop2.x架构)
本文基于hadoop2.x架构详细描述了mapreduce的执行过程,包括partition,combiner,shuffle等组件以及yarn平台与mapreduce编程模型的关系. mapredu ...
- 基于Hadoop2.2.0版本号分布式云盘的设计与实现
基于Hadoop2.2.0版本号分布式云盘的设计与实现 一.前言 在学习了hadoop2.2一个月以来,我重点是在学习hadoop2.2的HDFS.即是hadoop的分布式系统,看了非常久的源代码看的 ...
- 《Hadoop技术内幕》读书笔记——Task运行过程分析
本文是董西成的Hadoop技术内幕一书的读书章节总结. 第八章 Task运行过程分析 所有Task需要周期性地向TaskTracker汇报最新进度和计数器值,而这正是由Reporter组件实现的,其中 ...
- 基于Hadoop2.7.3集群数据仓库Hive1.2.2的部署及使用
基于Hadoop2.7.3集群数据仓库Hive1.2.2的部署及使用 HBase是一种分布式.面向列的NoSQL数据库,基于HDFS存储,以表的形式存储数据,表由行和列组成,列划分到列族中.HBase ...
随机推荐
- Hibernate-04 延迟加载
学习任务 延迟加载 Open Session In View模式 延迟加载 延迟加载(lazy load懒加载)是在真正需要数据时才执行SQL语句进行查询,避免了无谓的性能开销. 延迟加载策略的设置分 ...
- No-10.高级变量类型
高级变量类型 目标 列表 元组 字典 字符串 公共方法 变量高级 知识点回顾 Python 中数据类型可以分为 数字型 和 非数字型 数字型 整型 (int) 浮点型(float) 布尔型(bool) ...
- windows cmd color颜色设置
上一篇我们讲了去模仿电影黑客的命令界面,其中有关于cmd命令行的颜色设置,下面就细说一下: 1.cmd进入命令 2.color+空格+? 系统会给与相关提示: 3.可以看出颜色是一个十六进制控制 ...
- C++11程序设计要点总结-模板机制详解
C++程序设计要点总结 在编程的过程中呢我们总会遇到一些各种各样的问题,就比如在写方法的时候,我们一个同样的方法要写好几种类型的呢,这让我们很伤脑筋,但是呢C++有一个强大的功能就是模板机制,这个模板 ...
- L2-2 社交集群 (25 分)(一个写挫的并查集)
题目: 思路: 就是一个并查集的裸题,不过在数据查找方面可能不好处理,暴力完全可以解决这个问题啊!! #include <bits/stdc++.h> #include <cstdi ...
- 自定义ngCloak
场景: 一个非常复杂的表单页面,页面有5个标签,第五个标签中又有5个标签,也就是说一共有9个标签,每个标签中都有一个表单,表单之间相互关联.所有表单项(包括复合的),有80多个数据.全部东西写在一个h ...
- LeetCode 309. Best Time to Buy and Sell Stock with Cooldown (stock problem)
Say you have an array for which the ith element is the price of a given stock on day i. Design an al ...
- Sql按照字段分组,选取其他字段最值所在的行记录
引言: 为什么会引入这个问题,在程序中遇到这样的问题,在某个数据表中,相同的AID(项目ID)被多次添加到数据表中,所以对应于不同的时间,只想选取添加时间最早的哪一条记录. 参考:红黑联盟 所用到的数 ...
- java环境配置—配置Tomcat8环境
先安装JDK,配置好jdk环境后再配置Tomcat 8 配置环境变量: TOMCAT_HOME:D:\Program Files\apache-tomcat-8.0.28 CATALINA_HOME: ...
- Laya 类列表加载优化
Laya 类列表加载优化 @author ixenos 类列表:在一个页面展示的大量的零散单元的集合(聊天面板.背包) 一.按展示优化1.展示内容少,即使大量数据,但用户只看到少量信息的时候,考虑按需 ...