hadoop1——map到reduce中间的shuffle过程

---恢复内容开始---

shuffle和排序

过程图如下：

MapReduce确保每个reduce的输入都按键排序，系统执行排序的过程——将map输出作为输入传给reduce——成为shuffle，理解shuffle的工作原理，有助于MapReduce程序的优化，因为shuffle属于不断被优化和改进的代码库的一部分，shuffle是MapReduce的心脏，是奇迹发生的地方

map端

　　map函数开始产生输出时，并不是简单的将它写到磁盘，这个过程非常复杂，它是利用缓冲的方式写到内存，并处于效率的考虑进行预排序。

　　每个map任务都有一个环形内存缓冲区，用于存储任务的输出，默认情况下，缓冲区的大小为100MB，此值可以通过改变io.sort.mb属性来调整，一旦缓冲区内容达到阀值(io.sort.spill.percent,默认为80%)，一个后台线程便开始把内容溢写到磁盘中，在写磁盘过程中，map输出继续被写到缓冲区，但如果再次期间缓冲区被填满，map会阻塞直到写磁盘过程完成。

　　写磁盘将按轮询方式写到mapred.local.dir属性指定的作业特定子目录中的目录中

　　在写磁盘之前，线程首先根据数据最终要传送到的reducer把数据划分成相应的分区(partition)。在每个分区中，后台线程按键进行内排序，如果有一个combiner，它会在排序后的输出上运行。

　　一旦内存缓冲区达到溢出写的阀值，就会新建一个溢出写文件，因此在map写完其最后一个输出记录之前，会有几个溢出写的文件，在任务完成之前，溢出写文件被合并成一个已分区且已排序的输出文件，配置属性io.sort.factor控制着一次最多能合并多少流，默认值是10.

　　如果已指定combiner，并且溢出写次数至少为3(min.num.spill.for.combiner属性的取值)时，则combiner就会在输出文件写到磁盘之前运行，combiner可以再输入上反复运行，但并不影响最终结果，运行combiner的意义在与使map的输出更紧凑，使得写到本地磁盘和传给reducer的数据更少。

　　写磁盘时压缩 map 输出往往是个很好的主意，因为这样会让写磁盘的速度更快，节约磁盘空间，并且减少传给 reducer 的数据量。默认情况下，输出是不压缩的，但只要将 mapred.compress map.output 设置为 true ，

　　reducer通过http方式得到输出文件的分区，用于文件分区的工作线程的数量由任务的tracker.http.threads属性控制，此设置针对每个tasktracker，而不是针对每个map任务槽，默认值是40，在运行大型作业的大型集群上，此值可以根据需要而增加

reducer端

　　现在转到处理过程的reduce部分，map输出文件位于map任务的tasttracker的本地磁盘上，现在tasktracker需要为分区文件运行reduce任务，更进一步，reduce任务需要集群上若干个map任务的输出作为其特殊的分区文件，每个map任务的完成时间可能不同，因此只要有一个任务完成，reduce任务就开始复制其输出，这就是reduce任务的复制阶段，reduce任务有少量复制线程，因此能够并行取得map输出，默认值是5个线程，这个默认值可以通过mapred.reduce.parallel.copies属性来改变。

　　reducer如何知道要从哪个tasktracker取得map输出呢？

　　map任务成功完成后，它们会通知其父tasktracker状态已更新，然后tasktracker通过心跳机制进而通知jobtracker。jobtracker知道map输出和tasktracker之间的映射关系，reducer中一个线程定期询问jobtracker以方便获取map的输出位置，直到它获得所有输出位置。由于reducer可能失败，因此，tasktracker并没有在第一个reducer检索到map输出时就立即从磁盘上删除它们，相反，tasktracker会等待，直到jobtrackr告知它可以删除map输出，这是作业完成后才执行的。

　　如果map输出相当小，则会被复制到reduce tasktraker的内存(缓冲区大小由mapred.job.shuffle.merge.percent决定)或达到map输出阀值(由mapred.inmem.merge.threshld控制),则合并后溢写到磁盘中。

　　随着磁盘上的副本的增多，后台线程会将它们合并为更大的，排序好的文件。这会为后面的合并节省一些时间，注意，为了合并，压缩的map输出(通过map任务)都必须在内存中被解压缩。

　　复制完所有map输出被复制期间，reduce任务进去合并阶段，这个阶段将合并map输出，维持其顺序排序，这是循环进行的，比如有50个map输出，而合并因子(merge factor)是10(10位默认值，由io.sort.factor属性设置)，合并将进行五次，每次将10个文件合并成一个文件，因此最后有5个中间文件。

　　在最后阶段，即reduce阶段，直接把数据输入reduce函数，从而省略了一次磁盘往返形成，并没有将这5个文件合并成一个已排序的文件作为最后一趟，最后的合并既可能来自内存和也可能来自磁盘片段。

hadoop1——map到reduce中间的shuffle过程的更多相关文章

Shuffle过程的简单介绍
Shuffle是连接Map和Reduce的桥梁 Shuffle分为Map端的Shuffle和Reduce端的Shuffle Map端的shuffle 1输入数据和执行任务: 分片后分配Map任务,每个 ...
【Big Data - Hadoop - MapReduce】通过腾讯shuffle部署对shuffle过程进行详解
摘要: 通过腾讯shuffle部署对shuffle过程进行详解摘要:腾讯分布式数据仓库基于开源软件Hadoop和Hive进行构建,TDW计算引擎包括两部分:MapReduce和Spark,两者内部都 ...
彻底理解MapReduce shuffle过程原理
彻底理解MapReduce shuffle过程原理 MapReduce的Shuffle过程介绍 Shuffle的本义是洗牌.混洗,把一组有一定规则的数据尽量转换成一组无规则的数据,越随机越好.MapR ...
MapReduce的Shuffle过程介绍
MapReduce的Shuffle过程介绍 Shuffle的本义是洗牌.混洗,把一组有一定规则的数据尽量转换成一组无规则的数据,越随机越好.MapReduce中的Shuffle更像是洗牌的逆过程,把一 ...
hadoop的mapReduce和Spark的shuffle过程的详解与对比及优化
https://blog.csdn.net/u010697988/article/details/70173104 大数据的分布式计算框架目前使用的最多的就是hadoop的mapReduce和Spar ...
map/reduce之间的shuffle，partition，combiner过程的详解
Shuffle的本意是洗牌.混乱的意思,类似于java中的Collections.shuffle(List)方法,它会随机地打乱参数list里的元素顺序.MapReduce中的Shuffle过程.所谓 ...
MapReduce剖析笔记之五：Map与Reduce任务分配过程
在上一节分析了TaskTracker和JobTracker之间通过周期的心跳消息获取任务分配结果的过程.中间留了一个问题,就是任务到底是怎么分配的.任务的分配自然是由JobTracker做出来的,具体 ...
TaskTracker执行map或reduce任务的过程2
TaskTracker执行map或reduce任务的过程(二) 上次说到,当MapLauncher或ReduceLancher(用于执行任务的线程,它们扩展自TaskLauncher),从它们所维护的 ...
TaskTracker获取并执行map或reduce任务的过程1
TaskTracker获取并执行map或reduce任务的过程(一) 我们知道TaskTracker在默认情况下,每个3秒就行JobTracker发送一个心跳包,也就是在这个心跳包中包含对任务的请求. ...

随机推荐

SIGGRAPH
这两天看了一些文章,今天来说说SIGGRAPH. 对于搞图形学的人来说,SIGGRAPH绝对是如雷贯耳.SIGGRAPH是计算机图形界(也包含图像)最顶级的会议,没有之中的一个,是全世界的图形学者公认 ...
iOS开发之蓝牙通信
一.引言蓝牙是设备近距离通信的一种方便手段,在iPhone引入蓝牙4.0后,设备之间的通讯变得更加简单.相关的蓝牙操作由专门的 CoreBluetooth.framework进行统一管理.通过蓝牙进 ...
IOPS=(Queue Depth）/（IO latency)
IO 延迟:存储设备的IO延迟 Queue Depth:磁盘控制器所发出的批量指令的最大条数 IOPS:磁盘设备每秒的IO 三者之间的关系:IOPS=(Queue Depth)/(IO latency ...
UITableview自定义accessory按钮和ImageView大小一致
if (cell == nil) { cell = [[UITableViewCell alloc] initWithStyle:UITableViewCellStyleSubtitle reuseI ...
java注解研究
注解作用常见的作用有以下几种: 生成文档.这是最常见的,也是java 最早提供的注解.常用的有@see @param @return @author等. 跟踪代码依赖性,实现替代配置文件功能.比较常 ...
自定义ContentProvider
ContentProvider作为安卓的四大组件之一,在看开发中用到的频率远不如其他三个,以至于我都把这个东西给忘了,最近由于工作原因,不得不重新拾起来总结一下,那么今天就来说说自定义ContentP ...
openwrt chinadns
opkg update opkg install ip ipset resolveip iptables-mod-tproxy resolveip libopenssl luci-i18n-base- ...
【转】Android 应用测试总结
前提所有的功能分支已完成启动:1. 启动入口:桌面正常启动,最近运行启动,所有程序列表中启动,锁屏快捷启动2. 其他入口:从其他程序开启应用,从外部以文件形式打开应用(如果有)3. 退回:从其他程序 ...
ECMA5 Array 新增API reduce
1)reduce:相当与迭代: [].reduce(function(previous,current,index,array){ return previous * current;//相当与做阶乘 ...
windows下Nginx配置与测试
1.获取下载地址:http://nginx.org/en/download.html 参考网址:http://nginx.org/en/docs/windows.html 2.准备工作 ...

hadoop1——map到reduce中间的shuffle过程

hadoop1——map到reduce中间的shuffle过程的更多相关文章

随机推荐

热门专题