Spark技术内幕: Shuffle详解（二）

本文主要关注ShuffledRDD的Shuffle Read是如何从其他的node上读取数据的。

上文讲到了获取如何获取的策略都在org.apache.spark.storage.BlockFetcherIterator.BasicBlockFetcherIterator#splitLocalRemoteBlocks中。可以见注释。

    protected def splitLocalRemoteBlocks(): ArrayBuffer[FetchRequest] = {

      // Make remote requests at most maxBytesInFlight / 5 in length; the reason to keep them

      // smaller than maxBytesInFlight is to allow multiple, parallel fetches from up to 5

      // nodes, rather than blocking on reading output from one node.

      // 为了快速的得到数据，每次都会启动5个线程去最多5个node上取数据；

      // 每次请求的数据不会超过spark.reducer.maxMbInFlight（默认值为48MB） / 5。

      // 这样做的原因有几个：

      // 1. 避免占用目标机器的过多带宽，在千兆网卡为主流的今天，带宽还是比较重要的。

      //    如果一个连接将要占用48M的带宽，这个Network IO可能会成为瓶颈。

      // 2. 请求数据可以平行化，这样请求数据的时间可以大大减少。请求数据的总时间就是那个请求最长的。

      //    如果不是并行请求，那么总时间将是所有的请求时间之和。

      // 而设置spark.reducer.maxMbInFlight，也是为了不要占用过多的内存

      val targetRequestSize = math.max(maxBytesInFlight / 5, 1L)

      logInfo("maxBytesInFlight: " + maxBytesInFlight + ", targetRequestSize: " + targetRequestSize)

      // Split local and remote blocks. Remote blocks are further split into FetchRequests of size

      // at most maxBytesInFlight in order to limit the amount of data in flight.

      val remoteRequests = new ArrayBuffer[FetchRequest]

      var totalBlocks = 0

      for ((address, blockInfos) <- blocksByAddress) { //  address实际上是executor_id

        totalBlocks += blockInfos.size

        if (address == blockManagerId) { //数据在本地，那么直接走local read

          // Filter out zero-sized blocks

          localBlocksToFetch ++= blockInfos.filter(_._2 != 0).map(_._1)

          _numBlocksToFetch += localBlocksToFetch.size

        } else {

          val iterator = blockInfos.iterator

          var curRequestSize = 0L

          var curBlocks = new ArrayBuffer[(BlockId, Long)]

          while (iterator.hasNext) {

          // blockId 是org.apache.spark.storage.ShuffleBlockId，

          // 格式："shuffle_" + shuffleId + "_" + mapId + "_" + reduceId

            val (blockId, size) = iterator.next()

            // Skip empty blocks

            if (size > 0) { //过滤掉为大小为0的文件

              curBlocks += ((blockId, size))

              remoteBlocksToFetch += blockId

              _numBlocksToFetch += 1

              curRequestSize += size

            } else if (size < 0) {

              throw new BlockException(blockId, "Negative block size " + size)

            }

            if (curRequestSize >= targetRequestSize) { // 避免一次请求的数据量过大

              // Add this FetchRequest

              remoteRequests += new FetchRequest(address, curBlocks)

              curBlocks = new ArrayBuffer[(BlockId, Long)]

              logDebug(s"Creating fetch request of $curRequestSize at $address")

              curRequestSize = 0

            }

          }

          // Add in the final request

          if (!curBlocks.isEmpty) { // 将剩余的请求放到最后一个request中。

            remoteRequests += new FetchRequest(address, curBlocks)

          }

        }

      }

      logInfo("Getting " + _numBlocksToFetch + " non-empty blocks out of " +

        totalBlocks + " blocks")

      remoteRequests

    }

Spark技术内幕: Shuffle详解（二）的更多相关文章

Spark技术内幕: Shuffle详解（一）
通过上面一系列文章,我们知道在集群启动时,在Standalone模式下,Worker会向Master注册,使得Master可以感知进而管理整个集群:Master通过借助ZK,可以简单的实现HA:而应用 ...
Spark技术内幕: Shuffle详解（三）
前两篇文章写了Shuffle Read的一些实现细节.但是要想彻底理清楚这里边的实现逻辑,还是需要更多篇幅的:本篇开始,将按照Job的执行顺序,来讲解Shuffle.即,结果数据(ShuffleMap ...
[Spark内核] 第36课：TaskScheduler内幕天机解密：Spark shell案例运行日志详解、TaskScheduler和SchedulerBackend、FIFO与FAIR、Task运行时本地性算法详解等
本課主題通过 Spark-shell 窥探程序运行时的状况 TaskScheduler 与 SchedulerBackend 之间的关系 FIFO 与 FAIR 两种调度模式彻底解密 Task 数据 ...
Spark技术内幕：Stage划分及提交源码分析
http://blog.csdn.net/anzhsoft/article/details/39859463 当触发一个RDD的action后,以count为例,调用关系如下: org.apache. ...
前端技术之_CSS详解第一天
前端技术之_CSS详解第一天一html部分略.... 二.列表列表有3种 2.1 无序列表无序列表,用来表示一个列表的语义,并且每个项目和每个项目之间,是不分先后的. ul就是英语unorde ...
Spark技术内幕: Task向Executor提交的源码解析
在上文<Spark技术内幕:Stage划分及提交源码分析>中,我们分析了Stage的生成和提交.但是Stage的提交,只是DAGScheduler完成了对DAG的划分,生成了一个计算拓扑, ...
前端技术之_CSS详解第三天
前端技术之_CSS详解第三天二.权重问题深入 2.1 同一个标签,携带了多个类名,有冲突: <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 ...
前端技术之_CSS详解第四天
前端技术之_CSS详解第四天一.第三天的小总结盒模型box model,什么是盒子? 所有的标签都是盒子.无论是div.span.a都是盒子.图片.表单元素一律看做文本. 盒模型有哪些组成: wi ...
前端技术之_CSS详解第五天
前端技术之_CSS详解第五天一.行高和字号 1.1 行高 CSS中,所有的行,都有行高.盒模型的padding,绝对不是直接作用在文字上的,而是作用在“行”上的. <!DOCTYPE html ...

随机推荐

python学习记录 - python3.x中如何实现print不换行
python3.x中如何实现print不换行大家应该知道python中print之后是默认换行的, 那如何我们不想换行,且不想讲输出内容用一个print函数输出时,就需要改变print默认换行的 ...
[HAOI 2007]上升序列
Description 对于一个给定的S={a1,a2,a3,…,an},若有P={ax1,ax2,ax3,…,axm},满足(x1 < x2 < … < xm)且( ax1 < ...
伊布(ib)
[问题描述]ib 被困在了一个美术馆里,她需要收集美术馆内的每种颜料才能获得逃出美术馆的钥匙美术馆由 n*m 的房间构成,每个房间里有一种颜料,解锁进入后就可以收集.有的房间不能解锁,如果解锁的话会直 ...
C++traits——STL源码剖析
有时候我们希望知道迭代器所指的元素类型. 以迭代器所指声明对象: template<typename Iterator, typename T> void func_impl(Iterat ...
Ubuntu 16.04安装JDK/JRE并配置环境变量
作为一个Linux新手,在写这篇文章之前,安装了几次jdk,好多次都是环境变量配置错误,导致无法登录系统.经过几天的研究,今天新装系统,从头来完整配置一遍系统版本:Ubuntu 16.04 JDK版 ...
CCA更新流程分析
1 CCA CCA(空间信道评估)在CSMA/CA中比较非常重要,事关整机吞吐量,所以对其实现进行简单分析.CCA好像应该有2种:CCA-CS,是属于PLCP层的,捕获到能量且能量值高于-82dB后, ...
Tinychain 是比特币的一个简易口袋实现
Putting the rough in "rough consensus" Tinychain is a pocket-sized implementation of Bitco ...
easyui datagrid editor combobox添加空选则清空combobox框
<script type='text/javascript'> var editIndex = undefined; $(function() { $('#tb1').datagrid({ ...
聊聊并发（一）深入分析Volatile的实现原理
本文属于作者原创,原文发表于InfoQ:http://www.infoq.com/cn/articles/ftf-java-volatile 引言在多线程并发编程中synchronized和Vola ...
Jupyter notebook 输出含中文的pdf 方法
我电脑 OS 是 Ubuntu14.04, 可用的最简单方法是: 打开终端,输入 sudo find / -name article.tplx 用以查找 article.tplx 文件位置,我电脑的结 ...

Spark技术内幕: Shuffle详解（二）

Spark技术内幕: Shuffle详解（二）的更多相关文章

随机推荐

热门专题