Spark技术内幕: Shuffle详解（二）

本文主要关注ShuffledRDD的Shuffle Read是如何从其他的node上读取数据的。

上文讲到了获取如何获取的策略都在org.apache.spark.storage.BlockFetcherIterator.BasicBlockFetcherIterator#splitLocalRemoteBlocks中。可以见注释。

    protected def splitLocalRemoteBlocks(): ArrayBuffer[FetchRequest] = {

      // Make remote requests at most maxBytesInFlight / 5 in length; the reason to keep them

      // smaller than maxBytesInFlight is to allow multiple, parallel fetches from up to 5

      // nodes, rather than blocking on reading output from one node.

      // 为了快速的得到数据，每次都会启动5个线程去最多5个node上取数据；

      // 每次请求的数据不会超过spark.reducer.maxMbInFlight（默认值为48MB） / 5。

      // 这样做的原因有几个：

      // 1. 避免占用目标机器的过多带宽，在千兆网卡为主流的今天，带宽还是比较重要的。

      //    如果一个连接将要占用48M的带宽，这个Network IO可能会成为瓶颈。

      // 2. 请求数据可以平行化，这样请求数据的时间可以大大减少。请求数据的总时间就是那个请求最长的。

      //    如果不是并行请求，那么总时间将是所有的请求时间之和。

      // 而设置spark.reducer.maxMbInFlight，也是为了不要占用过多的内存

      val targetRequestSize = math.max(maxBytesInFlight / 5, 1L)

      logInfo("maxBytesInFlight: " + maxBytesInFlight + ", targetRequestSize: " + targetRequestSize)

      // Split local and remote blocks. Remote blocks are further split into FetchRequests of size

      // at most maxBytesInFlight in order to limit the amount of data in flight.

      val remoteRequests = new ArrayBuffer[FetchRequest]

      var totalBlocks = 0

      for ((address, blockInfos) <- blocksByAddress) { //  address实际上是executor_id

        totalBlocks += blockInfos.size

        if (address == blockManagerId) { //数据在本地，那么直接走local read

          // Filter out zero-sized blocks

          localBlocksToFetch ++= blockInfos.filter(_._2 != 0).map(_._1)

          _numBlocksToFetch += localBlocksToFetch.size

        } else {

          val iterator = blockInfos.iterator

          var curRequestSize = 0L

          var curBlocks = new ArrayBuffer[(BlockId, Long)]

          while (iterator.hasNext) {

          // blockId 是org.apache.spark.storage.ShuffleBlockId，

          // 格式："shuffle_" + shuffleId + "_" + mapId + "_" + reduceId

            val (blockId, size) = iterator.next()

            // Skip empty blocks

            if (size > 0) { //过滤掉为大小为0的文件

              curBlocks += ((blockId, size))

              remoteBlocksToFetch += blockId

              _numBlocksToFetch += 1

              curRequestSize += size

            } else if (size < 0) {

              throw new BlockException(blockId, "Negative block size " + size)

            }

            if (curRequestSize >= targetRequestSize) { // 避免一次请求的数据量过大

              // Add this FetchRequest

              remoteRequests += new FetchRequest(address, curBlocks)

              curBlocks = new ArrayBuffer[(BlockId, Long)]

              logDebug(s"Creating fetch request of $curRequestSize at $address")

              curRequestSize = 0

            }

          }

          // Add in the final request

          if (!curBlocks.isEmpty) { // 将剩余的请求放到最后一个request中。

            remoteRequests += new FetchRequest(address, curBlocks)

          }

        }

      }

      logInfo("Getting " + _numBlocksToFetch + " non-empty blocks out of " +

        totalBlocks + " blocks")

      remoteRequests

    }

Spark技术内幕: Shuffle详解（二）的更多相关文章

Spark技术内幕: Shuffle详解（一）
通过上面一系列文章,我们知道在集群启动时,在Standalone模式下,Worker会向Master注册,使得Master可以感知进而管理整个集群:Master通过借助ZK,可以简单的实现HA:而应用 ...
Spark技术内幕: Shuffle详解（三）
前两篇文章写了Shuffle Read的一些实现细节.但是要想彻底理清楚这里边的实现逻辑,还是需要更多篇幅的:本篇开始,将按照Job的执行顺序,来讲解Shuffle.即,结果数据(ShuffleMap ...
[Spark内核] 第36课：TaskScheduler内幕天机解密：Spark shell案例运行日志详解、TaskScheduler和SchedulerBackend、FIFO与FAIR、Task运行时本地性算法详解等
本課主題通过 Spark-shell 窥探程序运行时的状况 TaskScheduler 与 SchedulerBackend 之间的关系 FIFO 与 FAIR 两种调度模式彻底解密 Task 数据 ...
Spark技术内幕：Stage划分及提交源码分析
http://blog.csdn.net/anzhsoft/article/details/39859463 当触发一个RDD的action后,以count为例,调用关系如下: org.apache. ...
前端技术之_CSS详解第一天
前端技术之_CSS详解第一天一html部分略.... 二.列表列表有3种 2.1 无序列表无序列表,用来表示一个列表的语义,并且每个项目和每个项目之间,是不分先后的. ul就是英语unorde ...
Spark技术内幕: Task向Executor提交的源码解析
在上文<Spark技术内幕:Stage划分及提交源码分析>中,我们分析了Stage的生成和提交.但是Stage的提交,只是DAGScheduler完成了对DAG的划分,生成了一个计算拓扑, ...
前端技术之_CSS详解第三天
前端技术之_CSS详解第三天二.权重问题深入 2.1 同一个标签,携带了多个类名,有冲突: <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 ...
前端技术之_CSS详解第四天
前端技术之_CSS详解第四天一.第三天的小总结盒模型box model,什么是盒子? 所有的标签都是盒子.无论是div.span.a都是盒子.图片.表单元素一律看做文本. 盒模型有哪些组成: wi ...
前端技术之_CSS详解第五天
前端技术之_CSS详解第五天一.行高和字号 1.1 行高 CSS中,所有的行,都有行高.盒模型的padding,绝对不是直接作用在文字上的,而是作用在“行”上的. <!DOCTYPE html ...

随机推荐

pytorch 移动端框架 thnets 附c示例代码
前年年前做一个手机移动端图像识别项目的时候, 先后尝试了mxnet,thnets,caffe,tensorflow. 当时的情况是,mxnet内存管理奇差,内存经常由于模型运算分配不足,app挂掉. ...
python3全栈开发-什么是粘包、粘包现象、如何解决粘包
一.粘包现象让我们基于tcp先制作一个远程执行命令的程序(1:执行错误命令 2:执行ls 3:执行ifconfig) 注意注意注意: res=subprocess.Popen(cmd.decode( ...
[USACO14DEC]驮运Piggy Back
题目描述 Bessie 和 Elsie在不同的区域放牧,他们希望花费最小的能量返回谷仓.从一个区域走到一个相连区域,Bessie要花费B单位的能量,Elsie要花费E单位的能量. 如果某次他们两走到同 ...
【BZOJ3573】【HNOI2014】米特运输
Description 米特是D星球上一种非常神秘的物质,蕴含着巨大的能量.在以米特为主要能源的D星上,这种米特能源的运输和储存一直是一个大问题. D星上有N个城市,我们将其顺序编号为1到N,1号城市 ...
●BZOJ 3512 DZY Loves Math IV
题链: http://www.lydsy.com/JudgeOnline/problem.php?id=3512 题解: $$求ANS=\sum_{i=1}^{N}\sum_{j=1}^{M}\phi ...
【LSGDOJ 2015】数页码
题目描述一本书的页码是从 1-n 编号的连续整数:1, 2, 3, ... , n.请你求出全部页码中所有单个数字的和,例如第 123 页,它的和就是 1+2+3=6. 输入一行为 n(1 < ...
暗牧 (m)
题目描述在 Dato3 的世界里,英雄们通过对量子力学的研究,发现了世界上其实存在着无数个位面——即是也被称作平行宇宙的存在.位面有无数多个,每个位面中包含 n 颗行星,由 n−1 个虫洞链接.同一个 ...
【SDOI2009】学校食堂
Description 小F的学校在城市的一个偏僻角落,所有学生都只好在学校吃饭.学校有一个食堂,虽然简陋,但食堂大厨总能做出让同学们满意的菜肴.当然,不同的人口味也不一定相同,但每个人的口味都可以用 ...
面试(二)---synchronized
一.前言本来计划将ConcurrentHashMap和HashMap对比着来说下,奈何看的源码有点懵逼,我在思考思考,等等有个清晰的思路在搞起来,我们先来谈一下synchronized ...
js 当前时间刷新
<p>每隔1秒钟,打印当前时间</p> <div id="time"></div> <script> function ...

Spark技术内幕: Shuffle详解（二）

Spark技术内幕: Shuffle详解（二）的更多相关文章

随机推荐

热门专题