Spark(二)【sc.textfile的分区策略源码分析】

【Spark(二)【sc.textfile的分区策略源码分析】】的更多相关文章

Spark(二)【sc.textfile的分区策略源码分析】

sparkcontext.textFile()返回的是HadoopRDD! 关于HadoopRDD的官方介绍,使用的是旧版的hadoop api ctrl+F12搜索 HadoopRDD的getPartitions方法,这里进行了分区计算读取的是txt文件,用的是TextInputFormat的切片规则当前spark3.0的HadoopRDD依赖于hadoop的切片规则.其中HadoopRDD用的是旧版hadoop API,还有个NewHadoopRDD用的是新版hadoop API 进去T…

RocketMQ中Broker的HA策略源码分析

Broker的HA策略分为两部分①同步元数据②同步消息数据同步元数据在Slave启动时,会启动一个定时任务用来从master同步元数据 if (role == BrokerRole.SLAVE) { if (null != slaveSyncFuture) { slaveSyncFuture.cancel(false); } this.slaveSynchronize.setMasterAddr(null); slaveSyncFuture = this.scheduledExecutorS…

66、Spark Streaming：数据处理原理剖析与源码分析（block与batch关系透彻解析）

一.数据处理原理剖析每隔我们设置的batch interval 的time,就去找ReceiverTracker,将其中的,从上次划分batch的时间,到目前为止的这个batch interval time间隔内的block封装为一个batch; 其次,会将这个batch中的数据,去创建为一个初始的RDD,一个batch内,在这段时间封装了几个block,就代表这个batch对应的RDD内会有几个partition; 这个batch对应的RDD的partition决定了数据处理阶段的并行度,这…

Netty源码分析（十二）----- 心跳服务之 IdleStateHandler 源码分析

什么是心跳机制? 心跳说的是在客户端和服务端在互相建立ESTABLISH状态的时候,如何通过发送一个最简单的包来保持连接的存活,还有监控另一边服务的可用性等. 心跳包的作用保活Q:为什么说心跳机制能保持连接的存活,它是集群中或长连接中最为有效避免网络中断的一个重要的保障措施?A:之所以说是“避免网络中断的一个重要保障措施”,原因是:我们得知公网IP是一个宝贵的资源,一旦某一连接长时间的占用并且不发数据,这怎能对得起网络给此连接分配公网IP,这简直是对网络资源最大的浪费,所以基本上所有的NAT路…

【一起学源码-微服务】Nexflix Eureka 源码十二：EurekaServer集群模式源码分析

前言前情回顾上一讲看了Eureka 注册中心的自我保护机制,以及里面提到的bug问题. 哈哈转眼间都2020年了,这个系列的文章从12.17 一直写到现在,也是不容易哈,每天持续不断学习,输出博客,这一段时间确实收获很多. 今天在公司给组内成员分享了Eureka源码剖析,反响效果还可以,也算是感觉收获了点东西.后面还会继续feign.ribbon.hystrix的源码学习,依然文章连载的形式输出. 本讲目录本讲主要是EurekaServer集群模式的数据同步讲解,主要目录如下. 目录如下…

Java - "JUC线程池" 线程状态与拒绝策略源码分析

Java多线程系列--“JUC线程池”04之线程池原理(三) 本章介绍线程池的生命周期.在"Java多线程系列--“基础篇”01之基本概念"中,我们介绍过,线程有5种状态:新建状态,就绪状态,运行状态,阻塞状态,死亡状态.线程池也有5种状态:然而,线程池不同于线程,线程池的5种状态是:Running, SHUTDOWN, STOP, TIDYING, TERMINATED. 线程池状态定义代码如下: private final AtomicInteger ctl = new Ato…

java容器二：List接口实现类源码分析

一.ArrayList 1.存储结构动态数组elementData transient Object[] elementData; 除此之外还有一些数据 //默认初始容量 private static final int DEFAULT_CAPACITY = 10; //共享空数组 private static final Object[] EMPTY_ELEMENTDATA = {}; //默认初始空数组 private static final Object[] DEFAULTCAPACI…

okhttp缓存策略源码分析：put&get方法

对于OkHttp的缓存策略其实就是在下一次请求的时候能节省更加的时间,从而可以更快的展示出数据,那在Okhttp如何使用缓存呢?其实很简单,如下: 配置一个Cache既可,其中接收两个参数:一个是缓存的文件,一个是缓存文件的最大大小,所以下面分析一下这个Cache类的一些细节: put方法[写入Response到缓存]: 纵观这个put方法,发现有一个非常引人注目的地方,如下: 另外还需要知晓一点,就是OkHttp维护了一个缓存清理的线程池,来对缓存的自动清理与管理,下面具体来分析一下该put方…

小记--------spark的Master的Application注册机制源码分析及Master的注册机制原理分析

原理图解: Master类位置所在:spark-core_2.11-2.1.0.jar的org.apache.spark.deploy.master下的Master类 //截取了部分代码 //处理Application注册的请求 case RegisterApplication(description, driver) => //如果master的状态是standby,也就是当前这个master,是standby master,不是active master //那么Application来…

Spring Ioc源码分析系列--Bean实例化过程(二)

Spring Ioc源码分析系列--Bean实例化过程(二) 前言上篇文章Spring Ioc源码分析系列--Bean实例化过程(一)简单分析了getBean()方法,还记得分析了什么吗?不记得了才是正常的,记住了才是怪人,忘记了可以回去翻翻,翻不翻都没事, 反正最后都会忘了. 这篇文章是给上篇填坑的,上篇分析到真正创建Bean的createBean(beanName, mbd, args)就没有继续深入去分析了,绕得太深,说不清楚.那么这一篇,就续上这个口子,去分析createBean(be…