【原创】大数据基础之HDFS（2）HDFS副本数量检查及复制逻辑

HDFS会周期性的检查是否有文件缺少副本，并触发副本复制逻辑使之达到配置的副本数，

<property>

<name>dfs.replication</name>

<value>3</value>

</property>

具体实现是在BlockManager中启动线程ReplicationMonitor完成：

org.apache.hadoop.hdfs.server.blockmanagement.BlockManager

  /**

   * Periodically calls computeReplicationWork().

   */

  private class ReplicationMonitor implements Runnable {

    @Override

    public void run() {

      while (namesystem.isRunning()) {

        try {

          // Process replication work only when active NN is out of safe mode.

          if (namesystem.isPopulatingReplQueues()) {

            computeDatanodeWork();

            processPendingReplications();

          }

          Thread.sleep(replicationRecheckInterval);

        } catch (Throwable t) {

注释：sleep间隔replicationRecheckInterval取配置dfs.namenode.replication.interval，默认为3，即3s

  /**

   * Compute block replication and block invalidation work that can be scheduled

   * on data-nodes. The datanode will be informed of this work at the next

   * heartbeat.

   *

   * @return number of blocks scheduled for replication or removal.

   */

  int computeDatanodeWork() {

    // Blocks should not be replicated or removed if in safe mode.

    // It's OK to check safe mode here w/o holding lock, in the worst

    // case extra replications will be scheduled, and these will get

    // fixed up later.

    if (namesystem.isInSafeMode()) {

      return 0;

    }

    final int numlive = heartbeatManager.getLiveDatanodeCount();

    final int blocksToProcess = numlive

        * this.blocksReplWorkMultiplier;

    final int nodesToProcess = (int) Math.ceil(numlive

        * this.blocksInvalidateWorkPct);

    int workFound = this.computeReplicationWork(blocksToProcess);

注释：倍数blocksReplWorkMultiplier取配置dfs.namenode.replication.work.multiplier.per.iteration，默认为2，即每次处理datanode数量*2个block；

  /**

   * Scan blocks in {@link #neededReplications} and assign replication

   * work to data-nodes they belong to.

   *

   * The number of process blocks equals either twice the number of live

   * data-nodes or the number of under-replicated blocks whichever is less.

   *

   * @return number of blocks scheduled for replication during this iteration.

   */

  int computeReplicationWork(int blocksToProcess) {

    List<List<Block>> blocksToReplicate = null;

    namesystem.writeLock();

    try {

      // Choose the blocks to be replicated

      blocksToReplicate = neededReplications

          .chooseUnderReplicatedBlocks(blocksToProcess);

    } finally {

      namesystem.writeUnlock();

    }

    return computeReplicationWorkForBlocks(blocksToReplicate);

  }

  int computeReplicationWorkForBlocks(List<List<Block>> blocksToReplicate) {

...

          // Add block to the to be replicated list

          rw.srcNode.addBlockToBeReplicated(block, targets);

          scheduledWork++;

注释：具体的处理过程是将待复制block添加到对应的原始datanode上；

下面看DatanodeManager代码：

org.apache.hadoop.hdfs.server.blockmanagement.DatanodeManager

  public DatanodeCommand[] handleHeartbeat(DatanodeRegistration nodeReg,

      StorageReport[] reports, final String blockPoolId,

      long cacheCapacity, long cacheUsed, int xceiverCount,

      int maxTransfers, int failedVolumes

      ) throws IOException {

...

        final List<DatanodeCommand> cmds = new ArrayList<DatanodeCommand>();

        //check pending replication

        List<BlockTargetPair> pendingList = nodeinfo.getReplicationCommand(

              maxTransfers);

        if (pendingList != null) {

          cmds.add(new BlockCommand(DatanodeProtocol.DNA_TRANSFER, blockPoolId,

              pendingList));

        }

注释：然后在DatanodeManager中处理心跳时将复制block信息发给对应的原始datanode；其中maxTransfer取值为

      final int maxTransfer = blockManager.getMaxReplicationStreams()

          - xmitsInProgress;

getMaxReplicationStreams取配置dfs.namenode.replication.max-streams，默认是2，即一个datanode同时最多有2个block在复制；

【原创】大数据基础之HDFS（2）HDFS副本数量检查及复制逻辑的更多相关文章

【原创】大数据基础之Zookeeper（2）源代码解析
核心枚举 public enum ServerState { LOOKING, FOLLOWING, LEADING, OBSERVING; } zookeeper服务器状态:刚启动LOOKING,f ...
【原创】大数据基础之HDFS（1）HDFS新创建文件如何分配Datanode
HDFS中的File由Block组成,一个File包含一个或多个Block,当创建File时会创建一个Block,然后根据配置的副本数量(默认是3)申请3个Datanode来存放这个Block: 通过 ...
【原创】大数据基础之Kerberos（2）hive impala hdfs访问
1 hive # kadmin.local -q 'ktadd -k /tmp/hive3.keytab -norandkey hive/server03@TEST.COM'# kinit -kt / ...
大数据基础总结---HDFS分布式文件系统
HDFS分布式文件系统文件系统的基本概述文件系统定义:文件系统是一种存储和组织计算机数据的方法,它使得对其访问和查找变得容易. 文件名:在文件系统中,文件名是用于定位存储位置. 元数据(Metad ...
大数据学习（一）-------- HDFS
需要精通java开发,有一定linux基础. 1.简介大数据就是对海量数据进行数据挖掘. 已经有了很多框架方便使用,常用的有hadoop,storm,spark,flink等,辅助框架hive,ka ...
大数据技术之Hadoop（HDFS）
第1章 HDFS概述 1.1 HDFS产出背景及定义 1.2 HDFS优缺点 1.3 HDFS组成架构 1.4 HDFS文件块大小(面试重点) 第2章 HDFS的Shell操作(开发重点) 1．基本语 ...
大数据学习（02）——HDFS入门
Hadoop模块提到大数据,Hadoop是一个绕不开的话题,我们来看看Hadoop本身包含哪些模块. Common是基础模块,这个是必须用的.剩下常用的就是HDFS和YARN. MapReduce现 ...
【原创】大数据基础之Impala（1）简介、安装、使用
impala2.12 官方:http://impala.apache.org/ 一简介 Apache Impala is the open source, native analytic datab ...
大数据学习之旅1——HDFS版本演化
最近开始学习大数据,发现大数据有很多很多组件,我现在负责的是HDFS(Hadoop分布式储存系统)的学习,整理了一下HDFS的版本情况.因为HDFS是Hadoop的重要组成部分,所以有关HDFS的版本 ...

随机推荐

[Spark][Streaming]Spark读取网络输入的例子
Spark读取网络输入的例子: 参考如下的URL进行试验 https://stackoverflow.com/questions/46739081/how-to-get-record-in-strin ...
Mysql_连接字符串
1.本地数据库连接 <connectionStrings> <add name="ConnectionString" connectionString=" ...
python print 在windows上出现 Bad file descriptor error
先说一下情况,一个python写的采集程序,做成windows服务在windows上运行. 这个问题出现的挺奇特,本来一套采集程序,一个采集文件的时候没问题,两个采集文件的时候也没问题,当三个采集文件 ...
Jenkins下载历史Build版本的归档文件
/root/.jenkins/jobs/zgg-crm-pre/builds//com.zgg$crm/archive/com.zgg/crm/0.0.1/crm-0.0.1.war https:// ...
map遍历性能记录
map遍历可以通过keySet或者entrySet方式. 性能上:entrySet略胜一筹,原因是keySet获取到key后再根据key去获取value,在查一遍,所以慢一些. keySet: //先 ...
ASUS RT-AC68U 刷梅林固件及安装***插件记录（详细）
本文借鉴网络并亲自刷机过程记录(网上很多教程都不太详细) 版本:华硕ASUS RT- AC68U Wireless-AC1900 路由器的连接方式略,有说明书连好后打开浏览器输入:http:/ ...
js 实现数据结构 -- 栈
原文: 在 Javascript 中学习数据结构与算法. 概念: 栈是一种遵从先进后出 (LIFO) 原则的有序集合:新添加的或待删除的元素都保存在栈的末尾,称作栈顶,另一端为栈底.在栈里,新元素都靠 ...
在Django中使用logging模块
一.Django logging配置 1.在setting.py中配置 # 日志文件存放路径 BASE_LOG_DIR = os.path.join(BASE_DIR, "log" ...
C++/cli中swtich处理命令行接收到的关键字
QQ群友中有人提出这样一个问题: Swtich接受的是整形或枚举类型, 关键字多数是一个字符, 将string转换成char就应该可以, 所以我试着写了一下代码, 直接提取string的第一个字符, ...
pytest 11 allure2生成html报告
allure是一个report框架,支持java的Junit/testng等框架,当然也可以支持python的pytest框架,也可以集成到Jenkins上展示高大上的报告界面. 环境准备 1.pyt ...

【原创】大数据基础之HDFS（2）HDFS副本数量检查及复制逻辑

【原创】大数据基础之HDFS（2）HDFS副本数量检查及复制逻辑的更多相关文章

随机推荐

热门专题