Hadoop源码学习笔记之NameNode启动场景流程三：FSNamesystem初始化源码剖析

上篇内容分析了http server的启动代码，这篇文章继续从initialize()方法中按执行顺序进行分析。内容还是分为三大块：

一、源码调用关系分析

二、伪代码执行流程

三、代码图解

一、源码调用关系分析

　　上一篇内容是NameNode启动http server的分析，是根据锁定NameNode的main()入口，发现了该入口仅有两行核心代码，先进入到了第一行核心代码

　　createNameNode()中，发现默认情况是new了一个NameNode对象。在NameNode的构造方法中，有一些很重要的初始化操作，比如启动

　　http server、加载元数据、初始化rpc server、安全模式检查等。

　　废话不多说，前面的NameNode.main()、createNameNode()、new NameNode()都不再赘述、直接从initialize()说起：

protected void initialize(Configuration conf) throws IOException {

  // 可以通过找到下面变量名的映射，在hdfs-default.xml中找到对应的配置

  if (conf.get(HADOOP_USER_GROUP_METRICS_PERCENTILES_INTERVALS) == null) {

    String intervals = conf.get(DFS_METRICS_PERCENTILES_INTERVALS_KEY);

    if (intervals != null) {

      conf.set(HADOOP_USER_GROUP_METRICS_PERCENTILES_INTERVALS,

        intervals);

    }

  }

  ......

  // 核心代码：启动HttpServer

  if (NamenodeRole.NAMENODE == role) {

    startHttpServer(conf);

  }

  this.spanReceiverHost = SpanReceiverHost.getInstance(conf);

  // 核心代码：FSNamesystem初始化

  loadNamesystem(conf);

  // 核心代码：后面rpc server启动流程篇研究

  rpcServer = createRpcServer(conf);

  ......

  // 核心代码：启动一些服务组件，包括rpc server等

  startCommonServices(conf);

}

　　本篇内容主要是关于管理磁盘元数据的FSNamesystem初始化流程，所以从方法名即可推测loadNamesystem()是需要我们重点关注的核心中的核心。

　　点进去：

protected void loadNamesystem(Configuration conf) throws IOException {

    // 核心代码：从磁盘上加载元数据，loadFromDisk()就是从磁盘上读取fsimage和edits文件。

    this.namesystem = FSNamesystem.loadFromDisk(conf);

  }

　　我们都知道NameNode的功能之一是，在NameNode启动的时候，会将磁盘上的fsimage和edits两个文件都读取到内存中进行合并，形成一份最新的

　　元数据。这份最新的元数据放在哪呢？其实是放在了内存中由FSNamesystem进行管理。真的是这样的吗？我们继续往下看，进入到loadFromDisk()：

  /**

   * Instantiates an FSNamesystem loaded from the image and edits

   * directories specified in the passed Configuration.

   *

   * @param conf the Configuration which specifies the storage directories

   *             from which to load

   * @return an FSNamesystem which contains the loaded namespace

   * @throws IOException if loading fails

   */

  static FSNamesystem loadFromDisk(Configuration conf) throws IOException {

    checkConfiguration(conf);

    // 核心代码：构造一个FSImage对象，从NamespaceDirs、NamespaceEditsDirs指定的路径加载

    FSImage fsImage = new FSImage(conf,

        // 默认是从 DFS_NAMENODE_NAME_DIR_KEY 加载fsimage文件

        FSNamesystem.getNamespaceDirs(conf),

        // 默认是从 DFS_NAMENODE_EDITS_DIR_KEY 加载edits文件

        FSNamesystem.getNamespaceEditsDirs(conf));

    // 核心代码：根据指定了fsimage和edits文件路径的fsimage对象，实例化FSNamesystem对象

    FSNamesystem namesystem = new FSNamesystem(conf, fsImage, false);

    StartupOption startOpt = NameNode.getStartupOption(conf);

    if (startOpt == StartupOption.RECOVER) {

      namesystem.setSafeMode(SafeModeAction.SAFEMODE_ENTER);

    }

　　 ...try {

      // 核心代码：从磁盘上加载数据，在内存中合并数据

      // 在NameNode刚启动的时候，会从磁盘读取fsimage和edits文件到内存中，合并为一份最新的

      // 元数据，然后将这份新的元数据写出到磁盘替换之前旧的fsimage。然后，还会重新打开一个

      // 空的edits文件，以供接下来的元数据变动日志写入。这个loadFSImage()主要就是干了这么一件事情

      // 会在namenode元数据管理研究时进行深入详细剖析。

      namesystem.loadFSImage(startOpt);

    } catch (IOException ioe) {

      ...

    }
　　 ...

    return namesystem;

  }

　　首先这个loadFromDisk()有一段注释，将这个方法的功能和目的说的也很明白了：根据配置文件指定的路径，实例化一个从image和edits加载元数据

　　的FSNamesystem对象。下面开始分析核心代码，这段有3行核心代码：

　　fsimage = new FSImage(conf, NameSpaceDirs, NameSpaceEditsDirs);

　　　　这行代码是构造了一个FSImage对象，从NameSpaceDirs, NameSpaceEditsDirs分别

　　　　读取fsimage和edits文件。其中NameSpaceDirs和NameSpaceEditsDirs经过溯源分别对应 dfs.namenode.name.dir 和

　　　　dfs.namenode.shared.edits.dir，这两个属性都可以在hdfs-default.xml中查看和配置。

　　FSNamesystem namesystem = new FSNamesystem(conf, fsimage, false);

　　　　根据上面指定了fsimage路径和edits路径的fsimage对象，构造一个FSNamesystem对象。

　　namesystem.loadFSImage();

　　　　开始执行loadFSImage()方法，从磁盘上加载数据并在内存中进行合并。

　　注意，在合并fsimage和edits形成一份新的元数据之后，会将这份新的元数据写出到磁盘替换旧的fsimage文件，然后还会打开一个新的edits

　　文件，以供接下来的元数据变动的日志写入。这些操作都是在loadFSImage()中完成的，具体的进入到该方法中可以详细了解。

二、伪代码执行流程

三、代码图解　　

Hadoop源码学习笔记之NameNode启动场景流程三：FSNamesystem初始化源码剖析的更多相关文章

Hadoop源码学习笔记之NameNode启动场景流程四：rpc server初始化及启动
老规矩,还是分三步走,分别为源码调用分析.伪代码核心梳理.调用关系图解. 一.源码调用分析根据上篇的梳理,直接从initialize()方法着手.源码如下,部分代码的功能以及说明,已经在注释阐述了. ...
Hadoop源码学习笔记之NameNode启动场景流程二：http server启动源码剖析
NameNodeHttpServer启动源码剖析,这一部分主要按以下步骤进行: 一.源码调用分析二.伪代码调用流程梳理三.http server服务流程图解第一步,源码调用分析前一篇文章已经锁 ...
Hadoop源码学习笔记之NameNode启动场景流程五：磁盘空间检查及安全模式检查
本篇内容关注NameNode启动之前,active状态和standby状态的一些后台服务及准备工作,即源码里的CommonServices.主要包括磁盘空间检查. 可用资源检查.安全模式等.依然分为三 ...
Hadoop源码学习笔记之NameNode启动场景流程一：源码环境搭建和项目模块及NameNode结构简单介绍
最近在跟着一个大佬学习Hadoop底层源码及架构等知识点,觉得有必要记录下来这个学习过程.想到了这个废弃已久的blog账号,决定重新开始更新. 主要分以下几步来进行源码学习: 一.搭建源码阅读环境二. ...
JUC源码学习笔记5——线程池，FutureTask，Executor框架源码解析
JUC源码学习笔记5--线程池,FutureTask,Executor框架源码解析源码基于JDK8 参考了美团技术博客 https://tech.meituan.com/2020/04/02/jav ...
（三）Netty源码学习笔记之boss线程处理流程
尊重原创,转载注明出处,原文地址:http://www.cnblogs.com/cishengchongyan/p/6160194.html 本文我们将先从NioEventLoop开始来学习服务端的 ...
Spring源码学习笔记12——总结篇,IOC，Bean的生命周期，三大扩展点
Spring源码学习笔记12--总结篇,IOC,Bean的生命周期,三大扩展点参考了Spring 官网文档 https://docs.spring.io/spring-framework/docs/ ...
async-validator 源码学习笔记（六）：validate 方法
系列文章: 1.async-validator 源码学习(一):文档翻译 2.async-validator 源码学习笔记(二):目录结构 3.async-validator 源码学习笔记(三):ru ...
Hadoop源码学习笔记(5) ——回顾DataNode和NameNode的类结构
Hadoop源码学习笔记(5) ——回顾DataNode和NameNode的类结构之前我们简要的看过了DataNode的main函数以及整个类的大至,现在结合前面我们研究的线程和RPC,则可以进一步 ...

随机推荐

构建微软智能云：介绍新的Azure业务转型创新技术
在我和用户的交流中发现,在任何类型和规模的组织中,每当涉及到在云中实现商业价值的最大化并取得竞争优势的时候,就会明显呈现三个趋势.首先,应用程序促进着组织更快速实现价值.同时,诸如机器学习.数据预测分 ...
安装SCOM2012在连接数据库时报错：" SQL Server 的安装版本不受支持"
在SQL群集上有两个实例,分别为:SQLCSNET1\MSSQLSERVER1和SQLCSNET2\MSSQLSERVER2,在计算机sccmz上安装SCOM2012 SP1中的组件管理服务器 ...
ThreadState属性
这个属性代表了线程运行时状态,在不同的情况下有不同的值,我们有时候可以通过对该值的判断来设计程序流程. ThreadState 属性的取值如下: Aborted:线程已停止: AbortRequest ...
深入浅出SharePoint——使用WinDbg进行调试
August 12th 2017 Week 32nd Saturday
That which does not kill us makes us stronger. 但凡不能杀死你的,最终都会使你更强大. Seemingly I have heard this from ...
POJ 2528 Mayor's poster
主要是参考了这个博客地址戳这儿题目大意:n(n<=10000) 个人依次贴海报,给出每张海报所贴的范围li,ri(1<=li<=ri<=10000000) .求出最后还能看 ...
Chapter 2 Secondary Sorting：Detailed Example
2.1 Introduction MapReduce framework sorts input to reducers by key, but values of reducers are arbi ...
021.1 IO流——File类
########################################IO流: IO:用于处理设备上的数据的技术.设备:内存,硬盘,光盘流:系统资源,Windows系统本身就可 ...
css3实现鼠标经过li时动态画边框(jq库导航)
<!doctype html> <html> <head> <meta charset="utf-8" /> <meta na ...
gluoncv 下载预训练模型速度太慢
export MXNET_GLUON_REPO=https://apache-mxnet.s3.cn-north-1.amazonaws.com.cn https://discuss.gluon.ai ...

Hadoop源码学习笔记之NameNode启动场景流程三：FSNamesystem初始化源码剖析

Hadoop源码学习笔记之NameNode启动场景流程三：FSNamesystem初始化源码剖析的更多相关文章

随机推荐

热门专题