NameNode&Secondary NameNode 工作机制

NameNode:

	1.启动时，加载编辑日志和镜像文件到内存

	2.当客户端对元数据进行增删改，请求NameNode

	3.NameNode记录操作日志，更新滚动日志

	4.日志记录完成，在NameNode内存中对元数据进行操作

	edits.001 操作日志

	edits.002

	edits.inprogress 正在进行的操作日志

	fsimage	镜像文件

SecondaryNameNode:（其主要作用就是：合并edit和fsimage）

	0.检查点（checkpoint）触发。条件是：

		a.定时时间到（默认一个小时）

		b.操作日志中的数据满了（100w次操作）

	1.请求NameNode是否需要CheckPoint，直接带回 NameNode是否检查结果

	2.执行CheckPoint请求

	3.滚动正在写的操作日志，生成最新的一个操作日志

	4.将操作日志和之前旧的镜像fsimage文件拷贝到SecondaryNameNode

	5.在SecondaryNameNode内存中合并日志文件和fsimage文件

	6.生成新的fsimage.chkpoint

	7.将fsimage.chkpoint拷贝到NameNode中

	8.重命名fsimage.chkpoint为fsimage

日志文件

目录结构：

$HADOOP_HOME/data/tmp/dfs/name/current

$HADOOP_DATA_HOME/tmp/dfs/name/current

edits_0000000000000000000

fsimage_0000000000000000000.md5

seen_txid

VERSION

1.fsimage:

	HDFS 文件系统元数据的一个永久性的检查点，其中包含 HDFS文件系统的所有目录和文件 idnode 的序列化信息

2.edits:

	存放 HDFS 文件系统的所有更新操作的路径，文件系统客户端执行的所有写操作首先会被记录到 edits 文件中。

3.seen_txid:

	文件保存的是一个数字，就是最后一个 edits_的数字

	每次 Namenode 启动的时候都会将 fsimage 文件读入内存，

	并从 00001 开始到 seen_txid 中记录的数字依次执行每个 edits 里面的更新操作，

	保证内存中的元数据信息是最新的、同步的，可以看成 Namenode 启动的时候就将 fsimage 和 edits 文件进行了合并。

查看fsimage文件和edits文件

oiv 查看 fsimage 文件

	hdfs oiv -p 文件类型 -i 镜像文件 -o 转换后文件输出路径

	hdfs oiv -p XML -i fsimage_0000000000000000025 -o  /opt/module/hadoop-2.7.2/fsimage.xml

oev 查看 edits 文件

	hdfs oev -p 文件类型 -i 编辑日志 -o 转换后文件输出路径

	hdfs  oev  -p  XML  -i edits_0000000000000000012-0000000000000000013 -o /opt/module/hadoop-2.7.2/edits.xml

chkpoint 检查时间参数设置

hdfs-default.xml

<!-- 默认：SecondaryNameNode 每隔一小时执行一次 -->

	<property>

		<name>dfs.namenode.checkpoint.period</name>

		<value>3600</value>

	</property>

<!-- 一分钟检查一次操作次数，当操作次数达到 1 百万时，SecondaryNameNode 执行一次。 -->

	<property>

		<name>dfs.namenode.checkpoint.txns</name>

		<value>1000000</value>

		<description>操作动作次数</description>

	</property>

	<property>

		<name>dfs.namenode.checkpoint.check.period</name>

		<value>60</value>

		<description> 1 分钟检查一次操作次数</description>

	</property>

NameNode多目录配置

NameNode 的本地目录可以配置成多个，且每个目录存放内容相同，增加了可靠性。

配置步骤：

（1）在 hdfs-site.xml 文件中增加如下内容

	<property>

		<name>dfs.namenode.name.dir</name>

		<value>file:///${hadoop.tmp.dir}/dfs/name1,file:///${hadoop.tmp.dir}/dfs/name2</value>

	</property>

（2）停止集群，删除 data 和 logs 中所有数据

	$ rm -rf data/ logs/

（3）格式化集群并启动。

	$ bin/hdfs namenode –format

	$ sbin/start-dfs.sh

NameNode&Secondary NameNode 工作机制的更多相关文章

NameNode && Secondary NameNode工作机制
NameNode && Secondary NameNode工作机制 1)工作流程 2) fsimage和edits NameNode是HDFS的大脑,它维护着整个文件系统的目录树, ...
hadoop及NameNode和SecondaryNameNode工作机制
hadoop及NameNode和SecondaryNameNode工作机制 1.hadoop组成 Common MapReduce Yarn HDFS (1)HDFS namenode:存放目录,最重 ...
Hadoop（五）—— HDFS NameNode、DataNode工作机制
一.NN与2NN工作机制 NameNode(NN) 1.当HDFS启动时,会加载日志(edits)和镜像文件(fsImage)到内存中. 2-4.当元数据的增删改查请求进来时,NameNode会先将操 ...
NameNode和SecondaryNameNode的工作机制
NameNode&Secondary NameNode 工作机制 NameNode: 1.启动时,加载编辑日志和镜像文件到内存 2.当客户端对元数据进行增删改,请求NameNode 3.Nam ...
HDFS中NameNode工作机制
引言 NameNode: 存储元数据管理整个HDFS集群 DataNode: 存储数据的block SecondaryNameNode: 辅助HDFS完成一些事情 NameNode和Secondar ...
NameNode和SecondaryNameNode工作原理剖析
NameNode和SecondaryNameNode工作原理剖析作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.NameNode中的元数据是存储在那里的? 1>.首先,我 ...
Secondary Namenode - What it really do?
原文链接:http://blog.madhukaraphatak.com/secondary-namenode---what-it-really-do/ Secondary Namenode is o ...
HDFS中NameNode和Secondary NameNode工作机制
NameNode工作机制 0)启动概述 Namenode启动时,首先将映像文件(fsimage)载入内存,并执行编辑日志(edits)中的各项操作.一旦在内存中成功建立文件系统元数据的映像,则创建一个 ...
Hadoop的namenode的管理机制，工作机制和datanode的工作原理
HDFS前言: 1) 设计思想分而治之:将大文件.大批量文件,分布式存放在大量服务器上,以便于采取分而治之的方式对海量数据进行运算分析: 2)在大数据系统中作用: 为各类分布式运算框架(如:mapr ...

随机推荐

C语言：编译具体过程及隐藏
对于平常应用程序的开发,很少有人会关注编译和链接的过程,因为我们使用的工具一般都是流行的集成开发环境(IDE),比如 Visual Studio.Dev C++.C-Free 等.这些功能强大的 ID ...
深入理解JavaScript中的继承
1前言继承是JavaScript中的重要概念,可以说要学好JavaScript,必须搞清楚JavaScript中的继承.我最开始是通过看视频听培训班的老师讲解的JavaScript中的继承,当时看的 ...
怎么实现系统调用wait和exit
例程 #include <unistd.h> #include <stdlib.h> #include <stdio.h> #include <sys/wai ...
Scanner的基本语法及用法
一.Scanner对象基本语法中并没有实现程序和人的交互,但是Java给我们提供了一个这样的工具类,我们可以获取用户的输入.java.util.Scanner是Java5的新特征,我们可以通过Sca ...
zookeeper与eureka比较
一个分布式系统不可能同时满足C(一致性).A(可用性)和P(分区容错性) zookeeper确保cp 当向注册中心查询服务列表时,我们可以容忍注册中心返回的是几分钟以前的注册信息,但不能接受服务直接d ...
[考试总结]noip模拟21
中位数要排序!!!!!! 中位数要排序!!!!!! 中位数要排序!!!!!! 中位数要排序!!!!!! 中位数要排序!!!!!! 分差不加绝对值!!!! 分差不加绝对值!!!! 分差不加绝对值!!!! ...
Jmeter 学习笔记 1 - Logic Controller -组织执行场景
using this website to practice performance testing: http://advantageonlineshopping.com/#/ Jemeter ho ...
使用javah 给.class类编译jni_helloworld.h文件头
第一步,在idea中,编写java文件,并且编译 package jni; public class HelloWorld { static { System.loadLibrary("He ...
anyRTC SDK 5月迭代：优化自定义加密功能，让通信更安全
anyRTC SDK 5月上新,新增多种加密类型,让实时音视频通信更安全:新增移动端推流支持1080P分辨率的支持:此外还对事件上报.日志详情.数据统计.网络传输等多项功能进行了优化改进. 以下为更新 ...
SpringBoot 默认json解析器详解和字段序列化自定义
前言在我们开发项目API接口的时候,一些没有数据的字段会默认返回NULL,数字类型也会是NULL,这个时候前端希望字符串能够统一返回空字符,数字默认返回0,那我们就需要自定义json序列化处理 Sp ...

NameNode&Secondary NameNode 工作机制

NameNode&Secondary NameNode 工作机制

日志文件

目录结构：

查看fsimage文件和edits文件

chkpoint 检查 时间 参数 设置

NameNode多目录配置

NameNode&Secondary NameNode 工作机制的更多相关文章

随机推荐

热门专题

chkpoint 检查时间参数设置