HDFS中的NameNode名节点—

HDFS缓冲区

Fsimage 文件映射，Edits文件操作记录。

与ES的缓冲区不同，ES是维护数据的变更，而HDFS缓冲区是用于名结点维护文件系统元数据（目录树）的机制。

在HDFS集群中，NameNode结点相较于DataNode数量较少，往往几个Namenode支撑着几百个DataNode的元数据和目录索引。当大量数据存入时，众多DataNode上同步进行的数据文件更新会在短时间内产生巨量的元数据（文件信息、块地址）。

想象一个这样的情况，1000台数据结点同时存入数据，但是只有一个名结点。1000GB的数据产生了10GB的元数据，数据节点很快处理完了1GB的平均数据量，但是名结点却要处理10GB的数据量，这时数据明明已经存入却不可用（因为不知道在哪）。

HDFS的FSimage缓冲机制，正是为了解决NameNode上元数据（目录）更新速度的问题，即NameNode直接在内存上更新元数据（内存更快），快速维护更新目录信息，并把数据的硬盘写入操作交由SecondaryNameNode完成（写入硬盘才能不丢失），这样便能保证目录的更新与数据存入相对同步完成。

具体过程：

HDFS启动时, 文件系统的目录树被加载到名节点内存，在Namenode上生成FSimages（元数据文件），此时的FSimages是真实的目录树。当发生数据操作的时候，数据请求经过处理后被分发到Datanode上进行存储，同时NameNode更新存储在内存中的FSimage，并且将数据操作相关信息保存到内存中的Edits文件。内存中的信息虽然快但是不稳定，如果宕机更新的目录树便会丢失，更改过的文件也就找不到了地址了，因此每隔一段时间需要元数据信息（目录）存储到磁盘。每过一段时间或者Fimage文件过大，NameNode会将二者发送给副名结点，副结点会完成二者的合并和检验，然后将新的FSimage推送到Namenode的硬盘上，同时更新Version文件，让NameNode使用新版的FSimage（旧版的也不会被删除）。只有当元数据被写入到硬盘后，存储的数据才是真正安全的存入了。

HDFS中的NameNode名节点——FSimage的更多相关文章

018 HDFS中，namenode与datanode的交互
1.解释 2.启动过程 namenode需要等待给他汇报块的情况,然后namenode会给datanode一个反馈. namenode在启动的时候有一个等待的过程. 3.如果有块损坏等待报告中,na ...
hadoop的hdfs中的namenode和datanode知识总结
一,NameNode: 1, Namenode是中心服务器,单一节点(简化系统的设计和实现),负责管理文件系统的名称空间(namespace)以及客户端对文件的访问. 2, 文件操作,Namenod ...
HDFS中NameNode管理元数据机制
NameNode职责响应客户端请求维护目录树管理元数据(查询,修改) HDFS元数据存储内存中有一份完整的元数据(特定数据结构) 磁盘有一个“准完整”的元数据的镜像文件当客户端对HDFS中的 ...
【Hadoop学习】HDFS中的集中化缓存管理
Hadoop版本:2.6.0 本文系从官方文档翻译而来,转载请尊重译者的工作,注明以下链接: http://www.cnblogs.com/zhangningbo/p/4146398.html 概述 ...
Sqoop1.99.7将MySQL数据导入到HDFS中
准备本示例将实现从MySQL数据库中将数据导入到HDFS中参考文档: http://sqoop.apache.org/docs/1.99.7/user/Sqoop5MinutesDemo.html ...
从 secondarynamenode 中恢复 namenode
1.修改 conf/core-site.xml,增加 Xml代码 <property> <name>fs.checkpoint.period</name> < ...
关于oracle的缓冲区机制与HDFS中的edit logs的某些关联性的思考
可能大家会问,oracle和HDFS属于不同场景的存储系统,它们之间为什么会有联系呢?确实,从技术本身来看,他们确实无关联,但利用“整体学习”的思想,跳出技术本身,可以发现Oracle的缓冲区和HDF ...
HDFS中的读写数据流
1.文件的读取在客户端执行读取操作时,客户端和HDFS交互过程以及NameNode和各DataNode之间的数据流是怎样的?下面将围绕图1进行具体讲解. 图 1 客户端从HDFS中读取数据 1)客户 ...
Hadoop HDFS 中的一些常用命令
转载自:hadoop HDFS常用文件操作命令命令基本格式: hadoop fs -cmd < args > 1.ls hadoop fs -ls / 列出hdfs文件系统根目录下的目录 ...

随机推荐

mapreduce编程练习（一）简单的练习 WordCount
入门训练:WordCount 问题描述:对一个或多个输入文件中的单词进行计数统计,比如一个文件的输入文件如下输出格式: 运行代码实例: package hadoopLearn; import jav ...
【繁星Code】如何在EF将实体注释写入数据库中
最近在项目中需要把各个字段的释义写到数据库中,该项目已经上线很长时间了,数据库中的字段没有上千也有上百个,要是一个项目一个项目打开然后再去找对应字段查看什么意思,估计要到明年过年了.由于项目中使用En ...
Codeforces Round #634 (Div. 3)
D题想复杂了,花了好多时间,感觉也没时间看F了,就来写个题解蹭蹭访问量把^_^ 传送门:1335 A. Candies and Two Sisters 题意:你要把n个糖果分给两个人,两个人的糖果数不 ...
Codeforces Round #633 div2 A~C
A. Filling Diamonds 题意:给你n个菱形方块,问能构成图示形状的有多少种题解:自己画几个不难发现答案是n 代码: 1 #include <iostream> 2 #in ...
HDU - 1789 dp
题意: 众所周知lyb根本不学习.但是期末到了,平时不写作业的他现在有很多作业要做. CUC的老师很严格,每个老师都会给他一个DDL(deadline). 如果lyb在DDL后交作业,老师就会扣他的分 ...
CodeCraft-20 (Div. 2) B. String Modification (字符串,规律)
题意:有一个长度为\(n\)的字符串,你可以选取一个值\(k(1\le k \le n)\),然后遍历字符串,每次将区间长度为\(k\)的字符串反转,求反转后字典序最小的字符串,并输出\(k\)的值. ...
python代理池的构建1——代理IP类的构建，以及配置文件、日志文件、requests请求头
一.整体结构二.代理IP类的构建(domain.py文件) ''' 实现_ init_ 方法, 负责初始化,包含如下字段: ip: 代理的IP地址 port:代理IP的端口号 protocol: 代 ...
ssh配置方面小实验②
4.禁止使用密码登录当我们学会了使用密钥对进行验证后,建议生产环境下将账户密码登录功能关掉配置文件:/etc/ssh/sshd_config选项: PasswordAuthentication no ...
Python+Appium实现自动抢微信红包
前言过年的时候总是少不了红包,不知从何时开始微信红包横空出世,对于网速和手速慢的人只能在一旁观望,做为python的学习者就是要运用编程解决生活和工作上的事情. 于是我用python解决我们的手速问 ...
MySQL 主从复制（上）
目录主从复制前提主从复制原理涉及的文件 & 线程 Master 主库 Slave 从库主从复制的搭建主库配置配置 /etc/my.cnf 建立专用复制用户查看 Binlog 信息 ...

HDFS中的NameNode名节点——FSimage

HDFS缓冲区

HDFS中的NameNode名节点——FSimage的更多相关文章

随机推荐

热门专题