04 namenode和datanode

namenode元数据管理

1、什么是元数据？

hdfs的目录结构及每一个文件的块信息（块的id，块的副本数量，块的存放位置<datanode>）

2、元数据由谁负责管理？

namenode

3、namenode把元数据记录在哪里？

namenode的实时的完整的元数据存储在内存中；

namenode还会在磁盘中（dfs.namenode.name.dir）存储内存元数据在某个时间点上的镜像文件；

namenode会把引起元数据变化的客户端操作记录在edits日志文件中；

namenode主要功能模块

1.namespace管理，即fileName与block序列的一个关系映射 
2.Block管理，即解决block与dataNode的关系映射问题

3.提供IPC(InterProcess Communication 跨进程通信)服务，解决nameNode与dataNode之间的数据通信，比如 dataNode的Block Report

fileName与block序列的映射关系是保存在fsimage文件中并写入到本地磁盘进行持久化的，block 与dataNode的映射关系是依靠dataNode通过Block Report主动上报方式来获取的，
nameNode大 部分时间都是在被动的接收dataNode/SecondaryNameNode/Client的RPC请求服务。 当editlog达到一定的大小（bytes，由fs.checkpoint.size参数定义）或从上次
保存过后一定时间段 过后（sec，由fs.checkpoint.period参数定义），会触发fsimage文件和editlog文件的合并操作，这个操作由secondaryNameNode负责。

Fsimage是一个二进制文件，其大致结构如下图：

1. 首先是一个image head，其中包含：

a) imgVersion(int)：当前image的版本信息

b) namespaceID(int)：命名空间ID，唯一的

c) numFiles(long)：整个文件系统中包含有多少文件和目录

d) genStamp(long)：生成该image时的时间戳信息。 

2. 接下来便是对每个文件或目录的源数据信息，如果是目录，则包含以下信息：

a) path(String)：该目录的路径，如”/user/build/buildindex”

b) replications(short)：副本数（目录虽然没有副本，但这里记录的目录副本数也为3）

c) mtime(long)：该目录的最后一次修改时间的时间戳信息

d) atime(long)：该目录的最后一次访问时间的时间戳信息

e) blocksize(long)：目录的blocksize都为0

f) numBlocks(int)：实际有多少个block块，目录的该值都为1，表示该item为目录

g) nsQuota(long)：namespace Quota值即namespace的配额，若没加Quota限制则为1

h) dsQuota(long)：disk Quota值即硬盘配额，若没加限制则也为1

i) username(String)：该目录的所属用户名

j) group(String)：该目录的所属用户组

k) permission(short)：该目录的permission信息即权限信息，如644，755等，有一个short来记录。 

3. 若从fsimage中读到的item是一个文件，则还会额外包含如下信息：

a) blockid(long)：属于该文件的block的blockid，

b) numBytes(long)：该block的字节大小

c) genStamp(long)：该block的时间戳

当该文件对应的numBlocks数不为1，而是大于1时，表示该文件对应有多个block信息，此时紧接在该fsimage之后的就会有多个blockid，numBytes和genStamp信息。根据以上信息我们可以
了解到，fsimage里没有持久化保存block与dataNode的映射关系，block与dataNode的映射关系是依赖dataNode主动上报给nameNode的。当dataNode启动时，dataNode会扫描其本地硬
盘，将保存在当前dataNode上的block信息通过RPC请求主动上报给nameNode，nameNode收到请求数据后会把block与dataNode的映射关系数据保存在内存中。dataNode向nameNode汇报
block信息的过程叫做blockReport。而block与dataNode的映射关系是由nameNode构建的一个blockMap数据结构中，blockMap数据结构如下图：

BlockMap其实就是Block与BlockInfo的一个映射表，key就是block对象，value就是BlockInfo，BlockInfo继承自Block。这里的InodeFile即表示这个block属于哪个文件的，
DN1,DN2,DN3即表示这个block在哪几个dataNode上有备份。(DN即dataNode的缩写)。fsimage加载完毕后，BlocksMap中仅缺少每个block对应到其所属的datanodes list的映射
关系信息，而这部分信息就是dataNod启动时主动上报给nameNode的，nameNode收到这部分信息后，就完成了对BlockMap的构建。

这里的prev,next表示的是当前这个block在当前nameNode上的前一个blockInfo和后一个blockInfo信息，即采用链表结构来存储一个dataNode的所有block信息的，而不是简单
的block[]数组，这样做的主要目的是为了节省内存。而且由于需要查询某个dataNode上有哪些block，这个需求一般不大。

block经常会因为各种原因(磁盘坏掉等)出现读写错误，所以nameNode为维护标记block的状态为Corrupt(即损坏的意思)，当dataNode发送心跳包过来的时候，
nameCode会返回dataNode一个信号，告诉该dataNode把存在于其dataNode上的损坏的block删除掉。

每个block默认都会有3个副本(即3个备份，分别分部在多个dataNode上)，但集群中随时都有可能会有硬盘损坏，datanode下线等问题，这时block的副本数会下降，为了提高
block的期望副本数（通常为3），dataNode会对该block进行拷贝，不一定是拷贝到当前dataNode上,也有可能会拷贝到其他dataNode上。

secondarynamenode

secondarynamenode会定期从namenode上下载fsimage镜像和新生成的edits日志，然后加载fsimage镜像到内存中，然后顺序解析edits文件，对内存中的元数据对象进行修改（整合）

整合完成后，将内存元数据序列化成一个新的fsimage，并将这个fsimage镜像文件上传给namenode上述过程叫做：checkpoint操作

提示：secondary namenode每次做checkpoint操作时，都需要从namenode上下载上次的fsimage镜像文件吗？

第一次checkpoint需要下载，以后就不用下载了，因为自己的机器上就已经有了。

指定那台电脑是secondary namenode

vi core-site.xml 添加如下内容

<property>

  <name>dfs.namenode.secondary.http-address</name>

  <value>hdp-02:50090</value>

</property>

secondarynamenode保存元数据文件的目录配置

改成自己想要的路径即可：/root/dfs/namesecondary

<property>

  <name>dfs.namenode.checkpoint.dir</name>

  <value>file://${hadoop.tmp.dir}/dfs/namesecondary</value>

</property>

04 namenode和datanode的更多相关文章

HDFS体系结构(NameNode、DataNode详解)
hadoop项目地址:http://hadoop.apache.org/ NameNode.DataNode详解 (一)分布式文件系统概述数据量越来越多,在一个操作系统管辖的范围存不下了,那么就分配 ...
hadoop中NameNode、DataNode和Client三者之间协作关系及通信方式介绍
<ignore_js_op> 1)NameNode.DataNode和Client NameNode可以看作是分布式文件系统中的管理者,主要负责管理文件系统的命名空间.集群 ...
namenode和datanode 的namespaceID导致的问题
namenode和datanode 的namespaceID导致,datanode无法正常的启动,经过查资料,解决的办法就是更改datanode的VERSION之中的namespace namenod ...
NameNode与DataNode的工作原理剖析
NameNode与DataNode的工作原理剖析作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.HDFS写数据流程 >.客户端通过Distributed FileSyst ...
Hadoop介绍-4.Hadoop中NameNode、DataNode、Secondary、NameNode、JobTracker TaskTracker
Hadoop是一个能够对大量数据进行分布式处理的软体框架,实现了Google的MapReduce编程模型和框架,能够把应用程式分割成许多的小的工作单元,并把这些单元放到任何集群节点上执行.在MapR ...
namenode和datanode机制
转自:https://www.cnblogs.com/DarrenChan/p/6416043.html?utm_source=itdadao&utm_medium=referral 首先我们 ...
初识HDFS（10分钟了解HDFS、NameNode和DataNode）
概览首先我们来认识一下HDFS, HDFS(Hadoop Distributed File System )Hadoop分布式文件系统.它其实是将一个大文件分成若干块保存在不同服务器的多个节点中.通 ...
什么是NameNode和DataNode？他们是如何协同工作的？
[学习笔记] 什么是NameNode和DataNode?他们是如何协同工作的? 马克-to-win @ 马克java社区:一个HDFS集群包含一个NameNode和若干的DataNode(start- ...
namenode和datanode的高可用性和故障处理
一.Hadoop单点故障问题如何解决 Hadoop 1.0内核主要由两个分支组成:MapReduce和HDFS,众所周知,这两个系统的设计缺陷是单点故障,即MR的JobTracker和HDFS的Nam ...

随机推荐

icloud/onenote/onedrive/microoutlook/百度云账号都是怎么回事（未完成）
在用一些跨机器跨平台软件的时候,一旦换了电脑或者手机,我经常出现蒙的状态,不知道怎么同步或者使用了,在这里总结一下. 一.icloud账号当我们买iphone或者macbook的时候,一开机它会让你 ...
VDMA搭建视频通路总结
全局观查,对整个工程的搭建的关键是要保证PL部分搭建成功,PS部分搭建成功,而且两者配合的很好. 我理解的PL部分涉及到模块的组合以及模块或者IP之间的逻辑的整理,PL部分困扰我比较久的是自动生成的w ...
Transformer详解：各个特征维度分析推导
谷歌在文章<Attention is all you need>中提出的transformer模型.如图主要架构:同样为encoder-decoder模式,左边部分是encoder,右边部 ...
algorithm-question
主键都相同,选择排序和插入排序谁快选择排序:比较N*(N-1)/2,交换0:插入排序:比较N-1,交换0:插入排序更大专栏 algorithm-question快逆序数组,插入排序与选择排序 ...
转：B树和B+树的插入、删除图文详解
如需转载,请注明出处 http://www.cnblogs.com/nullzx/ 1. B树 1. B树的定义 B树也称B-树,它是一颗多路平衡查找树.我们描述一颗B树时需要指定它的阶数,阶数表示了 ...
python 添加字符串的七种方法
#使用{}的方法 s1 = 'Hello {}! My name is {}.'.format('World', 'Python猫') print(s1) s2 = 'Hello {0} My nam ...
annoy超平面多维近似向量查找工具
需求:有800万的中文词向量,要查询其中任意一个词向量对应的k个与其最邻近的向量.通常情况下如果向量集比较小的话,几十万个向量(几个G这种),我们都可以用gensim的word2vec来查找,但是88 ...
python中字符串操作--截取，查找，替换
python中,对字符串的操作是最常见的,python对字符串操作有自己特殊的处理方式. 字符串的截取 python中对于字符串的索引是比较特别的,来感受一下: s = '123456789' #截取 ...
SCSS 与 Sass 异同
SCSS 是 Sass 3 引入新的语法,其语法完全兼容 CSS3,并且继承了 Sass 的强大功能.也就是说,任何标准的 CSS3 样式表都是具有相同语义的有效的 SCSS 文件.另外,SCSS 还 ...
从iPhone下滑看科技转型之困
看科技转型之困" title="从iPhone下滑看科技转型之困"> 毫无疑问,苹果正在面临一次关键转型.最近苹果股价较高点134.54美元下跌21%以上的实事, ...

04 namenode和datanode

namenode元数据管理

namenode主要功能模块

secondarynamenode

04 namenode和datanode的更多相关文章

随机推荐

热门专题