Hadoop源代码点滴-文件系统HDFS

HDFS是Hadoop集群的文件系统，这是一种分布（distributed）、容错（fault tolerant）的文件系统
所谓分布，是说整个文件系统的内容并非集中存储在一台或几台“文件服务器上”，而是分散在集群的不同节点上
对于大数据文件系统，文件之所以应该是分布式的，不再仅仅是容量和容错的问题，还有计算的问题。
大数据处理有个原则，就是数据在哪里，计算就在哪里。
分布的计算必然要求分布的数据存储，最好就是每个机诶但都存储数据，每个节点也都承担计算。
按什么方式把整个文件系统的内容分布存储在集群中呢
1. 远程挂在（mount）：这只是目录（文件子系统）层面的分布
2. 粒度更细化一点，改成文件层面的分布：也就是说不是以目录为单位，而是以文件为单位的分布，并建立重要文件查名服务器
3. 粒度更细化，改成文件块层面的分布：在存储的时候把文件拆散，HDFS的分布，是“块”这个层次的分布.
HDFS文件块是虚拟的，默认64MB，128MB也是很常用的
集中的目录和查明服务，则不是告诉你这些文件在哪里，而是告诉你具体的块在哪里，然后你自己去访问
HDFS的查明服务都集中在一个节点上，成为nameNode；担负文件内容存储的节点则成为DataNode。
在DataNode上，不管是1MB、64MB、一个（HDFS的）块对于宿主主机而言就是一个文件，其块号就编码在文件名中。从一个DataNode中读出一个块，实际上是读出一个文件。而在NameNode中，则存储的是HDFS“文件系统”，实际上存储整个目录树，或称“namespace”的映像。可想而知，这个映像也是作为宿主系统的文件而存储的。
解决了怎么分布的问题，随之而来的是容错的问题。HDFS采用了“狡兔三窟”的策略，每个块都是一式几份。响应地，查明服务要提供的就不只是一个块在什么地方，而是这个块的几个副本分别在什么地方。这样，你就可以自己决定从哪个节点上读取这个块的副本，万一失败就换一个节点再去读取另一个副本。
为NameNode提供热备的节点，则称为“Standby NameNode“。ActiveNN和StandbyNN之间的有同步才能保持一致。然而如果每一次有一点改变时就得同步一次，系统的开销太大，所以HDFS采用一个变通的方法。（类似Oracle的archive log、ADG）
这个EditLog可以（但不是必须）既不是在NameNode节点上，也不是在Secondary NameNode节点上，而是在某个双方都能访问的第三方那里，而且一般要求这第三方具有更高的可靠性。比方说，如果集群中机器是普通的PC机，则EditLog就应该放在具有更可高、质量更好的服务器上。这样如果ActiveNN出了问题，StandbyNN出来接管，这是它手头的文件系统映像很可能是老的，已经远远落后于形势。而手头有着文件系统最新映像的原NameNode，则此时已经访问不到了。这时原StandbyNN就把EditLog中记录逐条”重演“一遍。
可想而知，这种同步也不一定非要到NameNode出问题时候才做，StandbyNN完全可以没过一段时间就做一下。
EditLog信息的接收者可以不止一家。
在Hadoop中，NameNode表现为一个独立的JVM进程。同样，SNN、DataNode也是这样的JVM。
NameNode

JvmPauseMonitor，看起其类名可知是用来监视JVM运行是否停滞。其实原理挺简单，这是一个线程，这个线程基本上老是睡眠，只是周期性的醒来一下，一醒来就从系统获取当时的实际时间，开刚才实际睡眠时间是否比自己指定要睡眠的时间长出很多，如果是，就说明本线程被调度运行的机会大大减少，系统已经太忙，因而就在运行日志中发出一条警告信息。
Format：就只是HDFS文件系统的格式化，实际上就是其目录系统的格式化，那就是在宿主文件系统中创建一套目录，用来存放HDFS的元数据文件。而且，一旦完成格式化，程序就terminate（），这个命令的意图其实并非启动NameNode，而仅仅是格式化。当然在完成格式化之前，NameNode是无法正常运行的。
为什么格式化要和NameNode放在一起呢，这是因为HDFS的格式化只需在NameNode上进行，也只应在NameNode上进行。
NameNode实际上并不需要知道具体的块在哪个数据节点的什么位置上，而只要知道哪些节点存储着哪些块，以及节点上还有多少容量可供使用。进一步，什么块在什么节点上这个信息其实不必固定记载在NameNode的文件系统映像中，而是可以在运行的时候让数据节点自行报告。在集群环境中，NameNode对于数据节点的控制不想单机对于磁盘那样严密，加之每个块都有多个副本保存在不同节点上，这样比把这些信息固定记载在NameNode上更合适，因为保不住哪个节点突然就离线了，过一会又回来了，甚至保不住哪个节点上的磁盘被拆装到了另一个节点上。
NameNode的作用，简单地说：是给定一个文件路名名，就告诉你这个文件有哪些块，以及每个块都有几个副本、分别存储在什么节点上。
这里有两个环节。1、从一个文件的路径名到它的块表；2、再从具体块号到其副本所在的数据节点。这两个环节性质是有区别的。
其中的第一个环节，说明每个具体的文件名包含了哪些块，即从文件名到块表的映射，就是HDFS的目录系统，也跟单机的目录系统相似，是必须持久存储的，要不然断电之后就什么也没有了。集群中只有NameNode才有这方面的信息，DataNode根本就不知道还有HDFS这一层目录和文件。
但是第二个环节，即从块号到存储地点的映射，就不一定了。当然也可以把这个映射持久存储在NameNode上，但是这样也是有问题的，因为NameNode对于数据节点其实没有很强的控制，比如说，可能NameNode记载表明某个数据节点上有某个块号的一个副本，但是那个副本实际上却因为某种原因而不存在了，例如因本地的某种不当操作被删掉了，于是两边就不一致了。在比方说，NameNode可能记载着某个副本所在节点的节点名和IP地址，但实际使用中个别节点的名称和IP地址却可能变了。所以把第二层映射持久存储下来可能是靠不住的。那么怎么办呢？HDFS采用的办法就是干脆就不持久存储，而让各数据节点定期向NameNode报告：我这里有你的这么一些块，你可以让大家需要的时候上我这来读取；而NameNode则在运行时动态汇集和维持第二层映射所需的信息。集群中数据节点定时向NameNode发送心跳（Heartbeat）报告，上面就打搭载着这样的信息。
所以，NameNode至少要经历一轮Heartbeat之后才能真正完成其初始化。

Hadoop源代码点滴-文件系统HDFS的更多相关文章

Hadoop源代码点滴-系统结构（HDFS+YARN）
Hadoop建立起HDFS和YARN两个字系统,前者是文件系统,管数据存储:后者是计算框架,管数据处理. 如果只有HDFS而没有YARN,那么Hadoop集群可以被用作容错哦的文件服务器,别的就没有什 ...
Hadoop源代码分析：HDFS读取和写入数据流控制(DataTransferThrottler类别)
DataTransferThrottler类别Datanode读取和写入数据时控制传输数据速率.这个类是线程安全的,它可以由多个线程共享. 用途是构建DataTransferThrottler对象,并 ...
Hadoop源代码点滴-基础概念
大数据特征:volume(数量).variety(多样性).velocity(产生的速度) 大数据特征:多.乱.快.杂数据的来源:业务数据.日志.管理文档(OCR).互联网.物联网.外购
Hadoop源代码点滴-自然常数e
数学里的 e 为什么叫做自然底数?是不是自然界里什么东西恰好是 e? https://www.zhihu.com/question/20296247
hadoop系列二：HDFS文件系统的命令及JAVA客户端API
转载请在页首明显处注明作者与出处一:说明此为大数据系列的一些博文,有空的话会陆续更新,包含大数据的一些内容,如hadoop,spark,storm,机器学习等. 当前使用的hadoop版本为2.6 ...
Hadoop 分布式文件系统 - HDFS
当数据集超过一个单独的物理计算机的存储能力时,便有必要将它分不到多个独立的计算机上.管理着跨计算机网络存储的文件系统称为分布式文件系统.Hadoop 的分布式文件系统称为 HDFS,它是为以流式数 ...
Hadoop分布式文件系统HDFS详解
Hadoop分布式文件系统即Hadoop Distributed FileSystem. 当数据集的大小超过一台独立的物理计算机的存储能力时,就有必要对它进行分区(Partition)并 ...
Hadoop分布式文件系统--HDFS结构分析
转自:http://blog.csdn.net/androidlushangderen/article/details/47377543 HDFS系列:http://blog.csdn.net/And ...
【转载】Hadoop分布式文件系统HDFS的工作原理详述
转载请注明来自36大数据(36dsj.com):36大数据 » Hadoop分布式文件系统HDFS的工作原理详述转注:读了这篇文章以后,觉得内容比较易懂,所以分享过来支持一下. Hadoop分布式文 ...

随机推荐

C++11——智能指针
1. 介绍一般一个程序在内存中可以大体划分为三部分——静态内存(局部的static对象.类static数据成员以及所有定义在函数或者类之外的变量).栈内存(保存和定义在函数或者类内部的变量)和动态内 ...
F#周报2019年第35期
新闻新增强的NuGet搜索 Windows Terminal预览版v0.4发布在Visual Studio的YouTube频道上获取更多的新内容 .NET团队是如何使用Azure Pipeline ...
javaScript 基础知识汇总（三）
1.循环:while 和 for while 循环 while(condition){ //代码循环体 } do ... while 循环 let i =0; do { //循环体 }while( ...
Java并发编程实战.笔记十一（非阻塞同步机制）
关于非阻塞算法CAS. 比较并交换CAS:CAS包含了3个操作数---需要读写的内存位置V,进行比较的值A和拟写入的新值B.当且仅当V的值等于A时,CAS才会通过原子的方式用新值B来更新V的值,否则不 ...
在IIS下部署PHP
没有.net ramework 4.0 的要先安装 dotNetFx40_Full_x86_x64.exe PHP压缩包推荐用5.6.29版 IIS下PHP压缩包下载地址:"http:// ...
2019nc#3
题号标题已通过代码题解/讨论通过率团队的状态 A Graph Games 点击查看进入讨论 18/292 未通过 B Crazy Binary String 点击查看 1107/3615 ...
SpringBoot项目创建及入门基础
一:快速构建springboot项目进入https://start.spring.io/,选择相应的springboot版本,包名,项目名,依赖图中选择web,利用tomcat服务器进行开发 sp ...
JOBDU 1108 堆栈的使用
之所以把这道题目贴出来的原因,是因为真的有几个地方要注意的题目1108:堆栈的使用时间限制:1 秒内存限制:32 兆特殊判题:否提交:10763 解决:3119 题目描述: 堆栈是一种基本的 ...
Quartz.Net使用教程
在项目的开发过程中,难免会遇见后需要后台处理的任务,例如定时发送邮件通知.后台处理耗时的数据处理等,这个时候你就需要Quartz.Net了. Quartz.Net是纯净的,它是一个.Net程序集,是非 ...
python读取大文件只能读取部分的问题
最近准备重新研究一下推荐系统的东西,用到的数据集是Audioscrobbler音乐数据集.我用python处理数据集中artist_data.txt这个文件的时候,先读取每一行然后进行处理: with ...

Hadoop源代码点滴-文件系统HDFS

Hadoop源代码点滴-文件系统HDFS的更多相关文章

随机推荐

热门专题