hadoop2相对hadoop1有非常重大的改进

hadoop2相对hadoop1有非常重大的改进。

下面看一下在HDFS和MapReduce方面的改进：

HDFS Federation（HDFS联邦）
federation-background[1]

HDFS有两个主要层：

Namespace 由目录、文件和块组成；支持所有命名空间对文件和目录的操作。

Block Storage Service 由Block Management和Storage组成。

Block Management 提供dataNode集群成员关系，注册信息和周期性的心跳；处理块报告，维护块位置；支持块相关的操作，如创建、删除、修改等；管理副本数量、位置，删除多余副本；

Storag是dataNode提供的。

之前的HDFS架构只允许存在一个namespace。一个Namenode管理这个namespace。HDFS联邦通过增加多个namenode/namespace来解决这个先前架构的限制。

HDFS联邦使用多个独立的NameNode/Namespace。NameNode是联邦的，意味着他们是独立的，不会要求相互协作。DataNode是存储block的。每个DataNode都在集群中的所有NameNode注册。DataNode发送周期性的心跳和block报告，并且处理NameNode发回的命令。

federation[www.hjha178.com1]

一个block pool 是块的集合，这些块属于一个单一的namespace。Datanode存储着集群中所有block pool中的块。block pool的管理相互之间是独立的。这意味着一个namespace可以独立的生成块ID，不需要与其他namespace协调。一个Namenode失败不会导致Datanode的失败，这些Datanode还可以服务其他Namenode。

一个Namespace和他的block pool一起称作namespace volume。这是一个自包含单元。当一个namenode/namespace删除后，对应的block pool也会被删除。当集群升级时，每个namespace volume也会升级。

ClusterID是用来标示集群中所有节点的。当Namenode格式化时，这个id会自动产生。

多namenode/namespace的好处：

HDFS集群支持存储的水平扩展，但是namespace不能。对于大集群部署或者大量小文件存储时，使用多namespace会更好。
之前的设计中，文件系统操作效率受制于单个的namenode。现在，多个namenode提高了文件读写操作效率。
一个namenode在多用户环境中没有隔离性。使用多namespace，不同的应用或者用户可以隔离在不同的namespace中。
联邦配置是向后兼容的，之前架构下的应用不经修改的就可以工作。

联邦中有NameServiceID。匹配的namenode、secondary、backup、checkpointer节点，都有相同的NameServiceID.

YARN
新的架构在hadoop-0.23引入的，把JobTracker两个主要的功能分为Resource Management（RM,资源管理）和job life-cycle management（作业生命周期管理），每个都是独立的组件。

新的ResourceManager管理着所有计算机资源对应用的分配工作。每个应用都会对应一个ApplicationMaster(www.feihuanyule.com AM)。

一个应用或者是原来的一个普通job，或者是这些job的DAG。

Resource www.douniu178.com Manager和每个节点上的NodeManager构成了计算层。其中，NodeManager会管理所在节点上的用户进程。

每个应用对应的ApplicationManager负责执行和监控task。

yarn_architecture[1www.ccyl178.com/]

RM有两个组件：Schuduler和ApplicationManager。

Scheduler负责给各种应用分配资源，不会监控或者跟踪应用状态。它也不保证应用失败或者硬件失败后重启任务。当前版本的调度器，只根据内存分配资源给应用。调度器是可插拔的。

每个节点都有一个NodeManager，负责管理本节点资源的使用情况，如cpu、内存、磁盘、网络等，并把这些信息报告给ResourceManager/Scheduler.

ApplicationManager负责管理资源容器。

hadoop2相对hadoop1有非常重大的改进的更多相关文章

hadoop2对比hadoop1
hadoop2对比hadoop1 1.体系结构 HDFS+MapReduce,共同点都是分布式的,主从关系结构. HDFS=一个NameNode+多个DataNode, NameNode含有我们用户存 ...
Hadoop2 和 Hadoop1 区别
Hadoop2 和 Hadoop1 区别 Namenode NameNode其实是Hadoop的一个目录服务,它包含着整个集群存储的文件的元数据. 早期发行的Hadoop1版本将所有HDFS目录和文件 ...
hadoop2.0安装和配置
hadoop2与hadoop1的配置有些许不同,最主要的是hadoop1里的master变成了yarn 这篇文直接从hadoop的配置开始,因为系统环境和jdk和hadoop1都是一样的. hadoo ...
Hadoop2的HA安装(high availability)：nfs+zookeeper
前面介绍过hadoop的简单安装和FA安装,在这里将介绍几种hadoop2中HA(高可用性)安装,HA技术使hadoop不再存在单点namenode的故障. 先来第一种:nfs+zookeeper H ...
Hadoop2的FN安装(federated namespace)
尝试了简单的安装hadoop2后,我们再来尝试一下hdfs的一项新功能:FN.这项技术可以解决namenode容量不足的问题.它采用多个namenode来共享datanode的方式,每个namenod ...
NUTCH2.3 hadoop2.7.1 hbase1.0.1.1 solr5.2.1部署(三）
Precondition: hadoop 2.7.1 hbase 0.98.13 solr 5.2.1 / Apache Solr 4.8.1 http://archive.apache.org ...
Spark大数据针对性问题。
1.海量日志数据,提取出某日访问百度次数最多的那个IP. 解决方案:首先是将这一天,并且是访问百度的日志中的IP取出来,逐个写入到一个大文件中.注意到IP是32位的,最多有个2^32个IP.同样可以采 ...
Docker+Hadoop+Hive+Presto 使用Docker部署Hadoop环境和Presto
Background 一. 什么是Presto Presto通过使用分布式查询,可以快速高效的完成海量数据的查询.如果你需要处理TB或者PB级别的数据,那么你可能更希望借助于Hadoop和HDFS来完 ...
Spark学习（一） -- Spark安装及简介
标签(空格分隔): Spark 学习中的知识点:函数式编程.泛型编程.面向对象.并行编程. 任何工具的产生都会涉及这几个问题: 现实问题是什么? 理论模型的提出. 工程实现. 思考: 数据规模达到一台 ...

随机推荐

带您详细解读分布式文件系统HDFS
一.HDFS的由来: 本地系统:一个节点作为系统,以前数据是存放在本地文件系统上的,但本地文件系统存在两个问题:1.本地节点存储容量不够大:2.本地节点会坏,数据不够安全.这时,人们开始利用闲置的计算 ...
Vivado中xilinx_courdic IP核(求exp指数函数)使用
由于Verilog/Vhdl没有计算exp指数函数的库函数,所以在开发过程中可利用cordic IP核做exp函数即e^x值: 但前提要保证输入范围在(-pi/4—pi/4) 在cordic核中e^x ...
Oracle-归档日志详解（运行模式、分类）
一.Oracle日志分类分三大类: Alert log files--警报日志,Trace files--跟踪日志(用户和进程)和 redo log 重做日志(记录数据库的更改 ...
oracle移动数据/修改数据文件路径
参考:http://wwyz998.blog.163.com/blog/static/321867852011117111832334/ oracle移动数据文件 1.连接到数据库 [oracle@l ...
angular-ui-router速学
Demo1 初始化 <html ng-app="app"> <head> <style>.active { color: red; font-w ...
C# Language Specification 5.0 （翻译）第三章基本概念
应用程序启动拥有进入点(entry point)的程序集称应用程序(application).当运行一应用程序时,将创建一新应用程序域(application domain).同一个应用程序可在同一 ...
UWP简单示例（一）：快速合成音乐MV
说明本文发布时间较早,内容可能已过时.最新动态请关注 TypeScript 版本.(2019 年 3 月注) 在线演示: 音频可视化(TypeScript) 准备 IDE:Visual Studi ...
Flutter - ListView禁止用户上下滑动
ListView禁止用户上下滑动可以使用physics属性 physics: const NeverScrollableScrollPhysics()
杂谈---小故事小道理，面试中的小技巧（NO.2）
本篇是接着上一篇面试随笔的,上一次有猿友反应写的有些“扯淡”,LZ思来想去最大的原因可能是由于上一章写的全是一些大忌,既然是大忌,那么在现实当中发生的概率还是相对较小的,大部分人还是很少在面试中犯如此 ...
软件测试为何我会首选Python
对于软件测试选择什么样的语言去学习,不同的人有不同的回答,为什么我会首选Python呢?这就要从Python的特点与适应领域说了. 一.Python的特点:优雅.明确.简单. 二.Python适合的领 ...

hadoop2相对hadoop1有非常重大的改进

hadoop2相对hadoop1有非常重大的改进的更多相关文章

随机推荐

热门专题