Hadoop2.0新特性-持续追加【干货】
1、NAME NODE HA
2、NAME NODE Federation
3、HDFS 快照(目录快照)
4、HDFS 缓存
5、HDFS ACL
6、异构层级存储结构
-------------------------------------------------------------------------------------------------------
1、NameNode HA:
NameNode分为主备节点,一个为ActiveNameNode,一个为StandbyNameNode。
ActiveNameNode作用:
1、Master主节点,只有一个;
2、管理HDFS 命名空间;
3、存储数据块与数据节点的映射关系,文件与数据块的映射关系;
4、配置副本策略;
5、处理客户端请求;
StandbyNameNode作用:
1、NameNode热备;
2、定期合并元数据信息,包括(FSImage和FSEdits)。并且推送给ActiveNameNode;
3、当ActiveNameNode故障的时候,快速切换称为新的ActiveNameNode;
2、NameNode Federation:
多个NameNode配合工作,每个NameNode分管不同的HDFS目录,共享所有的DataNode数据节点。
3、HDFS 快照:
主要为防止用户误删数据,和数据备份的作用
快照的对象为HDFS目录,前提是该目录是可以允许设置快照的(SnapShotable)
启用快照:bin/hdfs dfsadmin allowsnapshot <path>
创建快照:bin/hdfs dfs -CreateSnapshot <path> [snapshotName]
删除快照:bin/hdfs dfs -DeleteSnapshot <path> [snapshotName]
快照特性:只读,不可修改
4、HDFS 缓存:
目的:让高频访问的数据进行长期缓存。
特性:1、仅支持目录或文件缓存,不支持Block级别
2、不支持自动缓存
3、不会递归缓存目录下子目录的所有文件
4、可以设置缓存时间
5、独立管理内存,还没有与YARN的资源管理进行集成,可能会有资源分配的冲突·
5、HDFS ACL:
目标:提高HDFS目录权限管理的安全灵活性,原权限管理类似Linux操作系统模式的用户、用户组、其他组的目录权限管理。
配置:在namenode节点上配置,dfs.namenode.acls.enabled:true
例子:
hdfs dfs -setfacl -m user:tom:rw - /lab/user
hdfs dfs -setfacl -m user:lucy:rw - /lab/user
hdfs dfs -setfacl -m group:team2:r - /lab/user
hdfs dfs -setfacl -m group:team3:r - /lab/user
6、HDFS 异构层级存储结构
可为不同的数据目录,配置不同的存储介质类别,如磁盘、SSD 、RAM,以满足Hadoop集群中不同计算框架,不同计算任务,不同性能要求的数据存储需求。
配置:
<property>
<name>dfs.datanode.data.dir</name>
<value>[disk]/dir1,[disk]/dir2,[ssd]/dir3,[ssd]/dir4</value>
</property>
HDFS 提供APi控制目录文件,写到什么介质,且能限制每个用户对每种介质的可使用份额。
Hadoop2.0新特性-持续追加【干货】的更多相关文章
- Visual Studio 2015速递(1)——C#6.0新特性怎么用
系列文章 Visual Studio 2015速递(1)——C#6.0新特性怎么用 Visual Studio 2015速递(2)——提升效率和质量(VS2015核心竞争力) Visual Studi ...
- Hadoop3.0新特性
1. Hadoop3.0简介 Hadoop 2.0是基于JDK 1.7开发的,而JDK 1.7在2015年4月已停止更新,这直接迫使Hadoop社区基于JDK1.8重新发布一个新的Hadoop版本,而 ...
- HBase2.0新特性解析
作者 | 个推大数据运维工程师 行者 升级背景 个推作为专业的数据智能服务商,在业务开展过程中存在海量的数据存储与查询的需求,为此个推选用了高可靠.高性能.面向列.可伸缩的分布式数据存储系统--HBa ...
- 跨时代的MySQL8.0新特性解读
目录 MySQL发展历程 MySQL8.0新特性 秒级加列 性能提升 文档数据库 SQL增强 共用表表达式(CTEs) 不可见索引(Invisible Indexes) 降序索引(Descending ...
- 浅谈Tuple之C#4.0新特性那些事儿你还记得多少?
来源:微信公众号CodeL 今天给大家分享的内容基于前几天收到的一条留言信息,留言内容是这样的: 看了这位网友的留言相信有不少刚接触开发的童鞋们也会有同样的困惑,除了用新建类作为桥梁之外还有什么好的办 ...
- Java基础和JDK5.0新特性
Java基础 JDK5.0新特性 PS: JDK:Java Development KitsJRE: Java Runtime EvironmentJRE = JVM + ClassLibary JV ...
- atitit.Servlet2.5 Servlet 3.0 新特性 jsp2.0 jsp2.1 jsp2.2新特性
atitit.Servlet2.5 Servlet 3.0 新特性 jsp2.0 jsp2.1 jsp2.2新特性 1.1. Servlet和JSP规范版本对应关系:1 1.2. Servlet2 ...
- 背水一战 Windows 10 (1) - C# 6.0 新特性
[源码下载] 背水一战 Windows 10 (1) - C# 6.0 新特性 作者:webabcd 介绍背水一战 Windows 10 之 C# 6.0 新特性 介绍 C# 6.0 的新特性 示例1 ...
- C# 7.0 新特性2: 本地方法
本文参考Roslyn项目中的Issue:#259. 1. C# 7.0 新特性1: 基于Tuple的“多”返回值方法 2. C# 7.0 新特性2: 本地方法 3. C# 7.0 新特性3: 模式匹配 ...
随机推荐
- BCB常用文件与字符串函数
VCL库函数简介 一.BORLAND C++ BUILDER VCL的内存管理函数 1. AllocMem 在队中分配指定字节的内存块,并将分配的每一个字节初始化为 0.函数原型如下: void * ...
- button 事件属性
- NPOI读取Excel,导入数据到Excel练习01
NPOI 2.2.0.0,初级读取导入Excel 1.读取Excel,将数据绑定到dgv上 private void button1_Click(object sender, EventArgs e) ...
- Centos7安装Xmind
1.首先,下载对应版本的deb包,32bit系统下载32bit软件包,64bit系统下载64bit软件包 2.解压deb包,得到data.tar.gz 和control.tar.gz 两个归档文件 3 ...
- 在CentOS 6.X 上面安装 Python 2.7.X
在CentOS 6.X 上面安装 Python 2.7.X CentOS 6.X 自带的python版本是 2.6 , 由于工作需要,很多时候需要2.7版本.所以需要进行版本升级.由于一些系统工具和服 ...
- Windows下tuxedo配置
setenv.cmd rem (c) 2003 BEA Systems, Inc. All Rights Reserved. rem Copyright (c) 2000 BEA Systems, I ...
- Ogre内存池的使用和说明
大家可能会遇到一些Ogre中的内存分配的方面问题,我对这个总结了一下内存分配的方面资料. Ogre在1.7版本后,统一了内存分配策略,提供了内存是否泄漏的跟踪和内存池等比较方便开发的一些策略,目前提供 ...
- HDU 1672 Cuckoo Hashing
Cuckoo Hashing Description One of the most fundamental data structure problems is the dictionary pro ...
- Java I/O 扩展
Java I/O 扩展 标签: Java基础 NIO Java 的NIO(新IO)和传统的IO有着相同的目的: 输入 输出 .但是NIO使用了不同的方式来处理IO,NIO利用内存映射文件(此处文件的含 ...
- UVa 10735 (混合图的欧拉回路) Euler Circuit
题意: 给出一个图,有的边是有向边,有的是无向边.试找出一条欧拉回路. 分析: 按照往常的思维,遇到混合图,我们一般会把无向边拆成两条方向相反的有向边. 但是在这里却行不通了,因为拆成两条有向边的话, ...