HBase、HDFS和MapReduce架构异同简解
HBase、HDFS和MapReduce架构异同
| .. | HBase(公司架构模型) | HDFS2.0(公司架构模型) | MR2.0(公司架构模型) | MR1.0(公司架构模型) |
|---|---|---|---|---|
| 中央 | HMaster | NameNode(NN) | ResourceManger(RM) | JobTracker(JT) |
| 地方 | HRegionServer(HRS) | DataNode(DN) | NodeManager(NM) | TaskTracker(TT) |
| 监控协调者 | ZooKeeper | ZooKeeper | ZooKeeper | 无 |
| 是否有HA | HMaster-backups | NN(Standby) | RM(Standby) | 无,存在单点故障 |
| 故障转移方式 | 1.HMaster与ZooKeeper直接通讯(谁先建立znode,则谁为active) 2.HRegionServer与ZooKeeper直接通讯 |
NM不与ZooKeeper直接通讯,ZKFC监控NM状态,ZKFC与ZK通讯,由ZKFC来参与选举(谁先建立znode,则谁为active) | RM直接与ZK直接通讯,谁先建立znode,则谁为active | 无,存在单点故障 |
| 地方故障谁负责恢复和转移 | HMaster | NameNode | ResourceManager | JobTracker |
| 中央与地方的通讯 | HRegionServer与ZK心跳,HMaster从ZK获取HRS状态 | DN周期性向NN汇报 | NM周期性向RM汇报 | TT周期性向JT汇报 |
| 中央的共同职责 | 1. 负责地方任务的分配和故障转移 2. 监听地方的健康状态(HMaster从ZooKeeper获取HRegionServer的状态) 3. 地方资源的分配 |
|||
| 中央各特点 | 分配HRegionServer上的Region | 分配DN的block | 分配NM上container上的任务 | 分配TaskTracker上的task |
| 负载均衡 | HRS上region的负载均衡 | block的负载均衡 | ||
| 特点 | 1.Region的预分区、分裂和合并 2.Compaction机制 3.WAL机制 4.读写流程 |
1.副本策略 2.数据写入的副本管道传输机制 3.联邦制 |
1.资源调度和应用管理独立进程 2.NM上节点资源由NM管理,ApplicationManager和 AppliactionMaster管理任务 3.container概念 |
1.将资源划分为等量以slot为单位 2.maptask和reducetask独立分配 |
HBase、HDFS和MapReduce架构异同简解的更多相关文章
- 2本Hadoop技术内幕电子书百度网盘下载:深入理解MapReduce架构设计与实现原理、深入解析Hadoop Common和HDFS架构设计与实现原理
这是我收集的两本关于Hadoop的书,高清PDF版,在此和大家分享: 1.<Hadoop技术内幕:深入理解MapReduce架构设计与实现原理>董西成 著 机械工业出版社2013年5月出 ...
- Hadoop 新 MapReduce 框架 Yarn 详解
Hadoop 新 MapReduce 框架 Yarn 详解: http://www.ibm.com/developerworks/cn/opensource/os-cn-hadoop-yarn/ Ap ...
- 大数据开发实战:HDFS和MapReduce优缺点分析
一. HDFS和MapReduce优缺点 1.HDFS的优势 HDFS的英文全称是 Hadoop Distributed File System,即Hadoop分布式文件系统,它是Hadoop的核心子 ...
- Hadoop 新 MapReduce 框架 Yarn 详解【转】
[转自:http://www.ibm.com/developerworks/cn/opensource/os-cn-hadoop-yarn/] 简介: 本文介绍了 Hadoop 自 0.23.0 版本 ...
- HDFS的体系架构
通过对Hadoop分布式计算平台最核心的分布式文件系统HDFS.MapReduce处理过程,以及数据仓库工具Hive和分布式数据库Hbase的介绍.基本涵盖了Hadoop分布式平台的全部技术核心. H ...
- Hadoop 中HDFS、MapReduce体系结构
在网络环境方面,作为分布式系统,Hadoop基于TCP/IP进行节点间的通信和传输. 在数据传输方面,广泛应用HTTP实现. 在监控.通知方面,Hadoop等分布式大数据软件则广泛使用异步消息队列等机 ...
- 高可用,完全分布式Hadoop集群HDFS和MapReduce安装配置指南
原文:http://my.oschina.net/wstone/blog/365010#OSC_h3_13 (WJW)高可用,完全分布式Hadoop集群HDFS和MapReduce安装配置指南 [X] ...
- 分布式处理框架MapReduce的深入简出
1).MapReduce的概述 2).MapReduce 编程模型 3).MapReduce架构 4).MapReduce编程 Google MapReduce论文,论文发表于2004年 Hadoop ...
- Hadoop的HDFS和MapReduce的安装(三台伪分布式集群)
一.创建虚拟机 1.从网上下载一个Centos6.X的镜像(http://vault.centos.org/) 2.安装一台虚拟机配置如下:cpu1个.内存1G.磁盘分配20G(看个人配置和需求,本人 ...
随机推荐
- vim设置注意记录
set vb t_vb= setlocal buftype = "解决不能保存buff错误
- php模式设计之 中介者模式
中介者模式 中介者模式用于开发一个对象,这个对象能够在类似对象相互之间不直接相互的情况下传送或者调解对这些对象的集合的修改.一般处理具有类似属性,需要保持同步的非耦合对象时,最佳的做法就是中介者模式. ...
- iOS 引导页
1. 目标需求 引导页无限轮播,且轮播到最后一张时没有跳转到头一个的感觉 pageControl的显示为可选项 是否无限轮播为可选项 手动切换图片,并再次启动自动轮转 实现点击事件 2. 实现思路 初 ...
- Oracle 11gR2 RAC ohasd failed to start 解决方法
rcrCRS-4124: Oracle High Availability Services startup failed. CRS-4000: Command Start failed, or co ...
- Java线程:堵塞队列与堵塞栈
一.堵塞队列 Java定义了堵塞队列的接口java.util.concurrent.BlockingQueue,堵塞队列是一个指定长度的队列,当试图向队列中添加元素而队列已满,或者是想从队列移出元素而 ...
- 如何让sql自动定时执行某个存储过程
/*--创建作业--邹建 2003.10--*//*--调用示例--每月执行的作业exec p_createjob @jobname='mm',@sql='select * from syscolum ...
- EasyUI datagrid 删除的时候无法正确找到重复记录row index的问题
EasyUI datagrid 删除的时候无法正确找到重复记录row index的问题: 如果无法正确找到重复记录的row index,就需要进行注意添加的时候所进行的 操作:如果添加的时候就是添加的 ...
- 【开源.NET】 分享一个前后端分离的轻量级内容管理框架
开发框架要考虑的面太多了:安全.稳定.性能.效率.扩展.整洁,还要经得起实践的考验,从零开发一个可用的框架,是很耗时费神的工作.网上很多开源的框架,为何还要自己开发?我是基于以下两点: 没找到合适的: ...
- [JQuery] Ajax使用过程中的问题总结
JQuery提供的ajax函数,在使用过程中,因为对参数的不了解,导致了很多错误,现在总结如下,以便时常温固,不犯同样的错误. 1.我在项目中使用到的ajax请求格式如下: $.ajax({ url: ...
- 移动HTML5前端性能优化总结
概述 1. PC优化手段在Mobile侧同样适用 2. 在Mobile侧我们提出三秒种渲染完成首屏指标 3. 基于第二点,首屏加载3秒完成或使用Loading 4. 基于联通3G网络平均338KB/s ...