Hadoop架构模型
1.hadoop 1.x架构模型:
分布式文件存储系统:HDFS
NameNode(主节点:管理元数据)
secondaryNameNode(作用是合并元数据信息,辅助NameNode管理元数据信息)
DataNode DataNode DataNode(存储数据)
分布式数据计算系统:MapReduce
JobTracker(主节点:负责分配任务)
TaskTracker TaskTracker TaskTracker(负责执行任务)
注:元数据:描述数据的数据。
缺点:单节点故障。
2.hadoop2.x架构模型:
(1)文件存储和数据计算单节点:
分布式文件存储系统:HDFS
NameNode
SecondaryNameNode
DataNode DataNode DataNode
分布式数据计算系统:MapReduce(Yarn资源调度系统)
ResourceManager(主节点:接收用户的任务请求,分配资源给NodeManager)
NodeManager NodeManager NodeManager(执行任务)
ApplicationManager进程:每一个任务请求,ResourceManager都会在某个NodeManager上启动一个APPmaster进程,该APPmaster进程负责向ResourceManager申请资源,并分配任务给每个NodeManager
(2)文件存储高可用,数据计算单节点:略;
(3)文件存储单节点,数据计算高可用:略;
(4)文件存储和数据计算高可用:
分布式文件存储系统:HDFS
JournalNode JournalNode JournalNode(文件系统元数据信息管理,一般都是奇数个)
ZK
NameNode(active状态) NameNode(从节点,standby状态,主要负责监控active何时挂掉,一旦挂掉,立刻接管其工作)
DataNode DataNode DataNode
分布式数据计算系统:MapReduce(Yarn资源调度系统)
ZK
ResourceManager(主节点) ResourceManager(备份节点)
NodeManager NodeManager NodeManager
注:(1)如果NameNode高可用,就没有SecondaryNameNode,取而代之的是JournalNode,其主要用于同步元数据信息,保证2个NameNode的元数据信息一致,并且JournalNode需要奇数个,半数及以上的JournalNode写入元数据成功,就代表写入成功。
(2)两个NameNode组成主备的架构。
(3)集群的脑裂:为了避免集群的脑裂,造成看到的数据不一样,一定要保证两个NameNode中的元数据信息一模一样,而JournalNode就是同步两个NameNode中的元数据信息,保证两者相同。
(4)NameNode高可用的自动切换,主要是通过两个守护进程ZKFC来实现。
Hadoop架构模型的更多相关文章
- 【Hadoop离线基础总结】Hadoop的架构模型
Hadoop的架构模型 1.x的版本架构模型介绍 架构图 HDFS分布式文件存储系统(典型的主从架构) NameNode:集群当中的主节点,主要用于维护集群当中的元数据信息,以及接受用户的请求,处理用 ...
- Hadoop架构的初略总结(1)
Hadoop架构的初略总结(1) Hadoop是一个开源的分布式系统基础架构,此架构可以帮助用户可以在不了解分布式底层细节的情况下开发分布式程序. 首先我们要理清楚几个问题. 1.我们为什么需要Had ...
- Dubble 01 架构模型&start project
Dubbo 01 架构模型 传统架构 All in One 测试麻烦,微小修改 全都得重新测 单体架构也称之为单体系统或者是单体应用.就是一种把系统中所有的功能.模块耦合在一个应用中的架构方式.其优点 ...
- hadoop知识点总结(一)hadoop架构以及mapreduce工作机制
1,为什么需要hadoop 数据分析者面临的问题 数据日趋庞大,读写都出现性能瓶颈: 用户的应用和分析结果,对实时性和响应时间要求越来越高: 使用的模型越来越复杂,计算量指数级上升. 期待的解决方案 ...
- MFC主窗口架构模型
根据主窗口类型,MFC软件工程可以分为一下几种架构模型: 1.SDI(Simple Document Interface)单文档界面,一个主窗口下只编辑一份文档 2.MDI(Multiple Docu ...
- PowerDesigner(三)-企业架构模型(转)
企业架构模型(Enterprise Architecture Model,EAM)是PowerDesigner 15新增的功能,它能够以图形的方式展现企业架构,从而取代文字描述:以偏向非技术性的表达方 ...
- PowerDesigner 企业架构模型 ( EAM )
PowerDesigner 企业架构模型 ( EAM ) 说明 file工作数据库框架application网络 目录(?)[+] 一. 企业架构模型 说明 EnterpriseArchite ...
- Unity3D中的AI架构模型
我们都知道现在AI(由人工制造出来的系统所表现出来的模拟人类的智能活动)非常的火,可以说是家喻户晓.当然,在游戏中,AI也是到处可以找到的,对于AI,我们应该关注的问题是如何让游戏角色能够向人或动物那 ...
- 【深度学习篇】--神经网络中的池化层和CNN架构模型
一.前述 本文讲述池化层和经典神经网络中的架构模型. 二.池化Pooling 1.目标 降采样subsample,shrink(浓缩),减少计算负荷,减少内存使用,参数数量减少(也可防止过拟合)减少输 ...
随机推荐
- 【415】C语言文件读写
A program can open and close, and read from, and write to, a file that is defined by the user This i ...
- J20170521-ts
組み込み 内置 リダイレクト 重定向 ディスクリプタ 描述符 バッファリング n 缓冲
- ubuntu vim设置显示行号
打开vim的配置文件 /etc/vim/vimrc sudo vim /etc/vim/vimrc 然后找到 #set number ,把注释取消就行了 如果没有,就自己加一行
- docker速记
1.docker:一个轻量级的虚拟机.是一个容器 2.Linux系统包括—RedHat(商业版).Centos.Ubuntu 3.docker比作码头的集装箱,image镜像就是基石,images类似 ...
- Lightoj 1174 - Commandos (bfs)
题目链接: Lightoj 1174 - Commandos 题目描述: 有一军队秉承做就要做到最好的口号,准备去破坏敌人的军营.他们计划要在敌人的每一个军营里都放置一个炸弹.军营里有充足的士兵,每 ...
- Hdu 5379 Mahjong tree (dfs + 组合数)
题目链接: Hdu 5379 Mahjong tree 题目描述: 给出一个有n个节点的树,以节点1为根节点.问在满足兄弟节点连续 以及 子树包含节点连续 的条件下,有多少种编号方案给树上的n个点编号 ...
- Lightoj 1090 - Trailing Zeroes (II)
题目连接: http://www.lightoj.com/volume_showproblem.php?problem=1090 题目大意: 给出n,r,p,q四个数字1<=n,r,p,q< ...
- Volley的初步了解
Volley的介绍 Volley是什么? 2013年Google I/O大会上推出的网络请求和图片加载框架 其优点是api简单,性能优秀 非常适合数据量不大但是通信频繁的网络请求,而对于大数据量的操作 ...
- 阿里maven仓库地址
在国内访问Maven仓库,连接速度太慢.下面是将中央仓库替换成阿里云的中央仓库的方法. 第一种,统一修改仓库地址 可以直接修改Mavenconf文件夹中的setting.xml文件,或者在.m2文件夹 ...
- ABP教程(一)- ABP介绍
ABP是什么 ABP是”ASP.NET Boilerplate Project (ASP.NET样板项目)”的简称. ASP.NET Boilerplate是一个用最佳实践和流行技术开发现代WEB应用 ...