Dream------Hadoop--网络拓扑与Hadoop--摘抄

两个节点在一个本地网络中被称为“彼此的近邻”是什么意思？在高容量数据处理中，限制因素是我们在节点间

传送数据的速率-----带宽很稀缺。这个想法便是将两个节点间的带宽作为距离的衡量标准。

衡量节点间的带宽，实际上很难实现（它需要一个稳定的集群，并且在集群中成对的节点的数量的增长要是节点数量的平方），不及Hadoop采用一个简单的方法，把网络看做一棵树，两个节点间的距离是距离他们最近的共同祖先的总和。

该树中的等级是没有被预先设定的，但是他对于相当于数据中心、框架和一直在运行的节点的等级是相同的。

这个想法是，对于以下每个场景，可用带宽依次减少（啥意思？是消耗的带宽依次增多吗？）：

相同节点中的进程

同一机架上的不同节点

同一数据中心的不同机架上的节点

不同数据中心的节点（目前Hadoop上不适合跨数据中心运行）

例如，假设节点n1 在数据中心d1 中的机架r1 上.这被表示成/d1/r1/n1 。

利用这种标记，这里给出四种描述的距离:

距离(/d1/r1/n1 ， /d 1 /r 1 /n 1)=O(相同节点中的进程)

距离(/dl /r1 /n1 ， /d 1 /r1 /n2)=2(同一机架上的不同节点)

距离(/d1/r1/n1, /d 1 /r2/n3)=4( 同一数据中心的不同机架丰的节点)

距离(/d1/r1/n1, /d2/r3/n4 }=6(不同数据中心的节点)

用图示形式表达(数学爱好者会注意到这是一个Z巨禽公制的例子) .

我们必须意识到， Hadoop 无法预测网络拓扑结构.它需要一定帮助，我

们将在第9 章讨论如何配置拓扑. 不过在默认情况下，假设网络是平的

(一个单层的等级制)，或者换句话说，所有节点都在同一数据中心的同一

机架. 小的集群可能如此，所以不需要进一步的配置.

DT大数据梦工厂，微信公众号是：DT_Spark，每天都会有大数据实战视频发布，请您持续学习。
相关资料：
scala深入浅出实战经典完整视频、PPT、代码下载：
百度云盘：http://pan.baidu.com/s/1c0noOt6
腾讯微云:http://url.cn/TnGbdC
360云盘：http://yunpan.cn/cQ4c2UALDjSKy 访问密码45e2

Dream------Hadoop--网络拓扑与Hadoop--摘抄的更多相关文章

【从零开始学习Hadoop】--1.Hadoop的安装
第1章 Hadoop的安装1. 操作系统2. Hadoop的版本3. 下载Hadoop4. 安装Java JDK5. 安装hadoop6. 安装rsync和ssh7. 启动hadoop8. 测试had ...
从零自学Hadoop(11)：Hadoop命令上
阅读目录序概述 Hadoop Common Commands User Commands Administration Commands File System Shell 引用系列索引本文版 ...
从零自学Hadoop(12)：Hadoop命令中
阅读目录序 HDFS Commands User Commands Administration Commands Debug Commands 引用系列索引本文版权归mephisto和博客园共 ...
Hadoop：部署Hadoop Single Node
一.环境准备 1.系统环境 CentOS 7 2.软件环境 OpenJDK # 查询可安装的OpenJDK软件包[root@server1] yum search java | grep jdk... ...
【hadoop】——修改hadoop FileUtil.java，解决权限检查的问题
在Hadoop Eclipse开发环境搭建这篇文章中,第15.)中提到权限相关的异常,如下: 15/01/30 10:08:17 WARN util.NativeCodeLoader: Unable ...
Maven构建Hadoop Maven构建Hadoop工程
一.安装maven linux eclipse3.6.1 maven安装二:官网依赖库我们可以直接去官网查找我们需要的依赖包的配置pom,然后加到项目中. 官网地址:http://mvnrepos ...
hadoop入门：hadoop使用shell命令总结
第一部分:Hadoop Bin后面根据项目的实际需要Hadoop Bin 包括:Hadoop hadoop的Shellhadoop-config.sh 它的作用是对一些变量进行赋值 HAD ...
何时使用hadoop fs、hadoop dfs与hdfs dfs命令(转)
hadoop fs:使用面最广,可以操作任何文件系统. hadoop dfs与hdfs dfs:只能操作HDFS文件系统相关(包括与Local FS间的操作),前者已经Deprecated,一般使用后 ...
学习hadoop，搭建hadoop遇到一些特殊问题
我执行下面步骤: 1. 动态增加DataNode节点和TaskTracker节点以host9为例在host9上执行: 指定主机名 vi /etc/hostname 指定主机名到IP地址的映射 ...
何时使用hadoop fs、hadoop dfs与hdfs dfs命令
hadoop fs:使用面最广,可以操作任何文件系统. hadoop dfs与hdfs dfs:只能操作HDFS文件系统相关(包括与Local FS间的操作),前者已经Deprecated,一般使用后 ...

随机推荐

D. Vasya and Arrays
链接 [http://codeforces.com/contest/1036/problem/D] 题意给你两个数组长度分别为n,m; 有这么一种操作,用某个数组的某个子区间元素之和代替这个子区间, ...
第二阶段Sprint7
昨天:将“录制”及“保存”整合到一起,修复出现的Bug,使之能够正常运行. 今天:把视频录制整合到时间提醒里,实现视频提醒遇到的问题:额,整进去直接就停止运行了..也没有报错..
数学口袋精灵app（小学生四则运算app）开发需求
数学口袋精灵APP,摒除了传统乏味无趣学习数学四则运算的模式,采用游戏的形式,让小朋友在游戏中学习,培养了小朋友对数学的兴趣,让小朋友在游戏中运算能力得到充分提升.快乐学习,成长没烦恼! 项目名字:“ ...
(Alpha)Let's-技术文档（技术规格说明书）
技术规格说明书抽象首先,对抽象原则的理解,“抽象”这一概念本身就很抽象.抽象体现的是一种概括能力.我们生活中遇到的很多客体,其在某些方面具备有一些相似甚至相同的性质,以这些特点而非事物本身来认识鉴 ...
谈vs2013单元测试感想
(1)安装篇:这个就不用多说啦,百度一个安装包进行安装. 之前下载过vs2013当时是抱着玩玩的心态,也没有安装成功,现在作为作业重新安装,并且进行单元测试.下面就是安装vs2013的具体过程以及我遇 ...
nginx转发swoole以及nginx负载
nginx作为静态服务器同时转发swoole配置: location /{root //静态文件目录;index index.html index.htm;//默认首页 if(!-e $request ...
[转帖]ESXi、Linux、Windows获取机器序列号的方法
http://blog.51cto.com/liubin0505star/1717473 windows: wmic bios get serialnumber linux: dmidecode准确一 ...
[转帖]Git数据存储的原理浅析
Git数据存储的原理浅析 https://segmentfault.com/a/1190000016320008 写作背景进来在闲暇的时间里在看一些关系P2P网络的拓扑发现的内容,重点关注了Ma ...
MySQL查询where条件的顺序对查询效率的影响
看到有资料说,where条件的顺序会影响查询的效率,根据的逻辑是: where条件的运行是从右到左的,将选择性强的条件放到最右边,可以先过滤掉大部分的数据(而选择性不强的条件过滤后的结果集仍然很大), ...
C# 多线程初级汇总
异步委托创建线程的一种简单方式是定义一个委托,并异步调用它委托是方法的类型安全的引用 Delegate类还支持异步地调用方法.在后台,Delegate类会创建一个执行任务的线程投票,并检查委托是 ...

Dream------Hadoop--网络拓扑与Hadoop--摘抄

Dream------Hadoop--网络拓扑与Hadoop--摘抄的更多相关文章

随机推荐

热门专题