我的名字叫hadoop
我的名字是hadoop,我一出生我的爸爸雅虎就给我取了这样一个名字:hadoop,我也不知道为什么叫这个名字,刚出生没多久,雅虎爸爸就把我领进一个黑暗的屋子里面,屋里堆满了黑色的箱子,里面出奇的冷.
我一脸懵懂,“爸爸,这是哪里?”
“不要着急,马上你就会明白了,听爸爸的话,进去之后要好好做事.”
爸爸把我送到房间尽头的楼梯旁跟我说:"进去吧,爸爸回家了,在外面好好闯荡哈,吃亏是福,爸爸在家等你",说完爸爸轻轻地走了.我发呆望着爸爸.
正当我心中还念念不忘爸爸的时候,眼神无意中滑到了楼梯旁边,我看着旁边破旧的楼梯,心想这么破的楼梯也没个人修修,楼梯上面挂着一个破旧的牌子,上面写着四个字母"sftp".这到底是什么地方,我心中念叨着.
"hadoop 快进 磨蹭什么玩意",只听见一个凶神恶煞的门卫怒吼道.
什么? hadoop? 不就是我吗,我赶紧顺着楼梯上了楼上的房间.
"磨蹭什么玩意,这么多人就等你呢",旁边一个人一脸不耐烦地看着我,我没敢耽误赶紧走了进去,看样子那么多人都排着队呢,我紧挨着他们,他们和我一样胸前都挂着牌子,我仔细看着他们每个人身上牌子,"hive","flume","sqoop","azkaban"等等等.看半天没看出什么所以然来.
"兄弟,咱们在这排队是要干什么呀?",我轻声问着前面叫flume的兄弟.
"还能干什么,看见那一堆堆的log数据没,一会都是你要处理的",兄弟答道
我看着那堆积如山的数据不寒而栗,忽然我耳边回响起起爸爸时常和朋友谈起的数据存储,数据计算等等关于数据的事情.难道我来就是处理这些数据的嘛.
很快就轮到我了,我被一个粗胖的大汉拿着胶带把我打包成一个大箱子扔进了一个叫centos的地方,进去之后我从箱子里出来,观察着周围的光电闪烁,我看里面一个个人忙得手忙脚乱,他在里面手舞足蹈挥舞着指挥棒,就像一个音乐指挥家一样,我走近了瞅见了他身上的牌子,上面金光闪闪地写着CPU三个大字母,原来他是爸爸常跟我提起的中央处理器,忽然他指着我说:"hadoop你过来把这一堆数据处理了,完不成马上把你kill掉"
第二回 暂露头脚
接收到CPU的命令以后,我一脸茫然,这么多数据我怎么可能干得完,难道只能等着被干掉?旁边挂着flume牌子的大哥看出了我的困惑,低声对我说:"这么多数据你搞不定的,你必须把自己复制几份在另几个centos服务器上面你们几个一起干活,你去问centos服务器的主人要另外几台服务器的账号密码来传输备份"
是的,,看来只能这样了,但是那么多的hadoop在不同的服务器上面总要有一个来进行管理吧,不然干起活来岂不乱套?谁管理呢?君临天下舍我其谁,就我吧,
我思索着,我瞅着自己身上的三个组件:
第一个是存储文件的hdfs组件,
第二个是调度资源的yarn组件,
第三个是计算数据的mapreduce组件,
hdfs文件系统角色需要有一个管理者,化名namenode,专门总体管理各个服务器上面数据吧,其他服务器上面的就叫datanode专门存储数据,我做namenode,其他datanode服从我的管理.
yarn资源管理角色需要一个管理者,化名resourcemanager,,专门管理总资源,其他服务器上面资源管理的化名nodemanager,我做resourcemanager,其他nodemananger服从我的的管理.
对于mapreduce数据计算这一块,就一干粗活的,就让他服从nodemanger安排吧,我就做总司令.
哈哈,角色都安排好了,此刻我洋洋得意了,忽然想起一个问题了,怎么进行联系呢,我这个管理的总司令的命令怎么下发呢,大家都在不同的服务器上面呀,我经过一番思索,觉得我可以用HTTP或者RPC
怎么选择呢?HTTP? HTTP协议是在传输层协议TCP之上的,而RPC就是基于传输层协议TCP的,很明显RPC更底层,那也就是说用RPC更快,OK,就用RPC联系.
小hadoop准备工作完毕..
欢迎您的阅读,本人微信公众号 "欢乐的马小纪"欢迎关注
我的名字叫hadoop的更多相关文章
- Hadoop 中利用 mapreduce 读写 mysql 数据
Hadoop 中利用 mapreduce 读写 mysql 数据 有时候我们在项目中会遇到输入结果集很大,但是输出结果很小,比如一些 pv.uv 数据,然后为了实时查询的需求,或者一些 OLAP ...
- 初识Hadoop、Hive
2016.10.13 20:28 很久没有写随笔了,自打小宝出生后就没有写过新的文章.数次来到博客园,想开始新的学习历程,总是被各种琐事中断.一方面确实是最近的项目工作比较忙,各个集群频繁地上线加多版 ...
- hadoop 2.7.3本地环境运行官方wordcount-基于HDFS
接上篇<hadoop 2.7.3本地环境运行官方wordcount>.继续在本地模式下测试,本次使用hdfs. 2 本地模式使用fs计数wodcount 上面是直接使用的是linux的文件 ...
- hadoop 2.7.3本地环境运行官方wordcount
hadoop 2.7.3本地环境运行官方wordcount 基本环境: 系统:win7 虚机环境:virtualBox 虚机:centos 7 hadoop版本:2.7.3 本次先以独立模式(本地模式 ...
- 【Big Data】HADOOP集群的配置(一)
Hadoop集群的配置(一) 摘要: hadoop集群配置系列文档,是笔者在实验室真机环境实验后整理而得.以便随后工作所需,做以知识整理,另则与博客园朋友分享实验成果,因为笔者在学习初期,也遇到不少问 ...
- Hadoop学习之旅二:HDFS
本文基于Hadoop1.X 概述 分布式文件系统主要用来解决如下几个问题: 读写大文件 加速运算 对于某些体积巨大的文件,比如其大小超过了计算机文件系统所能存放的最大限制或者是其大小甚至超过了计算机整 ...
- 程序员必须要知道的Hadoop的一些事实
程序员必须要知道的Hadoop的一些事实.现如今,Apache Hadoop已经无人不知无人不晓.当年雅虎搜索工程师Doug Cutting开发出这个用以创建分布式计算机环境的开源软...... 1: ...
- Hadoop 2.x 生态系统及技术架构图
一.负责收集数据的工具:Sqoop(关系型数据导入Hadoop)Flume(日志数据导入Hadoop,支持数据源广泛)Kafka(支持数据源有限,但吞吐大) 二.负责存储数据的工具:HBaseMong ...
- Hadoop的安装与设置(1)
在Ubuntu下安装与设置Hadoop的主要过程. 1. 创建Hadoop用户 创建一个用户,用户名为hadoop,在home下创建该用户的主目录,就不详细介绍了. 2. 安装Java环境 下载Lin ...
随机推荐
- freess(未测试)
freess 使用 nodejs 配合 shadowsocks-windows 实现FQ (windows) 使用方法: 如果你没有安装nodejs请先安装,访问 https://nodejs.org ...
- X11/Xlib.h:没有该文件或目录
编译程序时出现的错误,在安装日志上发现一句:x11/xlib.h nosuch file or directory 在网上查阅了资料,原来是x11M没有装. 解决方案:先安装X11,命令为 su ...
- tempdb过大事故记录-sqlserver
今天收到预警消息,提示磁盘空间已经满了,感觉很奇怪.刚装的新机器怎么可能会磁盘空间不足.登陆看了看 可以看的到tempdb已经65G的了,而且显示是百分百可用.这个就很奇怪了,为什么会出现这种情况呢. ...
- POI 导出excel带小数点的数字格式显示不对解决方法
最近看到了一个问题就是java导出excel中带小数点的数字显示不对, 比如我想在excel中第一行显示: 3,000.0 但是在excle中导出的格式总是不带小数点 3000(非文本格式),而且也 ...
- 【Leetcode】【Medium】Binary Tree Inorder Traversal
Given a binary tree, return the inorder traversal of its nodes' values. For example:Given binary tre ...
- February 21 2017 Week 8 Tuesday
To make each day count. 让每一天都物有所值. We always want to make our life meaningful, however, the acutal f ...
- (原)使用 memcache 使用过程中可能遇到的问题
在项目优化中,使用到了memcache,刚开始不能用,后来期间总会偶尔抛出异常,刚开始怀疑动态库版本问题,后来尝试了各种替换依旧误解,搞得我日思夜想的,天天惦记着他..=_= 下午拿出半天时间,进行错 ...
- Yii日志使用
Yii 提供了一个灵活可扩展的日志功能.记录的日志 可以通过日志级别和信息分类进行归类.通过使用 级别和分类过滤器,所选的信息还可以进一步路由到 不同的目的地,例如一个文件,Email,浏览器窗口等. ...
- DispatcherServlet类的分析
突然发现拿博客园来做笔记挺好的,不会弄丢.下面我把DispatcherServlet类的部分源代码复制到这里,然后阅读,把重要的地方翻译一下,该做笔记的地方做下笔记,蹩脚英语. =========== ...
- 【模板】Splay总结
rentenglong大佬写的splay的梳理使我受益颇丰,特此做出一定的总结. 数据结构 定义了一个struct结构体. 为了在splay操作下储存根节点,我们宏定义了root 为 tree[0]. ...