第一回 新入环境

  我的名字是hadoop,我一出生我的爸爸雅虎就给我取了这样一个名字:hadoop,我也不知道为什么叫这个名字,刚出生没多久,雅虎爸爸就把我领进一个黑暗的屋子里面,屋里堆满了黑色的箱子,里面出奇的冷.

我一脸懵懂,“爸爸,这是哪里?”

  “不要着急,马上你就会明白了,听爸爸的话,进去之后要好好做事.”

  爸爸把我送到房间尽头的楼梯旁跟我说:"进去吧,爸爸回家了,在外面好好闯荡哈,吃亏是福,爸爸在家等你",说完爸爸轻轻地走了.我发呆望着爸爸.

  正当我心中还念念不忘爸爸的时候,眼神无意中滑到了楼梯旁边,我看着旁边破旧的楼梯,心想这么破的楼梯也没个人修修,楼梯上面挂着一个破旧的牌子,上面写着四个字母"sftp".这到底是什么地方,我心中念叨着.

  "hadoop 快进 磨蹭什么玩意",只听见一个凶神恶煞的门卫怒吼道.

  什么? hadoop? 不就是我吗,我赶紧顺着楼梯上了楼上的房间.

  "磨蹭什么玩意,这么多人就等你呢",旁边一个人一脸不耐烦地看着我,我没敢耽误赶紧走了进去,看样子那么多人都排着队呢,我紧挨着他们,他们和我一样胸前都挂着牌子,我仔细看着他们每个人身上牌子,"hive","flume","sqoop","azkaban"等等等.看半天没看出什么所以然来.

  "兄弟,咱们在这排队是要干什么呀?",我轻声问着前面叫flume的兄弟.

  "还能干什么,看见那一堆堆的log数据没,一会都是你要处理的",兄弟答道

  我看着那堆积如山的数据不寒而栗,忽然我耳边回响起起爸爸时常和朋友谈起的数据存储,数据计算等等关于数据的事情.难道我来就是处理这些数据的嘛.

  很快就轮到我了,我被一个粗胖的大汉拿着胶带把我打包成一个大箱子扔进了一个叫centos的地方,进去之后我从箱子里出来,观察着周围的光电闪烁,我看里面一个个人忙得手忙脚乱,他在里面手舞足蹈挥舞着指挥棒,就像一个音乐指挥家一样,我走近了瞅见了他身上的牌子,上面金光闪闪地写着CPU三个大字母,原来他是爸爸常跟我提起的中央处理器,忽然他指着我说:"hadoop你过来把这一堆数据处理了,完不成马上把你kill掉"

  第二回 暂露头脚

  接收到CPU的命令以后,我一脸茫然,这么多数据我怎么可能干得完,难道只能等着被干掉?旁边挂着flume牌子的大哥看出了我的困惑,低声对我说:"这么多数据你搞不定的,你必须把自己复制几份在另几个centos服务器上面你们几个一起干活,你去问centos服务器的主人要另外几台服务器的账号密码来传输备份"

  是的,,看来只能这样了,但是那么多的hadoop在不同的服务器上面总要有一个来进行管理吧,不然干起活来岂不乱套?谁管理呢?君临天下舍我其谁,就我吧,

  我思索着,我瞅着自己身上的三个组件:

  第一个是存储文件的hdfs组件,

  第二个是调度资源的yarn组件,

  第三个是计算数据的mapreduce组件,

  hdfs文件系统角色需要有一个管理者,化名namenode,专门总体管理各个服务器上面数据吧,其他服务器上面的就叫datanode专门存储数据,我做namenode,其他datanode服从我的管理.

  yarn资源管理角色需要一个管理者,化名resourcemanager,,专门管理总资源,其他服务器上面资源管理的化名nodemanager,我做resourcemanager,其他nodemananger服从我的的管理.

   对于mapreduce数据计算这一块,就一干粗活的,就让他服从nodemanger安排吧,我就做总司令.

  哈哈,角色都安排好了,此刻我洋洋得意了,忽然想起一个问题了,怎么进行联系呢,我这个管理的总司令的命令怎么下发呢,大家都在不同的服务器上面呀,我经过一番思索,觉得我可以用HTTP或者RPC

 怎么选择呢?HTTP? HTTP协议是在传输层协议TCP之上的,而RPC就是基于传输层协议TCP的,很明显RPC更底层,那也就是说用RPC更快,OK,就用RPC联系.

小hadoop准备工作完毕..

欢迎您的阅读,本人微信公众号  "欢乐的马小纪"欢迎关注

我的名字叫hadoop的更多相关文章

  1. Hadoop 中利用 mapreduce 读写 mysql 数据

    Hadoop 中利用 mapreduce 读写 mysql 数据   有时候我们在项目中会遇到输入结果集很大,但是输出结果很小,比如一些 pv.uv 数据,然后为了实时查询的需求,或者一些 OLAP ...

  2. 初识Hadoop、Hive

    2016.10.13 20:28 很久没有写随笔了,自打小宝出生后就没有写过新的文章.数次来到博客园,想开始新的学习历程,总是被各种琐事中断.一方面确实是最近的项目工作比较忙,各个集群频繁地上线加多版 ...

  3. hadoop 2.7.3本地环境运行官方wordcount-基于HDFS

    接上篇<hadoop 2.7.3本地环境运行官方wordcount>.继续在本地模式下测试,本次使用hdfs. 2 本地模式使用fs计数wodcount 上面是直接使用的是linux的文件 ...

  4. hadoop 2.7.3本地环境运行官方wordcount

    hadoop 2.7.3本地环境运行官方wordcount 基本环境: 系统:win7 虚机环境:virtualBox 虚机:centos 7 hadoop版本:2.7.3 本次先以独立模式(本地模式 ...

  5. 【Big Data】HADOOP集群的配置(一)

    Hadoop集群的配置(一) 摘要: hadoop集群配置系列文档,是笔者在实验室真机环境实验后整理而得.以便随后工作所需,做以知识整理,另则与博客园朋友分享实验成果,因为笔者在学习初期,也遇到不少问 ...

  6. Hadoop学习之旅二:HDFS

    本文基于Hadoop1.X 概述 分布式文件系统主要用来解决如下几个问题: 读写大文件 加速运算 对于某些体积巨大的文件,比如其大小超过了计算机文件系统所能存放的最大限制或者是其大小甚至超过了计算机整 ...

  7. 程序员必须要知道的Hadoop的一些事实

    程序员必须要知道的Hadoop的一些事实.现如今,Apache Hadoop已经无人不知无人不晓.当年雅虎搜索工程师Doug Cutting开发出这个用以创建分布式计算机环境的开源软...... 1: ...

  8. Hadoop 2.x 生态系统及技术架构图

    一.负责收集数据的工具:Sqoop(关系型数据导入Hadoop)Flume(日志数据导入Hadoop,支持数据源广泛)Kafka(支持数据源有限,但吞吐大) 二.负责存储数据的工具:HBaseMong ...

  9. Hadoop的安装与设置(1)

    在Ubuntu下安装与设置Hadoop的主要过程. 1. 创建Hadoop用户 创建一个用户,用户名为hadoop,在home下创建该用户的主目录,就不详细介绍了. 2. 安装Java环境 下载Lin ...

随机推荐

  1. css中attribute selector及pseudo class

    https://developer.mozilla.org/en-US/docs/Web/CSS/Reference#Selectors 在css3规范中,定义了以下几种类型的selector: Ba ...

  2. mysql安装错误之->ERROR 2002 (HY000): Can't connect to local MySQL server through socket '/var/lib/mysql/mysql.sock' (2)

    有时候,当我们使用“mysql”.“mysqladmin”.“mysqldump”等命令管理数据库时,服务器抛出类似如下错误: 一.错误现场还原:下面我们通过三种方式来连接,然后观察提示的错误信息: ...

  3. Python学习---深浅拷贝的学习

    浅拷贝copy(): 修改字符串,原来的不变: 更改列表,2个同时修改,以为列表里面还涉及一个指针的索引. 简单讲就是copy()只是简单地copy了第一层,第二层不被copy 深拷贝:  需要单独的 ...

  4. 一个SAP开发人员的2018年终总结

    我是SAP成都研究院的Jerry Wang,我喂自己袋盐. 时间过得真快,2017年发生的事情还历历在目,一转眼,2018年又马上要结束了. Jerry惊恐地发现,随着年龄的增长,时光流逝的速度仿佛有 ...

  5. 1874 football game(三分法and method to compute the area of trianngle)

    FInd the max area. 1. 三分法 2. NAN (not comparable with number) http://acm.timus.ru/problem.aspx?space ...

  6. SOA架构

    基于服务的SOA架构_后续篇   今天是元宵节,首先祝各位广大博友在接下来的光阴中技术更上一层,事事如意!(没能在元宵节发布,今天就补上吧) 昨天简单介绍了一下本人在近期开发过的一个电商购物平台的架构 ...

  7. 「C语言」在Windows平台搭建C语言开发环境的多种方式

    新接触C语言,如何在Windows下进行C语言开发环境的搭建值得思考并整理. 以下多种开发方式择一即可(DEV C++无须环境准备). 注:本文知识来源于  Windows 平台搭建C语言集成开发环境 ...

  8. Intellij IDEA 修改编辑器背景颜色

    对眼睛有益的RGB数值分别是(199,237,204)

  9. Yii自定义验证规则

    简单的方法:在 model 内部定义规则 最简单的定义验证规则的方法是在使用它的模型(model)内部定义. 比方说,你要检查用户的密码是否足够安全. 通常情况下你会使用 CRegularExpres ...

  10. 20165322 第七周 mybash 的实现

    mybash的实现 要求 使用fork,exec,wait实现mybash 写出伪代码,产品代码和测试代码 发表知识理解,实现过程和问题解决的博客 相关函数的作用 fork fork()函数通过系统调 ...