Hadoop学习历程（五、真正的分布式系统搭建）

之前都是单节点进行的操作与测试，现在进行真正的多节点系统搭建

1. 准备系统与配置

　　共准备4台机器搭建Hadoop集群。基于CentOS6.2，jdk1.6.0_31，Hadoop2.2.0版本

　　192.168.1.132　　NameNode　　Master132.Hadoop （Master）
　　192.168.1.110　　DateNode　　 Slave110.Hadoop   （Slave）　
　　192.168.1.141　　DateNode   　 Slave141.Hadoop   （Slave）
　　192.168.1.131　　DateNode　　 Slave131.Hadoop   （Slave）

2. 首先都分别对几台机器建立Hadoop用户　　

    groupadd hadoop

    useradd -g hadoop hadoop

    passwd hadoop

　　增加用户组和用户都是hadoop，我这里设置的密码 111111

3. 分别使用root用户，安装jdk并进行设置

　　我这里JDK的安装路径是 /usr/java/jdk1.6.0_31

　　修改设置文件/etc/profile，增加如下内容

　　　　export JAVA_HOME=/usr/java/jdk1.6.0_31/
　　　　export JRE_HOME=/usr/java/jdk1.6.0_31/jre
　　　　export CLASSPATH=.:$CLASSPATH:$JAVA_HOME/lib:$JRE_HOME/lib
　　　　export PATH=$PATH:$JAVA_HOME/bin:$JRE_HOME/bin
　　为了使配置马上生效，请执行 source /etc/profile 命令

4. 修改Hosts文件，以便彼此可以访问

　　文件的内容如下：（注意，把原有的内容都删除掉，否则可能有问题，这个问题困扰我很久）

　　192.168.1.110 Slave110.Hadoop
　　192.168.1.141 Slave141.Hadoop
　　192.168.1.131 Slave131.Hadoop
　　192.168.1.132 Master132.Hadoop
5. 修改主机名

　　编辑 /etc/sysconfig/network 文件，修改其中的主机名

NETWORKING=yes

HOSTNAME=Master132.Hadoop

GATEWAY=192.168.1.1

　　这个步骤需要重启，可以通过 hostname Maseter132.Hadoop 命令直接修改主机名

　　每一台机器都需要修改，设置我们预期的主机名称

6. 修改ssh免密码连接的设置

　　编辑/etc/ssh/sshd_config文件，使如下的配置生效

RSAAuthentication yes

PubkeyAuthentication yes

AuthorizedKeysFile      .ssh/authorized_keys

　　重启服务　　service sshd restart

7. 关闭防火墙

　　chkconfig iptables off

以上所有的操作都是在root权限下进行的，下面的操作主要是使用hadoop用户（除非是没有权限）

9. 设置ssh免密码连接

　　9.1 在/home/hadoop目录下，执行如下的命令

　　　　　　ssh-keygen -t rsa

　　　　多次回车之后，将会在 /home/hadoop/.ssl/目录下生产两个文件 id_rsa，id_rsa.pub

　　9.2 执行如下命令

　　　　cat id_rsa.pub >> authorized_keys
　　　　chmod 600 ~/.ssh/authorized_keys　　（root权限）

　　9.3 将所有的Slave节点的 id_rsa.pub 文件导入到Master节点的authorized_keys文件中

　　　　cat id_rsa.pub >> ~/.ssh/authorized_keys

　　9.4 使用同样的办法将Master节点的id_rsa.pub文件也导入到各个Slave节点的authorized_keys文件中

　　9.5 验证相互之间免密码连接是否成功：ssh Slave110.Hadoop 等命令

10. 安装Hadoop（在Master机器上进行，root权限）

　　10.1 使用之前已经编译好的文件：hadoop-2.2.0.tar.gz

　　10.2 解压安装在相同的路径，我安装的路径为 /usr/hadoop/

　　10.3 进行环境设置，修改/etc/profile文件，增加如下内容

export HADOOP_HOME=/usr/hadoop

export PATH=$PATH:$HADOOP_HOME/bin

　　　　别忘了执行 source /etc/profile

　　10.4 修改安装路径的权限（将hadoop目录的读权限给hadoop组的hadoop用户）

　　　　chown –R hadoop:hadoop hadoop

11. 配置Hadoop（在Master机器上进行，hadoop权限）

　　11.1 修改 /usr/hadoop/libexec/hadoop-env.sh 文件，对JAVA_HOME进行明确指定
　　　　　　export JAVA_HOME=/usr/java/jdk1.6.0_31

　　11.2 修改 /usr/hadoop/etc/hadoop/core-site.xml

<configuration>

<property>

        <name>fs.defaultFS</name>

        <value>hdfs://Master132.Hadoop:9000</value>

</property>

<property>

        <name>io.file.buffer.size</name>

        <value></value>

</property>

<property>

        <name>hadoop.tmp.dir</name>

        <value>file:/usr/hadoop/tmp</value>

</property>

<property>

        <name>fs.default.name</name>

        <value>hdfs://Master132.Hadoop:8010</value>

</property>

</configuration>

　　11.3 修改 /usr/hadoop/etc/hadoop/hdfs-site.xml

<configuration>

<property>

        <name>dfs.namenode.secondary.http-address</name>

        <value>Master132.Hadoop:</value>

</property>

<property>

        <name>dfs.namenode.name.dir</name>

        <value>file:/usr/hadoop/dfs/name</value>

</property>

<property>

        <name>dfs.datanode.data.dir</name>

        <value>file:/usr/hadoop/dfs/data</value>

</property>

<property>

        <name>dfs.webhdfs.enabled</name>

        <value>true</value>

</property>

<property>

        <name>dfs.replication</name>

        <value></value> 此处请注意，数值不能大于你的Datanode节点数

</property>

</configuration>

　　11.4 修改 /usr/hadoop/etc/hadoop/mapred-site.xml

<configuration>

<property>

        <name>mapreduce.framework.name</name>

        <value>yarn</value>

</property>

<property>

        <name>mapreduce.jobhistory.address</name>

        <value>Master132.Hadoop:</value>

</property>

<property>

        <name>mapreduce.jobhistory.webapp.address</name>

        <value>Master132.Hadoop:</value>

</property>

</configuration>

　　11.5 修改 /usr/hadoop/etc/hadoop/slaves

Slave110.Hadoop

Slave131.Hadoop

Slave141.Hadoop

12. 在Slave节点执行10,11步骤

　　可以将Master节点的配置直接拷贝到其它节点，然后执行10步的内容，完成全部设置

至此，所有的配置完成，下面可以启动一下系统

13. 在Master节点启动系统

　　13.1 运行如下命令进行格式化

　　　　hadoop namenode -format

　　13.2 正式启动hadoop

　　　　start-all.sh

　　13.3 验证启动的结果，执行如下命令：

　　　　hadoop dfsadmin -report

　　　　基本上，如果几个datenode都正常就可以了！

如果过程中有问题，请到/usr/hadoop/log 下面查看日志，寻找问题的线索

Hadoop学习历程（五、真正的分布式系统搭建）的更多相关文章

Hadoop学习笔记—22.Hadoop2.x环境搭建与配置
自从2015年花了2个多月时间把Hadoop1.x的学习教程学习了一遍,对Hadoop这个神奇的小象有了一个初步的了解,还对每次学习的内容进行了总结,也形成了我的一个博文系列<Hadoop学习笔 ...
[Hadoop] Hadoop学习历程 [持续更新中…]
1. Hadoop FS Shell Hadoop之所以可以实现分布式计算,主要的原因之一是因为其背后的分布式文件系统(HDFS).所以,对于Hadoop的文件操作需要有一套全新的shell指令来完成 ...
Hadoop学习历程（一、编译）
近期对Hadoop很感兴趣,下面是在CentOS系统上进行编译的分享系统情况如下: 1. CentOS 6.2 64位 2. hadoop-2.2.0 3. jdk 1.6.0_31 ...
Hadoop学习笔记五
一.uber(u:ber)模式 MapReduce以Uber模式运行时,所有的map,reduce任务都在一个jvm中运行,对于小的mapreduce任务,uber模式的运行将更为高效. uber模式 ...
Hadoop学习历程（四、运行一个真正的MapReduce程序）
上次的程序只是操作文件系统,本次运行一个真正的MapReduce程序. 运行的是官方提供的例子程序wordcount,这个例子类似其他程序的hello world. 1. 首先确认启动的正常:运行 s ...
Hadoop学习历程（三、第一个程序）
根据之前的操作,我们已经可以正常的启动Hadoop了,关于真正的集群我会在之后进行说明.现在我们来看一下第一个程序吧 1. 在eclipse上建立一个java项目 2. 将 /usr/hadoop/s ...
Hadoop学习历程（二、配置）
以下是进行单节点Hadoop配置的内容,多节点也类似 1. 进行Hadoop的安装 1.1 上文进行了Hadoop的编译,将编译结果目录 hadoop-2.2.0 拷贝为 /usr/hadoop 目录 ...
【Hadoop学习之五】win7+Eclipse+hadoop3搭建本机开发环境
环境虚拟机:VMware 10 Linux版本:CentOS-6.5-x86_64 客户端:Xshell4 FTP:Xftp4 jdk8 hadoop-3.1.1 拓扑: 知识准备: 1.eclip ...
Hadoop学习之路(4)Intelij+Maven搭建Hadoop项目
1创建工程点击project--Maven--next 2通过maven导入项目依赖jar包 (1)设置maven自动导入依赖jar包勾选 Import Maven projects automa ...

随机推荐

编译TWRP-recovery教程及源码地址
TWRP这个是一个老外的开源项目,全称Team-Win-Recovery-Project Source:https://github.com/TeamWin/Team-Win-Recovery-Pro ...
转：6款Java转C#的最佳工
原文来自于:http://designzum.com/2014/03/27/best-tools-to-convert-java-to-c-source-code/ ava is the class ...
Go http.HandlerFunc()
//http.Handler type Handler interface { ServeHTTP(ResponseWriter, *Request) } type HandlerFunc func( ...
Head First --- Python 第一章
List 1. python -V 查看python当前版本 2. list.pop() 删除列表里的最后一个元素,并返回删除元素的值 3. list.extend(['a','b','c']) 在原 ...
Oracle_OCP课程实验学习
Linux启动oracl.查看lsnrctl状态,然后启动监听start.sqlplus / as sysdba 启动数据库.conn sys/jxsrpv as sysdba .startup Ad ...
js 中比较 undefined
// x has not been declared before if (typeof x === 'undefined') { // evaluates to true without error ...
设计模式（十）：Decorator装饰者模式 -- 结构型模式
1. 概述若你从事过面向对象开发,实现给一个类或对象增加行为,使用继承机制,这是所有面向对象语言的一个基本特性.如果已经存在的一个类缺少某些方法,或者须要给方法添加更多的功能(魅力),你也许会仅仅继 ...
Codeforces Round #292 (Div. 1) - B. Drazil and Tiles
B. Drazil and Tiles Drazil created a following problem about putting 1 × 2 tiles into an n × m gri ...
hdu 4746 Mophues
莫比乌斯反演.先初始化出所有数有多少个质因子和mobius.然后处理mob_sum[ i ][ j ],表示当公因子的因子个数小于等于 j 个的mobius前 i 项和.然后分块求和即可. 分块处理部 ...
double精度的坑与BigDecimal
近期经常接触支付相关的功能,在开发及测试过程中,开始金额都使用的是double类型,而近期新进的需求存在支付时打折的情况,也就是会出现如 1.23元的情况,那么这时候问题来了,如果是直接使用1.23进 ...

Hadoop学习历程（五、真正的分布式系统搭建）

Hadoop学习历程（五、真正的分布式系统搭建）的更多相关文章

随机推荐

热门专题