虚拟机centos6.5 --hadoop2.6集群环境搭建

一、环境说明

　　　虚拟机：virtualBox

　　　系统：centos6.5，64位

　　　集群：3个节点

　　　　　　master　　 192.168.12.232

　　　　　　slave01　　192.168.12.233

　　　　　　slave02　　192.168.12.234

二、准备工作

　　1、虚拟机centos6.5 --设置主机名

　　2、虚拟机centos6.5 --安装jdk

　　3、创建hadoop用户

useradd hadoop    #创建用户

passwd hadoop    #设置密码，3台机器密码最好都一样

usermod -g root hadoop    #将用户加入root用户组

id hadoop     #验证

　　4、虚拟机centos6.5 --ssh免密码登录

三、下载、上传并解压缩hadoop2.6

　　　下载地址：http://hadoop.apache.org/releases.html#News，选择2.6.0，下载binary

　　　上传：通过xtfp，把文件上传到hadoop用户的主目录下，即/home/hadoop/

　　　解压缩：tar -zxvf hadoop-2.6.0.tar.gz

四、修改配置文件

　　位置：$HADOOP_HOME/etc/hadoop/

　　需修改文件：

　　　　hadoop-env.sh

　　　　yarn-env.sh

　　　　core-site.xml

　　　　hdfs-site.xml

　　　　mapred-site.xml

　　　　yarn-site.xml

　　　　slaves

　　1、hadoop-env.sh、yarn-env.sh

　　　　这两个文件主要是修改jdk路径，如果前面虚拟机centos6.5 --安装jdk 这一步，做好了，这两个文件可以不用修改；

　　　　hadoop-env.sh 文件末尾加上：export HADOOP_PREFIX=/home/hadoop/hadoop-2.6.0

　　2、core-site.xml，参考以下内容：

<configuration>

　　<property>

　　　　<name>fs.defaultFS</name>

　　　　<value>hdfs://master:9000</value>

　　</property>

　　<property>

　　　　<name>hadoop.tmp.dir</name>

　　　　<value>/home/hadoop/tmp</value>

　　</property>

</configuration>

　　注意：/home/hadoop/tmp，这个文件要手动提前创建好；9000端口要开放，否则会出现hadoop正常启动，但看不到datanode使用的情况，参考虚拟机centos6.5 --开放端口。

　　3、hdfs-site.xml，参考以下内容：

<configuration>

        <property>

                <name>dfs.datanode.ipc.address</name>

                <value>0.0.0.0:50020</value>

        </property>

        <property>

                <name>dfs.datanode.http.address</name>

                <value>0.0.0.0:50075</value>

        </property>

        <property>

                <name>dfs.replication</name>

                <value>2</value>

        </property>

        <property>

                <name>dfs.namenode.name.dir</name>

                <value>file:/home/hadoop/hadoop-2.6.0/dfs/name</value>

        </property>

        <property>

                <name>dfs.datanode.data.dir</name>

                <value>file:/home/hadoop/hadoop-2.6.0/dfs/data</value>

        </property>

</configuration>

　　注意：/home/hadoop/hadoop-2.6.0/dfs/name 和/home/hadoop/hadoop-2.6.0/dfs/data，这两个文件要手动创建；

　　4、mapred-site.xml，参考以下内容：

<configuration>

        <property>

                <name>mapreduce.framework.name</name>

                <value>yarn</value>

        </property>

</configuration>

　　5、yarn-site.xml，参考以下内容：

<configuration>

        <property>

                <name>yarn.nodemanager.aux-services</name>

                <value>mapreduce_shuffle</value>

        </property>

</configuration>

　　6、slaves，参考以下内容：

slave01

slave02

　　7、将master上配置好的hadoop目录拷贝到slave01、slave02

scp -r hadoop-2.6.0 hadoop@slave01:/home/hadoop/

scp -r hadoop-2.6.0 hadoop@slave02:/home/hadoop/

　　注意：别忘了创建tmp、name 、data目录，路径和master保持一致

　　8、验证

　　　　master机器上，进入到hadoop根目录

　　　　8.1 格式化

　　　　　　bin/hdfs namenode -format

　　　　8.2 启动dfs

　　　　　　sbin/start-dfs.sh

　　　　8.3 启动yarn

　　　　　　sbin/start-yarn.sh

　　　　8.4 查看是否正常

　　　　　　a、通过命令jps查看，如果有以下内容，说明ok。

　　　　　　master下有：

　　　　　　　　12624 ResourceManager
　　　　　　　　12312 NameNode
　　　　　　　　12490 SecondaryNameNode

　　　　　　slave下有：　　　　　　　　

　　　　　　　　4593 DataNode
　　　　　　　　5240 NodeManager

　　　　　　b、浏览器访问：http://master:50070/ 和 http://master:8088/

　　　　　　c、查看状态， bin/hdfs dfsadmin -report

五、其他注意点

　　1、重新格式化时，需要把master、slave上的tmp、data、name都清空，否则会出现datanode启动不起来的情况；

　　2、master机器上，也可以做一个slave节点，需要修改slaves文件，把master加进去即可；

　　3、master机器开放8031端口，修改master和slave的yarn-site.xml配置文件，否则会出现slave机器的nodemanager会自动关闭的情况，参考以下内容：

<configuration>

	<property>

		<name>yarn.nodemanager.aux-services</name>

		<value>mapreduce_shuffle</value>

	</property>

        <property>

        	<name>yarn.resourcemanager.resource-tracker.address</name>

 	        <value>master:8031</value>

        </property>

</configuration>

　　4、配置hadoop的环境变量，参考以下内容：

export HADOOP_HOME=/home/hadoop/hadoop-2.6.0

JAVA_HOME=/app/programs/jdk1.8.0_60

JRE_HOME=/app/programs/jdk1.8.0_60/jre

PATH=$PATH:$JAVA_HOME/bin:$JRE_HOME/bin:$HADOOP_HOME/sbin:$HADOOP_HOME/bin

CLASSPATH=:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar:$JRE_HOME/lib:$HADOOP_HOME/share/hadoop/common/hadoop-common-2.6.0.jar:$HADOOP_HOME/share/hadoop/mapreduce/hadoop-mapreduce-client-core-2.6.0.jar:$HADOOP_HOME/share/hadoop/common/lib/commons-cli-1.2.jar

export JAVA_HOME JRE_HOME PATH CLASSPATH

虚拟机centos6.5 --hadoop2.6集群环境搭建的更多相关文章

（2）虚拟机下hadoop1.1.2集群环境搭建
hadoop集群环境的搭建和单机版的搭建差点儿相同,就是多了一些文件的配置操作. 一.3台主机的hostname改动和IP地址绑定注意:以下的操作我都是使用root权限进行! (1)3太主机的基本网 ...
hadoop2.6集群环境搭建
版权声明:本文为博主原创文章,未经博主允许不得转载. 一.环境说明 1.机器:一台物理机和一台虚拟机 2.Linux版本:[Spark@S1PA11 ~]$ cat /etc/issueRed Ha ...
原创hadoop2.6集群环境搭建
三台机器: Hmaster 172.168.2.3.Hslave1 172.168.2.4.Hslave2 172.168.2.6 JDK:1.8.49 OS:red hat 5.4 64 (由于后期 ...
hadoop2集群环境搭建
在查询了很多资料以后,发现国内外没有一篇关于hadoop2集群环境搭建的详细步骤的文章. 所以,我想把我知道的分享给大家,方便大家交流. 以下是本文的大纲: 1. 在windows7 下面安装虚拟机2 ...
Kafka：ZK+Kafka+Spark Streaming集群环境搭建（十）安装hadoop2.9.0搭建HA
如何搭建配置centos虚拟机请参考<Kafka:ZK+Kafka+Spark Streaming集群环境搭建(一)VMW安装四台CentOS,并实现本机与它们能交互,虚拟机内部实现可以上网.& ...
Kafka：ZK+Kafka+Spark Streaming集群环境搭建（二）安装hadoop2.9.0
如何搭建配置centos虚拟机请参考<Kafka:ZK+Kafka+Spark Streaming集群环境搭建(一)VMW安装四台CentOS,并实现本机与它们能交互,虚拟机内部实现可以上网.& ...
Kafka：ZK+Kafka+Spark Streaming集群环境搭建（十二）VMW安装四台CentOS，并实现本机与它们能交互，虚拟机内部实现可以上网。
Centos7出现异常:Failed to start LSB: Bring up/down networking. 按照<Kafka:ZK+Kafka+Spark Streaming集群环境搭 ...
Hadoop+Spark:集群环境搭建
环境准备: 在虚拟机下,大家三台Linux ubuntu 14.04 server x64 系统(下载地址:http://releases.ubuntu.com/14.04.2/ubuntu-14.0 ...
Kafka：ZK+Kafka+Spark Streaming集群环境搭建（九）安装kafka_2.11-1.1.0
如何搭建配置centos虚拟机请参考<Kafka:ZK+Kafka+Spark Streaming集群环境搭建(一)VMW安装四台CentOS,并实现本机与它们能交互,虚拟机内部实现可以上网.& ...

随机推荐

Guava学习笔记：Guava新集合-Table等
Table 当我们需要多个索引的数据结构的时候,通常情况下,我们只能用这种丑陋的Map<FirstName, Map<LastName, Person>>来实现.为此Guava ...
Android总结篇系列：Android Service
Service通常总是称之为“后台服务”,其中“后台”一词是相对于前台而言的,具体是指其本身的运行并不依赖于用户可视的UI界面,因此,从实际业务需求上来理解,Service的适用场景应该具备以下条件: ...
Java经典实例：按字符颠倒字符串
使用StringBuilder类的reverse()方法来实现. /** * Created by Frank */ public class StringRevChar { public stati ...
Webform（Linq高级查、分页、组合查询）
一.linq高级查 1.模糊查(包含) 1 public List<User> Select(string name) 2 { 3 return con.User.Where(r => ...
什么是闭包（closure），为什么要用它？
闭包是指有权访问另一个函数作用域中变量的函数,创建闭包的最常见的方式就是在一个函数内创建另一个函数,通过另一个函数访问这个函数的局部变量,利用闭包可以突破作用链域,将函数内部的变量和方法传递到外部. ...
go git 安装配置与使用 (windows 7 64bit)
go语言安装使用第三方库方式一般采用 go get github.com/.../... 命令.例如: go get github.com/astaxie/beego 1.错误情况一: packag ...
常让人误解的一道js小题
一道小题引发的深思今天无意中看到一个js笔试题,不由得想起初学js那会被各种题目狂虐的心酸,虽说现在也会被笔试题所虐,但毕竟比之前好了很多,下面就是我的个人理解,欢迎拍砖.指正: var x = 1 ...
[Dynamics CRM 2016]如何配置多语言显示
1.安装相对应的语言包并安装 2015语言包下载地址:https://www.microsoft.com/en-us/download/details.aspx?id=45014 2016语言包下载地 ...
Android 友盟分享躺过的几个坑，大坑，坑爹啊
前言:公司上线了一个项目,做Android 客户端集成友盟分享,在做得过程中,遇到了下面3个问题,希望其他小伙伴注意. ) 错误1: 1.错误描述我是照着友盟的集成文档一步一步的集成的,做完后,发现 ...
Android studio修改Logcat颜色
Android studio默认的Logcat配色不利于阅读,我们可以修改自定义自己的颜色配置

虚拟机centos6.5 --hadoop2.6集群环境搭建

虚拟机centos6.5 --hadoop2.6集群环境搭建的更多相关文章

随机推荐

热门专题