hadoop 1.2 集群搭建与环境配置

一、虚拟机环境

见我的另一篇博客http://www.cnblogs.com/xckk/p/6000881.html，

需要安装JDK环境，centos下安装JDK可参考：

http://www.centoscn.com/image-text/install/2014/0827/3585.html

注意三台机器均要配置，因为启动时，namenode会启动其它机器。

二、hadoop环境

hadoop1.2.1

idk7u79-linux-i586.tar.gz

三、开始搭完全分布式hadoop

三台机器，角色配置如下

hostname	角色配置
centos1	namenode
centos2	datanode, secondaryNameNode
centos3	datanode

1、hadoop配置

分别在三台虚拟机内拷贝hadoop-1.2.1.tar.gz，并解压: tar -zxvf hadoop-1.2.1.tar.gz

conf目录文件配置

conf目录下文件	配置项	备注
core-site.xml	<configuration> <property> <name>fs.default.name</name> <value>hdfs://centos:9000</value> </property> <property> <name>hadoop.tmp.dir</name> <value>/opt/hadoop-tmp</value> </property> </configuration>	1、fs.default.name：配置namenode站点地址。需要注意。9000端口是hdfs rpc协议端口，如果从浏览器访问，则是http协议，端口号是50070.例：http://cetnos:50070 2、hadoop.tmp.dir默认配置/tmp/hadoop-${user.name},hadoop文件数据会默认配置在此目录，由于tmp目录，linux重启后自动清空，因此这里对hadoop.tmp.dir进行手动指定。
hadoop-env.sh	export JAVA_HOME=/usr/local/java/jdk1.7.0_79	配置jdk时在系统配置了JAVA_HOME,但是hadoop不认，必须要在这里修改成你现在的路径。
hdfs-site.xml	<configuration> <property> <name>dfs.replication</name> <value>2</value> </property> </configuration>	lock最大附本数，配置2台dataNode,此处填2.
masters	centos1	master文件用来配置secondaryNameNod, 注意是secondaryNameNode,不是nameNode
slaves	centos1 centos2 (一个节点一行)	slaves用来配置dataNode

2、格式化dfs

cd /home/hadoop-1.2/bin/

./hadoop namenode -format (格式化成功后会在/opt/hadoop-tmp/dfs/name/下生成格式化文件)

3、hadoop路径每台机器要保持一致

配置完成后，NameNode机器上输入命令,即可完成hadoopo的hdfs分布式服务的启动。

root@centos bin]# ./start-dfs.sh

4、启动后结果

在浏览器中输入http://｛NameNode IP}:50070即可访问配置的hdfs环境

四、配置中常见问题

1、JAVA_HOME is not set.

错误日志：

root@centos bin]# ./start-dfs.sh

starting namenode, logging to /home/alvin/hadoop-1.2.1/libexec/../logs/hadoop-root-namenode-centos.out

centos1: bash: line 0: cd: /home/alvin/hadoop-1.2.1/libexec/..: No such file or directory

centos2: bash: line 0: cd: /home/alvin/hadoop-1.2.1/libexec/..: No such file or directory

centos2: starting datanode, logging to /opt/hadoop-1.2/libexec/../logs/hadoop-root-datanode-centos2.out

centos1: starting datanode, logging to /usr/hadoop-1.2.1/libexec/../logs/hadoop-root-datanode-centos1.out

centos2: Error: JAVA_HOME is not set.

centos1: Error: JAVA_HOME is not set.

centos1: bash: line 0: cd: /home/alvin/hadoop-1.2.1/libexec/..: No such file or directory

centos1: starting secondarynamenode, logging to /usr/hadoop-1.2.1/libexec/../logs/hadoop-root-secondarynamenode-centos1.out

centos1: Error: JAVA_HOME is not set.

产生原因三种：

(1)、JDK未配置

解决方法：配置JDK解决，可参考

http://www.centoscn.com/image-text/install/2014/0827/3585.html

(2)、hadoop在每台机器路径不一致，会报JAVA_HOME is not set.问题

该问题首先会想到centos1, centos2两台机器JDK环境是否有配置JAVA_HOME，但是查看均已配了JDK环境。

仔细阅读日志，发现问题是No such file or directory

centos1: bash: line 0: cd: /home/alvin/hadoop-1.2.1/libexec/..: No such file or directory

centos2: bash: line 0: cd: /home/alvin/hadoop-1.2.1/libexec/..: No such file or directory

解决方法：hadoop在每台机器配置路径要一致

(3)、hadoop-env.sh里面没有配置JAVA_HOME

解决方法：配置jdk时在系统配置了JAVA_HOME,但是hadoop不认，必须要在这里修改成你现在的路径。

分析原因：

由于centos1下hadoop路径在/home/alvin/hadoop-1.2.1/下，centos2与centos3路径在/opt/hadoop-1.2/下，

启动datanode或secondaryNameNode节点时，报No such file or directory.

可以看到centos2与centos3都是按照centos1机器的hadoop路径去读取文件的。因此报 No such file or directory

2、启动dfs服务时，jps命令查看，NameNode启动，DataNode和SecondaryNameNode未启动。

防火墙未关，输入命令service iptables stop关闭三台机器防火墙

3、org.apache.hadoop.security.AccessControlException

解决方法

在 hdfs-site.xml 添加参数：

<property>
<name>dfs.permissions</name>
<value>false</value>
</property>
</configuration>

4、org.apache.hadoop.hdfs.server.datanode.DataNode: java.io.IOException: Incompatible namespaceIDs in /opt/hadoop-tmp/dfs/data: namenode namespaceID = 1165565627; datanode namespaceID = 1468616188

解决方法：以name为准，将namenode节点上${hadoop-tmp}/hfs/data/current/VERSION文件的namespaceID改为${hadoop-tmp}/hfs/name/current/VERSION文件的namespaceID。同时将datanode节点上的${hadoop-tmp}/hfs/data/current/VERSION文件的namespaceID相应修改

5、org.apache.hadoop.hdfs.server.datanode.DataNode: All directories in dfs.data.dir are invalid

发生错误的原因就是hdfs下的data文件夹权限设置错误，应为rwxr-xr-x，因此修改方式如下：

解决方法：chmod 755 /opt/hadoop-tmp/ –R

6、ERROR security.UserGroupInformation: PriviledgedActionException as:alvin cause:java.net.ConnectException: Call to 192.168.95.134/192.168.95.134:9091 failed on connection exception: java.net.ConnectException: Connection refused

java.net.ConnectException: Call to 192.168.95.134/192.168.95.134:9091 failed on connection exception: java.net.ConnectException: Connection refused

at org.apache.hadoop.ipc.Client.wrapException(Client.java:1142)

解决方法：确认IP和端口号是否正确，mapreduce端口号是9001，这里是9091.所以报错

7、启动hadoop时，log中出现：java.io.IOException: NameNode is not formatted.

解决方法：初始化namenode

./hadoop namenode –format

秀才坤坤出品

转载请注明源链接地址：http://www.cnblogs.com/xckk/p/6124553.html

hadoop 1.2 集群搭建与环境配置的更多相关文章

Hadoop集群搭建-02安装配置Zookeeper
Hadoop集群搭建-05安装配置YARN Hadoop集群搭建-04安装配置HDFS Hadoop集群搭建-03编译安装hadoop Hadoop集群搭建-02安装配置Zookeeper Hado ...
hadoop高可用集群搭建小结
hadoop高可用集群搭建小结1.Zookeeper集群搭建2.格式化Zookeeper集群 (注:在Zookeeper集群建立hadoop-ha,amenode的元数据)3.开启Journalmno ...
Hadoop集群搭建-05安装配置YARN
Hadoop集群搭建-04安装配置HDFS Hadoop集群搭建-03编译安装hadoop Hadoop集群搭建-02安装配置Zookeeper Hadoop集群搭建-01前期准备先保证集群5台虚 ...
Hadoop集群搭建-04安装配置HDFS
Hadoop集群搭建-05安装配置YARN Hadoop集群搭建-04安装配置HDFS Hadoop集群搭建-03编译安装hadoop Hadoop集群搭建-02安装配置Zookeeper Hado ...
从零自学Hadoop(06)：集群搭建
阅读目录序集群搭建监控系列索引本文版权归mephisto和博客园共有,欢迎转载,但须保留此段声明,并给出原文链接,谢谢合作. 文章是哥(mephisto)写的,SourceLink 序上一 ...
hadoop伪分布式集群搭建与安装（ubuntu系统）
1:Vmware虚拟软件里面安装好Ubuntu操作系统之后使用ifconfig命令查看一下ip; 2:使用Xsheel软件远程链接自己的虚拟机,方便操作.输入自己ubuntu操作系统的账号密码之后就链 ...
Hadoop介绍及集群搭建
简介 Hadoop 是 Apache 旗下的一个用 java 语言实现开源软件框架,是一个开发和运行处理大规模数据的软件平台.允许使用简单的编程模型在大量计算机集群上对大型数据集进行分布式处理.它的核 ...
Hadoop完全分布式集群搭建
Hadoop的运行模式 Hadoop一般有三种运行模式,分别是: 单机模式(Standalone Mode),默认情况下,Hadoop即处于该模式,使用本地文件系统,而不是分布式文件系统.,用于开发和 ...
大数据之Hadoop完全分布式集群搭建
1.准备阶段 1.1.新建三台虚拟机 Hadoop完全分市式集群是典型的主从架构(master-slave),一般需要使用多台服务器来组建.我们准备3台服务器(关闭防火墙.静态IP.主机名称).如果没 ...

随机推荐

～/.ctag的作用与配置
里边可以有基本配置和语言正则表达式解析的参数 # Basic options --recurse=yes --tag-relative=yes --exclude=.git # Regex for C ...
通过 PHP 判断用户的设备是否是移动设备
<?php function isMobile() { // 如果有HTTP_X_WAP_PROFILE则一定是移动设备 if (isset ($_SERVER['HTTP_X_WAP_PROF ...
【转】Picasso – Android系统的图片下载和缓存类库
来源:http://blog.chengyunfeng.com/?p=492 另一篇参考:http://blog.csdn.net/xu_fu/article/details/17043231 Pic ...
【HDOJ】4373 Mysterious For
1. 题目描述有两种不同类型的循环,并给出一个由1.2组成的序列,表示嵌套的循环类型.问这样组着的循环一共需要多少次循环?并将结果模364875103. 2.基本思路显然,每当遇到一个类型1的序列,即 ...
struts采用JavaServlet/JSP技术，实现了基于Java EEWeb应用的MVC设计模式的应用框架
今天我用Ecipse搭建Struts框架,并且使用Struts框架编写一个最简单的例子,相信读者能够很容易的明白. Struts是当今Java比较流行的三大框架之一,三大框架是Struts,sprin ...
bzoj1305
让我们继续来练网络流: 很明显是一个最大流的问题: 二分枚举最多次数m,然后最大流判定: 具体就是男生女生都拆成两个点i1,i2,之间连一条流量为k的边(男生i1-->i2,女生i2--> ...
tap,touch,touchstart,事件与click事件的区别
根据源码所见, 移动端为了将将单击事件更加灵敏,所以现在的JQM,ST...框架都将JS单击事件封装成tap,或者touch或者touchstart事件, 其实现本质是将click触发多次,以打成移动 ...
VS2010 Chromium编译
推荐使用Windows 7及以后系统,最少8G内存,预留出50G磁盘空间搭建Visual Studio 2010开发环境 1.安装Visual Studio 2010专业版或者旗舰版 2.安装VS2 ...
C#发送简单的HTTP POST请求给传统的ASP网页。
设计思路创建HTTPWebRequest类的一个实例,设置这个对象的Method属性为"POST",ContentType属性为"application/x-/www- ...
清理vs工程文件（python2.7）
本文记录了两种方法,用于对vs目录的清理工作,这两种方法都是用python2.7实现的,一个是基于文件的扩展名,一个是基于文件的大小: 基于文件大小的清理脚本: #-*- coding:utf-8 - ...

hadoop 1.2 集群搭建与环境配置

hadoop 1.2 集群搭建与环境配置的更多相关文章

随机推荐

热门专题