集群安装配置Hadoop具体图解

集群安装配置Hadoop

集群节点：node4、node5、node6、node7、node8。

详细架构：

node4	Namenode,secondnamenode,jobtracker
node5	Datanode,tasktracker
node6	Datanode,tasktracker
node7	Datanode,tasktracker
node8	Datanode,tasktracker

操作系统为：CentOS release 5.5 (Final)

安装步骤

一、创建Hadoop用户组。

二、安装JDK。

下载安装jdk。安装文件夹例如以下：

watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQveGlhX3l1X21hb19mYQ==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/SouthEast" alt="">

三、改动机器名。改动文件/etc/hosts。例如以下：

四、安装ssh服务。命令：yum install openssh-server。

五、建立ssh无password登陆。

（一）切换到hadoop用户。su – hadoop

（二）创建ssh-key，利用ssh-keygen命令。採用rsa方式生成密钥。命令：ssh-keygen -t rsa -f ~/.ssh/id_rsa,产生公钥：~/.ssh/id_rsa.pub。

（三）将公钥加入至authorized_keys中。命令：

cat ~/.ssh/id_rsa.pub>>~/.ssh/authorized_keys

（四）改动authorized_keys文件权限：

watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQveGlhX3l1X21hb19mYQ==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/SouthEast" alt="">

（五）编辑sshd配置文件/etc/ssh/sshd_confi把#AuthorizedKeysFile .ssh/authorized_keys前面的凝视取消掉。

（六）又一次启动sshd服务。

（七）将authorized_keys文件拷贝到其它节点上（node5——8）。例如以下：

watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQveGlhX3l1X21hb19mYQ==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/SouthEast" alt="">

（八）測试SSH连接。连接时会提示是否连接。按回车后会将此公钥增加至knows_hosts中。命令：

ssh localhost。

连接成功后，记得exit，退出远程机器。

六、将Hadoop相关程序下载上传到node4上。

下载使用的Hadoop版本号为1.2.1。

七、安装配置hadoop

（一）登陆node4，切换hadoop用户。

创建安装文件夹，解压hadoop，命令：

mkdir hadoop_program //创建hadoop安装文件夹。

cp HADOOP/hadoop-1.2.1.tar.gz hadoop_program/ //将hadoop程序cp到hadoop安装文件夹下。

cd hadoop_program/ //cd到该文件夹。

tar -xvf hadoop-1.2.1.tar.gz //解压hadoop程序。

mv hadoop-1.2.1 hadoop //将hadoop文件夹改名字

（二）创建环境Hadoop相关环境变量。

改动conf/hadoop-env.sh。找到#export JAVA_HOME=...，去掉凝视#，然后加上本机的jdk路径（在第二步安装的路径），例如以下：

加入HADOOP_HOME环境变量。命令：vim ~/.bashrc。

加入例如以下：

watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQveGlhX3l1X21hb19mYQ==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/SouthEast" alt="">

（三）改动Hadoop配置文件

改动conf/core-site.xml文件。

改动mapred-site.xml文件

改动hdfs-site.xml

改动masters文件

改动slaves文件

八将配置好的Hadoop和jdk拷贝到其它节点上：

watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQveGlhX3l1X21hb19mYQ==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/SouthEast" alt="">

九。启动hadoop測试是否成功安装。

命令：hadoop namenode -format（首先格式化namenode）。

命令：start-all.sh （启动hadoop）。

命令：cd到jdk的bin文件夹下。

执行jps命令。察看：

node4：

执行正常。

Node5-8:

执行正常。

十。

遇到问题。

1、安装的过程发现node5-8无法启动datanode和tasktracker，后来发现原由于node5-8机器中已经执行了java程序。用ps -ef|grep java察看，关闭相关进程后，再启动hadoop后正常。

2、使用过程中。出现错误：Bad connect ack with firstBadLink，解决的方法：

1) '/etc/init.d/iptables stop' -->stopped firewall

2) SELINUX=disabled in '/etc/selinux/config' file.-->disabled selinux

集群安装配置Hadoop具体图解的更多相关文章

CentOS下Hadoop-2.2.0集群安装配置
对于一个刚开始学习Spark的人来说,当然首先需要把环境搭建好,再跑几个例子,目前比较流行的部署是Spark On Yarn,作为新手,我觉得有必要走一遍Hadoop的集群安装配置,而不仅仅停留在本地 ...
hbase单机环境的搭建和完全分布式Hbase集群安装配置
HBase 是一个开源的非关系(NoSQL)的可伸缩性分布式数据库.它是面向列的,并适合于存储超大型松散数据.HBase适合于实时,随机对Big数据进行读写操作的业务环境. @hbase单机环境的搭建 ...
hive集群安装配置
hive 是JAVA写的的一个数据仓库,依赖hadoop.没有安装hadoop的,请参考http://blog.csdn.net/lovemelovemycode/article/details/91 ...
spark集群安装配置
spark集群安装配置一. Spark简介 Spark是一个通用的并行计算框架,由UCBerkeley的AMP实验室开发.Spark基于map reduce 算法模式实现的分布式计算,拥有Hadoo ...
hbase和ZooKeeper集群安装配置
一:ZooKeeper集群安装配置 1:解压zookeeper-3.3.2.tar.gz并重命名为zookeeper. 2:进入~/zookeeper/conf目录: 拷贝zoo_sample.cfg ...
Hadoop2.2集群安装配置-Spark集群安装部署
配置安装Hadoop2.2.0 部署spark 1.0的流程一.环境描写叙述本实验在一台Windows7-64下安装Vmware.在Vmware里安装两虚拟机分别例如以下主机名spark1(19 ...
(Linux环境Kafka集群安装配置及常用命令
Linux环境Kafka集群安装配置及常用命令 Kafka 消息队列内部实现原理 Kafka架构一.下载Kafka安装包二.Kafka安装包的解压三.设置环境变量四.配置kafka文件 4.1 ...
原创：centos7.1下 ZooKeeper 集群安装配置+Python实战范例
centos7.1下 ZooKeeper 集群安装配置+Python实战范例下载:http://apache.fayea.com/zookeeper/zookeeper-3.4.9/zookeepe ...
RabbitMQ集群安装配置+HAproxy+Keepalived高可用
RabbitMQ集群安装配置+HAproxy+Keepalived高可用转自:https://www.linuxidc.com/Linux/2016-10/136492.htm rabbitmq 集 ...

随机推荐

JavaScripts+jquery
选择器参数 element 一个用于搜索的元素.指向DOM节点的标签名. <div>div1</div> <div>div2</div> <sp ...
iOS显示PDF
使用UIWebView来显示 //locale file NSString *html = [NSString stringWithContentsOfFile:path1 encoding:NSUT ...
vagrant 使用方法
0.介绍 Vagrant 是一款用来构建虚拟开发环境的工具,非常适合 php/python/ruby/java 这类语言开发 web 应用,"代码在我机子上运行没有问题"这种说辞将 ...
gdb图形化调试工具总结
gdb除了命令行方式等的调试之外,还有图形化的调试工具,下面列举一些供参考 1:insight 2: ddd 3: kgdb 4: xxgdb 其它的工具欢迎补充
Uva 11694 Gokigen Naname
基本思路是Dfs: 1. 一个一个格子摆放,以每个各自的左上角的点为基准点代表格子,比如(0,0)代表(0,0)(0,1)(1,0)(1,1)组成的格子,(0,1)代表(0,1)(0,2)(1,1), ...
Java学习之自定义异常
1 package com.gh; import java.util.Scanner; /** * 自定义异常 * @author ganhang * */ public class Exceptio ...
CoreAnimation —— CALayer
概述如上篇博文讲述,UIView中封装了很多系统方法,可以满足我们的大部分需求.但是,其也有很多限制.那些方法产生的动画基本单元为UIView,是非常重量级的对象,而且也不支持三维布局,大部分是对视 ...
MVC自定义AuthorizeAttribute实现权限管理
[转]MVC自定义AuthorizeAttribute实现权限管理原文载自:小飞的DD http://www.cnblogs.com/feiDD/articles/2844447.html 网站的权 ...
iOS 文件操作：沙盒（SandBox）、文件操作（FileManager）、程序包（NSBundle）
版权声明:本文为博主原创文章,转载请声明出处:http://blog.csdn.net/jinnchang 1.沙盒机制介绍 iOS 中的沙盒机制(SandBox)是一种安全体系.每个 iOS 应用程 ...
git阶段学习总结
学习git大约有两个星期了,脑子里总算有点干货了,可以拿出来总结一下: git,用于版本控制的,刚开始觉得它是linux下默认的命令,其实也是个工具需要apt-get install git 安装一下 ...

集群安装配置Hadoop具体图解

集群安装配置Hadoop具体图解的更多相关文章

随机推荐

热门专题