集群安装配置Hadoop具体图解
集群安装配置Hadoop
集群节点:node4、node5、node6、node7、node8。
详细架构:
node4 |
Namenode,secondnamenode,jobtracker |
node5 |
Datanode,tasktracker |
node6 |
Datanode,tasktracker |
node7 |
Datanode,tasktracker |
node8 |
Datanode,tasktracker |
操作系统为:CentOS release 5.5 (Final)
安装步骤
一、创建Hadoop用户组。
二、安装JDK。
下载安装jdk。安装文件夹例如以下:
watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQveGlhX3l1X21hb19mYQ==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/SouthEast" alt="">
三、改动机器名。改动文件/etc/hosts。例如以下:
四、安装ssh服务。命令:yum install openssh-server。
五、建立ssh无password登陆。
(一)切换到hadoop用户。su – hadoop
(二)创建ssh-key,利用ssh-keygen命令。採用rsa方式生成密钥。命令:ssh-keygen -t rsa -f ~/.ssh/id_rsa,产生公钥:~/.ssh/id_rsa.pub。
(三)将公钥加入至authorized_keys中。命令:
cat ~/.ssh/id_rsa.pub>>~/.ssh/authorized_keys
(四)改动authorized_keys文件权限:
watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQveGlhX3l1X21hb19mYQ==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/SouthEast" alt="">
(五) 编辑sshd配置文件/etc/ssh/sshd_confi把#AuthorizedKeysFile .ssh/authorized_keys前面的凝视取消掉。
(六)又一次启动sshd服务。
(七)将authorized_keys文件拷贝到其它节点上(node5——8)。例如以下:
watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQveGlhX3l1X21hb19mYQ==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/SouthEast" alt="">
(八)測试SSH连接。连接时会提示是否连接。按回车后会将此公钥增加至knows_hosts中。命令:
ssh localhost。
连接成功后,记得exit,退出远程机器。
六、将Hadoop相关程序下载上传到node4上。
下载使用的Hadoop版本号为1.2.1。
七、安装配置hadoop
(一)登陆node4,切换hadoop用户。
创建安装文件夹,解压hadoop,命令:
mkdir hadoop_program //创建hadoop安装文件夹。
cp HADOOP/hadoop-1.2.1.tar.gz hadoop_program/ //将hadoop程序cp到hadoop安装文件夹下。
cd hadoop_program/ //cd到该文件夹。
tar -xvf hadoop-1.2.1.tar.gz //解压hadoop程序。
mv hadoop-1.2.1 hadoop //将hadoop文件夹改名字
(二)创建环境Hadoop相关环境变量。
改动conf/hadoop-env.sh。找到#export JAVA_HOME=...,去掉凝视#,然后加上本机的jdk路径(在第二步安装的路径),例如以下:
加入HADOOP_HOME环境变量。命令:vim ~/.bashrc。
加入例如以下:
watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQveGlhX3l1X21hb19mYQ==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/SouthEast" alt="">
(三)改动Hadoop配置文件
改动conf/core-site.xml文件。
改动mapred-site.xml文件
改动hdfs-site.xml
改动masters文件
改动slaves文件
八 将配置好的Hadoop和jdk拷贝到其它节点上:
watermark/2/text/aHR0cDovL2Jsb2cuY3Nkbi5uZXQveGlhX3l1X21hb19mYQ==/font/5a6L5L2T/fontsize/400/fill/I0JBQkFCMA==/dissolve/70/gravity/SouthEast" alt="">
九。启动hadoop測试是否成功安装。
命令:hadoop namenode -format(首先格式化namenode)。
命令:start-all.sh (启动hadoop)。
命令:cd到jdk的bin文件夹下。
执行jps命令。察看:
node4:
执行正常。
Node5-8:
执行正常。
十。
遇到问题。
1、安装的过程发现node5-8无法启动datanode和tasktracker,后来发现原由于node5-8机器中已经执行了java程序。用ps -ef|grep java察看,关闭相关进程后,再启动hadoop后正常。
2、使用过程中。出现错误:Bad connect ack with firstBadLink,解决的方法:
1) '/etc/init.d/iptables stop' -->stopped firewall
2) SELINUX=disabled in '/etc/selinux/config' file.-->disabled selinux
集群安装配置Hadoop具体图解的更多相关文章
- CentOS下Hadoop-2.2.0集群安装配置
对于一个刚开始学习Spark的人来说,当然首先需要把环境搭建好,再跑几个例子,目前比较流行的部署是Spark On Yarn,作为新手,我觉得有必要走一遍Hadoop的集群安装配置,而不仅仅停留在本地 ...
- hbase单机环境的搭建和完全分布式Hbase集群安装配置
HBase 是一个开源的非关系(NoSQL)的可伸缩性分布式数据库.它是面向列的,并适合于存储超大型松散数据.HBase适合于实时,随机对Big数据进行读写操作的业务环境. @hbase单机环境的搭建 ...
- hive集群安装配置
hive 是JAVA写的的一个数据仓库,依赖hadoop.没有安装hadoop的,请参考http://blog.csdn.net/lovemelovemycode/article/details/91 ...
- spark集群安装配置
spark集群安装配置 一. Spark简介 Spark是一个通用的并行计算框架,由UCBerkeley的AMP实验室开发.Spark基于map reduce 算法模式实现的分布式计算,拥有Hadoo ...
- hbase和ZooKeeper集群安装配置
一:ZooKeeper集群安装配置 1:解压zookeeper-3.3.2.tar.gz并重命名为zookeeper. 2:进入~/zookeeper/conf目录: 拷贝zoo_sample.cfg ...
- Hadoop2.2集群安装配置-Spark集群安装部署
配置安装Hadoop2.2.0 部署spark 1.0的流程 一.环境描写叙述 本实验在一台Windows7-64下安装Vmware.在Vmware里安装两虚拟机分别例如以下 主机名spark1(19 ...
- (Linux环境Kafka集群安装配置及常用命令
Linux环境Kafka集群安装配置及常用命令 Kafka 消息队列内部实现原理 Kafka架构 一.下载Kafka安装包 二.Kafka安装包的解压 三.设置环境变量 四.配置kafka文件 4.1 ...
- 原创:centos7.1下 ZooKeeper 集群安装配置+Python实战范例
centos7.1下 ZooKeeper 集群安装配置+Python实战范例 下载:http://apache.fayea.com/zookeeper/zookeeper-3.4.9/zookeepe ...
- RabbitMQ集群安装配置+HAproxy+Keepalived高可用
RabbitMQ集群安装配置+HAproxy+Keepalived高可用 转自:https://www.linuxidc.com/Linux/2016-10/136492.htm rabbitmq 集 ...
随机推荐
- BZOJ 1225: [HNOI2001] 求正整数( dfs + 高精度 )
15 < log250000 < 16, 所以不会选超过16个质数, 然后暴力去跑dfs, 高精度计算最后答案.. ------------------------------------ ...
- 一、Linux启动过程详解
启动第一步--加载BIOS当你打开计算机电源,计算机会首先加载BIOS信息,BIOS信息是如此的重要,以至于计算机必须在最开始就找到它.这是因为BIOS中包含了CPU的相关信息.设备启动顺序信息.硬盘 ...
- 我的Python成长之路---第六天---Python基础(18)---2016年2月20日(晴)
os模块 提供对操作系统进行调用的接口 >>> import os >>> os.getcwd() # 获取当前工作目录,类似linux的pwd命令 '/data/ ...
- 转: RequireJS Optimizer 的使用和配置方法
RequireJS Optimizer 是 RequireJS 自带的前端优化工具,可以对 RequireJS 项目中的JavaScript和CSS 代码使用 UglifyJS 或者 Closure ...
- logback自定义格式转换器
创建自定义格式转换符有两步. 首先,必须继承ClassicConverter类.ClassicConverter对象负责从ILoggingEvent 提取信息,并产生一个字符串.例如,LoggerCo ...
- ST官方翻译的中文应用笔记汇总
ST官方翻译的中文应用笔记汇总 http://www.51hei.com/stm32/3382.html 官方中文AN:AN3116:STM32? 的 ADC 模式及其应用AN1015:用于提高微控制 ...
- 配置greenplum参数
在进行一个greenplum安装之前需要进行配置一下相关的系统参数,否则很容易出现意想不到的错误. 1.修改系统参数 编辑 /etc/sysctl.conf ,以下是最小配置 kernel.shmma ...
- java String 怎么看里面有几个指定字符
我现在有一个String 字符串,我想看一下这个字符串里有几个指定的字符,比如指定字符是div求解 public class Main { public static void main(String ...
- JVM -- 类的初始化
<深入理解Java虚拟机> 第二版中介绍到了类的加载过程. 一个类从加载入内存到卸载出内存为止,整个生命周期包括: Loading(加载)-----Verification(验证)---- ...
- onekey_fourLED
也许我们刚开始用到开发板的时候都会去做跑马灯的程序,后来给我们的要求是,如果硬件接口有限制,只有一个key 或者是button—— 我们的板子上是button,让你用一个button去控制这四个led ...