Hadoop-2.6.0 集群的 安装与配置
1. 配置节点bonnie1 hadoop环境
(1) 下载hadoop- 2.6.0 并解压缩
[root@bonnie1 ~]# wget http://apache.fayea.com/hadoop/common/hadoop-2.6.0/hadoop-2.6.0.tar.gz -C /usr/local
[root@bonnie1 ~]# cd /usr/local/
[root@bonnie1 local]# tar -xvf hadoop-2.6.0.tar
(2) 配置环境变量
[root@bonnie1 local]# vi /etc/profile
export JAVA_HOME=/usr/local/jdk1.7.0_79
export HADOOP_HOME=/usr/local/hadoop-2.6.0
export HADOOP_COMMON_HOME=$HADOOP_HOME
export HADOOP_HDFS_HOME=$HADOOP_HOME
export HADOOP_MAPRED_HOME=$HADOOP_HOME
export HADOOP_YARN_HOME=$HADOOP_HOME
export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop
export HADOOP_COMMON_LIB_NATIVE_DIR=$HADOOP_HOME/lib/native
export HADOOP_OPTS="-Djava.library.path=$HADOOP_HOME/lib"
export ZOOKEEPER_HOME=/usr/local/zookeeper-3.4.6
export PATH=$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$ZOOKEEPER_HOME/bin:$ZOOKEEPER_HOME/conf:$PATH
export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar
[root@bonnie1 local]# cd hadoop-2.6.0/etc/hadoop/
[root@bonnie1 hadoop]# vi hadoop-env.sh
# 追加如下字段
export JAVA_HOME=/usr/local/jdk1.7.0_79
export HADOOP_PREFIX=/usr/local/hadoop-2.6.0
[root@bonnie1 hadoop]# vi core-site.xml
<configuration>
<property>
<name>fs.defaultFS</name>
<value>hdfs://ns1</value>
</property>
<property>
<name>hadoop.tmp.dir</name>
<value>/usr/local/hadoop-2.6.0/tmp</value>
</property>
<property>
<name>ha.zookeeper.quorum</name>
<value>bonnie1:2181,bonnie2:2181,bonnie3:2181</value>
</property>
</configuration>
[root@bonnie1 hadoop]# vi hdfs-site.xml
<configuration>
<property>
<name>dfs.nameservices</name>
<value>ns1</value>
</property>
<property>
<name>dfs.ha.namenodes.ns1</name>
<value>nn1,nn2</value>
</property>
<property>
<name>dfs.namenode.rpc-address.ns1.nn1</name>
<value>bonnie1:9000</value>
</property>
<property>
<name>dfs.namenode.http-address.ns1.nn1</name>
<value>bonnie1:50070</value>
</property>
<property>
<name>dfs.namenode.rpc-address.ns1.nn2</name>
<value>bonnie2:9000</value>
</property>
<property>
<name>dfs.namenode.http-address.ns1.nn2</name>
<value>bonnie2:50070</value>
</property>
<property>
<name>dfs.namenode.shared.edits.dir</name>
<value>qjournal://bonnie1:8485;bonnie2:8485;bonnie3:8485/ns1</value>
</property>
<property>
<name>dfs.journalnode.edits.dir</name>
<value>/usr/local/hadoop-2.6.0/journal</value>
</property>
<property>
<name>dfs.ha.automatic-failover.enabled</name>
<value>true</value>
</property>
<property>
<name>dfs.client.failover.proxy.provider.ns1</name>
<value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>
</property>
<property>
<name>dfs.ha.fencing.methods</name>
<value>
sshfence
shell(/bin/true)
</value>
</property>
<property>
<name>dfs.ha.fencing.ssh.private-key-files</name>
<value>/root/.ssh/id_rsa</value>
</property>
<property>
<name>dfs.ha.fencing.ssh.connect-timeout</name>
<value>30000</value>
</property>
</configuration>
[root@bonnie1 hadoop]# vi mapred-site.xml
<configuration>
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
</configuration>
[root@bonnie1 hadoop]# vi yarn-site.xml
<configuration>
<property>
<name>yarn.resourcemanager.hostname</name>
<value>bonnie3</value>
</property>
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
</configuration>
[root@bonnie1 hadoop]# vi slaves
bonnie1
bonnie2
bonnie3
2. 将配置好的hadoop文件拷贝到其他几个节点
[root@bonnie1 hadoop]# cd /usr/local
[root@bonnie1 local]# scp -r hadoop-2.6.0 bonnie2:/usr/local/
3. 集群初始化
(1) #启动 zookeeper ,zookeeper 安装见上一篇 zookeeper 安装与配置
[root@bonnie1 hadoop]# cd /usr/local/zookeeper-3.4.6/bin/
[root@bonnie1 bin]# ./zkServer.sh start
[root@bonnie2 hadoop]# cd /usr/local/zookeeper-3.4.6/bin/
[root@bonnie2 bin]# ./zkServer.sh start
[root@bonnie3 hadoop]# cd /usr/local/zookeeper-3.4.6/bin/
[root@bonnie3 bin]# ./zkServer.sh start
# 查看 zookeeper 状态
[root@bonnie1 bin]# ./zkServer.sh status
[root@bonnie2 bin]# ./zkServer.sh status
[root@bonnie3 bin]# ./zkServer.sh status
一个leader,两个follower
(2) 启动journalnode
* 分别在bonnie1、bonnie2、bonnie3上执行启动命令
[root@bonnie1 ~]# cd /usr/local/hadoop-2.6.0/sbin
[root@bonnie1 sbin]# ./hadoop-daemon.sh start journalnode
[root@bonnie2 sbin]# ./hadoop-daemon.sh start journalnode
[root@bonnie3 sbin]# ./hadoop-daemon.sh start journalnode
* 运行jps命令检验是否存在启动进程JournalNode
[root@bonnie1 sbin]# jps
5335 JournalNode
7303 Jps
3124 QuorumPeerMain
(3) 格式化HDFS
* 在节点bonnie1上执行格式化命令
[root@bonnie3 sbin]# hdfs namenode -format
# 出现如下日志表示成功
16/12/04 14:19:38 INFO common.Storage: Storage directory /usr/local/hadoop-2.6.0/tmp/dfs/name has been successfully formatted.
HA两节点保持同步,将invin01上的tmp目录拷贝到invin02节点
格式化后会在根据core-site.xml中的hadoop.tmp.dir配置生成个文件,这里我配置的是/usr/local/hadoop-2.6.0/tmp,然后将/usr/local/hadoop-2.6.0/tmp拷贝到bonnie2的/usr/local/hadoop-2.6.0/下
[root@bonnie1 hadoop-2.6.0]# scp -r tmp/ bonnie2:/usr/local/hadoop-2.6.0/
(4) 格式化ZK
[root@bonnie1 hadoop-2.6.0]# hdfs zkfc -formatZK
# 出现如下日志表示成功
16/12/04 14:20:48 INFO ha.ActiveStandbyElector: Successfully created /hadoop-ha/ns1 in ZK.
4. 启动集群
(1) jps (kill -9 [进程号])关闭(除QuorumPeerMain)所有进程
(2) 启动HDFS(在bonnie1上执行)
sbin/start-dfs.sh
(3) 启动YARN(在bonnie3上执行)
sbin/start-yarn.sh
5. hadoop-2.6.0集群配置完毕,通过浏览器访问验证
http://10.211.55.21:50070
NameNode 'bonnie1:9000' (active)
http://10.211.55.22:50070
NameNode 'bonnie2:9000' (standby)
http://10.211.55.23:8088
6. HDFS测试-上传下载文件
hadoop fs -mkdir /tmp/input #在HDFS上新建文件夹
hadoop fs -put input1.txt /tmp/input #把本地文件input1.txt传到HDFS的/tmp/input目录
hadoop fs -get input1.txt /tmp/input/input1.txt #把HDFS文件拉到本地
hadoop fs -ls /tmp/output #列出HDFS的某目录
hadoop fs -cat /tmp/ouput/output1.txt #查看HDFS上的文件
hadoop fs -rm -r /home/less/hadoop/tmp/output #删除HDFS上的目录
# 查看HDFS状态,比如有哪些datanode,每个datanode的情况
hadoop dfsadmin -report
hadoop dfsadmin -safemode leave # 离开安全模式
hadoop dfsadmin -safemode enter # 进入安全模式
7. YARN测试-WordCount
vi test.csv
hello tomcat
help yumily
cat bonnie
上传测试数据文件
hadoop fs -put test.csv /
运行wordcount
cd hadoop-2.6.0/share/hadoop/mapreduce/
hadoop jar hadoop-mapreduce-examples-2.6.0.jar wordcount /test.csv /out
8. Hadoop启动与关闭流程
(1) 启动流程
分别在bonnie1,bonnie2,bonnie3上执行启动命令
[root@bonnie1 ~]# cd /usr/local/zookeeper-3.4.6/bin/
[root@bonnie1 bin]# ./zkServer.sh start
(2) 查看各ZK节点状态
[root@bonnie1 bin]# ./zkServer.sh status
一个leader,两个follower
(3) 启动HDFS(在invin01上执行)
[root@bonnie1 hadoop-2.6.0]# sbin/start-dfs.sh
(4) 启动YARN
[root@bonnie1 hadoop-2.6.0]# sbin/start-yarn.sh
9 关闭流程
(1)关闭HDFS(在invin01上执行)
[root@bonnie1 hadoop-2.6.0]#sbin/stop-dfs.sh
(2)关闭YARN(在invin03上执行)
[root@bonnie1 hadoop-2.6.0]# sbin/stop-yarn.sh
(3)关闭ZK(在invin04,invin05,invin06上执行)
[root@bonnie1 hadoop-2.6.0]# cd /home/hduser/zookeeper-3.4.6/bin/
[root@bonnie1 bin]# ./zkServer.sh stop
Hadoop-2.6.0 集群的 安装与配置的更多相关文章
- hadoop 2.2.0集群安装详细步骤(简单配置,无HA)
安装环境操作系统:CentOS 6.5 i586(32位)java环境:JDK 1.7.0.51hadoop版本:社区版本2.2.0,hadoop-2.2.0.tar.gz 安装准备设置集群的host ...
- Ubuntu 12.04下Hadoop 2.2.0 集群搭建(原创)
现在大家可以跟我一起来实现Ubuntu 12.04下Hadoop 2.2.0 集群搭建,在这里我使用了两台服务器,一台作为master即namenode主机,另一台作为slave即datanode主机 ...
- hadoop 2.2.0 集群部署 坑
注意fs.defaultFS为2..0新的变量,代替旧的:fs.default.name hadoop 2.2.0 集群启动命令:bin/hdfs namenode -formatsbin/start ...
- ZooKeeper 集群的安装、配置---Dubbo 注册中心
ZooKeeper 集群的安装.配置.高可用测试 Dubbo 注册中心集群 Zookeeper-3.4.6 Dubbo 建议使用 Zookeeper 作为服务的注册中心. Zookeeper 集群中只 ...
- Dubbo入门到精通学习笔记(十四):ActiveMQ集群的安装、配置、高可用测试,ActiveMQ高可用+负载均衡集群的安装、配置、高可用测试
文章目录 ActiveMQ 高可用集群安装.配置.高可用测试( ZooKeeper + LevelDB) ActiveMQ高可用+负载均衡集群的安装.配置.高可用测试 准备 正式开始 ActiveMQ ...
- Dubbo入门到精通学习笔记(十三):ZooKeeper集群的安装、配置、高可用测试、升级、迁移
文章目录 ZooKeeper集群的安装.配置.高可用测试 ZooKeeper 与 Dubbo 服务集群架构图 1. 修改操作系统的/etc/hosts 文件,添加 IP 与主机名映射: 2. 下载或上 ...
- hadoop 2.2.0集群安装
相关阅读: hbase 0.98.1集群安装 本文将基于hadoop 2.2.0解说其在linux集群上的安装方法,并对一些重要的设置项进行解释,本文原文链接:http://blog.csdn.net ...
- 在Hadoop-2.2.0集群上安装 Hive-0.13.1 with MySQL
fesh个人实践,欢迎经验交流!本文Blog地址:http://www.cnblogs.com/fesh/p/3872872.html 软件环境 操作系统:Ubuntu14.04 JDK版本:jdk1 ...
- 大数据高可用集群环境安装与配置(06)——安装Hadoop高可用集群
下载Hadoop安装包 登录 https://mirrors.tuna.tsinghua.edu.cn/apache/hadoop/common/ 镜像站,找到我们要安装的版本,点击进去复制下载链接 ...
随机推荐
- 获取WINDOW.OPEN url js中的get取值
function getUrlParam(name) { var reg = new RegExp("(^|&)" + name + "=([^&]*)( ...
- 转 SVN 在vs中的使用
给大家介绍一些SVN的入门知识!希望对大家的学习起到作用! 关于SVN与CVS的相关知识,大家可以自己去google一下. 一.准备 SVN是一个开源的版本控制系统 ...
- error C2065: 'INVALID_SET_FILE_POINTER' : undeclared identifier
Searching MSDN for that constant brings up one result: it's a failure code for SetFilePointer() and ...
- each处理json数据
eg:给传进来的ID中当其对应的值为true时,即给对应的ID标签添加一个class 名为 focus,如: var obj = { id01:'true', id02:'flase', id03: ...
- phpmyadmin连接,管理多个mysql服务器
方法一,修改phpMyAdmin/libraries/config.default.php 修改配置文件前,最好先备份一下,万一改错地方了,显示不了,就郁闷了. /** * allow login t ...
- php包含(include/require)文件时的作用域
当一个php脚本被require/include时,他的变量作用域根据其上下文环境决定. 1.如果是在一个函数中require/include一个文件,则此文件中的变量作用域是这个函数的范围.也就是说 ...
- 边表+SPFA
传说中效率很NB的单元最短路径算法,传说中时间复杂度为O(kE),k为长度,平均值为2,不知道这话是谁说的,一说流传oi界几年了 边表就是数组模拟邻接表,没学会很难,学会很简单的样子啊 #includ ...
- redis pipeline
redis pipeline 简而言之就是把多个redis命令打包,一起发送给redis server,并且一起返回结果,减少客户端和服务器之间的多次“折返跑”
- [转]Caffe 深度学习框架上手教程
Caffe 深度学习框架上手教程 机器学习Caffe caffe 原文地址:http://suanfazu.com/t/caffe/281 blink 15年1月 6 Caffe448是一个清 ...
- 计算机图形学——OpenGL开发库开发库
vc++6.0 有 OpenGL 的东西.有头文件 GL.H, GLAUX.H, GLU.H 但没有 GLUT 软件包/工具包 如果想使用glut.h的话必须自己添加. 首先下载 OpenGL开发库, ...