Hadoop 集群安装（主节点安装）

1、下载安装包及测试文档
切换目录到/tmp

view plain copy
cd /tmp
下载Hadoop安装包

view plain copy
wget http://192.168.1.100:60000/hadoop-2.6.0-cdh5.4.5.tar.gz
下载JDK安装包

view plain copy
wget http://192.168.1.100:60000/jdk-7u75-linux-x64.tar.gz
下载实验测试数据

view plain copy
wget http://192.168.1.100:60000/word.txt
2、安装Java JDK
这里安装的版本是jdk-7u75-linux-x64.tar.gz；

当前是普通用户，超级管理员才能对/opt目录进行操作，所有要使用sudo命令获取获取特权才能成功解压；命令将其解压到/opt目录下：

view plain copy
sudo tar -zxvf /tmp/jdk-7u75-linux-x64.tar.gz -C /opt/
并将解压后的文件夹jdk-7u75-linux-x64改名为java：

view plain copy
sudo mv /opt/jdk1.7.0_75 /opt/java
修改java目录的所属用户和所属组：

view plain copy
sudo chown -R zhangyu.zhangyu /opt/java
jdk安装完配置环境变量，编辑/etc/profile：

view plain copy
sudo vim /etc/profile
在文档末端添加如下内容：

view plain copy
export JAVA_HOME=/opt/java
export PATH=$JAVA_HOME/bin:$PATH
刷新环境变量：

view plain copy
source /etc/profile
刷新环境变量后，可以通过java的家目录找到java可使用的命令。利用java查看版本号命令验证是否安装成功：

view plain copy
java -version
正常结果显示如下：

3、Hadoop安装
这里安装的版本是hadoop-2.6.0-cdh5.4.5.tar.gz；命令将其解压到/opt目录下：

view plain copy
sudo tar -zxvf /tmp/hadoop-2.6.0-cdh5.4.5.tar.gz -C /opt/
并将解压后的文件夹hadoop-2.6.0-cdh5.4.5改名为hadoop：

view plain copy
sudo mv /opt/hadoop-2.6.0-cdh5.4.5 /opt/hadoop
修改hadoop目录的所属用户和所属组：

view plain copy
sudo chown -R zhangyu.zhangyu /opt/hadoop
jdk安装完配置环境变量，编辑/etc/profile：

view plain copy
sudo vim /etc/profile
末端添加如下内容：

view plain copy
export HADOOP_HOME=/opt/hadoop
export PATH=$HADOOP_HOME/bin:$PATH
刷新环境变量：

view plain copy
source /etc/profile
利用hadoop查看版本号命令验证是否安装成功：

view plain copy
hadoop version
正常结果显示如下：

4、修改hosts文件
获取网卡信息得命令有：ifconfig 和 ip a ；使用获取网卡信息得命令，查看到当前节点的IP地址；编辑/etc/hosts文件：

view plain copy
sudo vim /etc/hosts
添加本机IP地址对应本机映射名和其它节点IP地址对应映射名：

view plain copy
0.0.0.0 master
0.0.0.0 slave1
0.0.0.0 slave2
节点IP地址即”内网管理地址“

配置完hosts文件，可以通过映射名访问对应的IP地址；

5、创建数据文件夹
view plain copy
sudo mkdir /data
所有者修改为当前用户：

view plain copy
sudo chown -R zhangyu.zhangyu /data
6、修改hadoop hadoop-env.sh文件配置
view plain copy
vim /opt/hadoop/etc/hadoop/hadoop-env.sh
将JAVA_HOME修改成java所在目录：

view plain copy
export JAVA_HOME=/opt/java/
7、修改hadoop core-site.xml文件配置
编辑core-site.xml文件：

view plain copy
vim /opt/hadoop/etc/hadoop/core-site.xml
替换为下面的xml文本：

view plain copy

hadoop.tmp.dir
/data/tmp/hadoop/tmp

fs.defaultFS
hdfs://master:9000/
NameNode URI

这里有两项配置：

一项是hadoop.tmp.dir，配置hadoop处理过程中，临时文件的存储位置。这里的目录/data/需要提前创建。另一项是fs.defaultFS，配置hadoop HDFS文件系统的地址。

8、修改hadoop hdfs-site.xml文件配置
编辑hdfs-site.xml文件：

view plain copy
vim /opt/hadoop/etc/hadoop/hdfs-site.xml
替换为下面的xml文本：

view plain copy

dfs.namenode.name.dir
/data/tmp/hadoop/hdfs/name

dfs.datanode.data.dir
/data/tmp/hadoop/hdfs/data

dfs.replication
1

dfs.permissions
false

配置项说明：

dfs.namenode.name.dir，配置元数据信息存储位置； dfs.datanode.data.dir，配置具体数据存储位置； dfs.replication，配置每个数据库备份数，由于目前我们使用1台节点，所以，设置为1，如果设置为2的话，运行会报错。

9、修改hadoop yarn-site.xml文件配置
编辑yarn-site.xml文件：

view plain copy
vim /opt/hadoop/etc/hadoop/yarn-site.xml
替换为下面的xml文本：

view plain copy

yarn.nodemanager.aux-services
mapreduce_shuffle

这里的配置是指定所用服务。

10、修改hadoop mapred-site.xml文件配置
创建mapred-site.xml文件：

view plain copy
vim /opt/hadoop/etc/hadoop/mapred-site.xml
输入为下面的xml文本：

view plain copy

mapreduce.framework.name
yarn

这里指定mapreduce任务处理所使用的框架。

11、修改hadoop slaves文件配置
view plain copy
vim /opt/hadoop/etc/hadoop/slaves
覆盖写入主节点映射名和从节点映射名：

view plain copy
master
slave1
slave2
12、创建公钥
在zhangyu用户下创建公钥：

view plain copy
ssh-keygen
出现如下内容：

Enter file in which to save the key (/home/zhangyu/.ssh/id_rsa):

直接使用默认选项，回车即可，出现如下内容：

Enter passphrase (empty for no passphrase):

直接回车，出现内容：

Enter same passphrase again:

直接回车，创建完成，结果内容如下：

13、拷贝公钥，过程中需要输入zhangyu用户的密码
view plain copy
ssh-copy-id master
view plain copy
ssh-copy-id slave1
view plain copy
ssh-copy-id slave2
提示：命令执行过程中需要输入“yes”和密码“zhangyu”。三台节点请依次执行完成。

测试连接是否正常：

view plain copy
ssh master
输入exit退出测试：

view plain copy
ssh slave1
输入exit退出测试：

view plain copy
ssh slave2
输入exit退出测试：

测试中可以看出，连接各节点时，无需输入密码，因为已经设置好授权秘钥。

14、拷贝文件到所有从节点
view plain copy
scp -r /opt/java/ /opt/hadoop/ slave1:/tmp/
view plain copy
scp -r /opt/java/ /opt/hadoop/ slave2:/tmp/
至此，主节点配置完成。

以下内容在所有从节点配置完成之后继续进行!
15、格式化分布式文件系统
在hadoop主节点执行：

view plain copy
/opt/hadoop/bin/hadoop namenode -format
16、启动Hadoop
在hadoop主节点执行：

view plain copy
/opt/hadoop/sbin/start-all.sh
执行过程中需要输入“yes”，允许利用公钥连接其它机器。

17、查看Hadoop进程
在hadoop主节点执行：

view plain copy
jps
输出结果必须包含6个进程，结果如下：

在hadoop从节点执行同样的操作：

view plain copy
jps
输出结果必须包含3个进程，具体如下：

18、在命令行中输入以下代码，打开Hadoop WebUI管理界面：
view plain copy
firefox http://master:50070
19、测试HDFS集群以及MapReduce任务程序
利用Hadoop自带的WordCount示例程序进行检查集群；在主节点进行如下操作，创建HDFS目录：

view plain copy
hadoop fs -mkdir /zhangyu/
view plain copy
hadoop fs -mkdir /zhangyu/input
将测试文件上传到到Hadoop HDFS集群目录：

view plain copy
hadoop fs -put /tmp/word.txt /zhangyu/input
执行wordcount程序：

view plain copy
cd /opt/hadoop/share/hadoop/mapreduce/
view plain copy
hadoop jar hadoop-mapreduce-examples-2.6.0-cdh5.4.5.jar wordcount /zhangyu/input/ /zhangyu/out/
查看执行结果：

view plain copy
hadoop fs -ls /zhangyu/out/

如果列表中结果包含”_SUCCESS“文件，代码集群运行成功。

查看具体的执行结果，可以用如下命令：

view plain copy
hadoop fs -text /zhangyu/out/part-r-00000
到此，集群安装完成。

Hadoop 集群安装（主节点安装）的更多相关文章

Spark新手入门——2.Hadoop集群(伪分布模式)安装
主要包括以下三部分,本文为第二部分: 一. Scala环境准备查看二. Hadoop集群(伪分布模式)安装三. Spark集群(standalone模式)安装查看 Hadoop集群(伪分布模式 ...
Hadoop集群搭建-05安装配置YARN
Hadoop集群搭建-04安装配置HDFS Hadoop集群搭建-03编译安装hadoop Hadoop集群搭建-02安装配置Zookeeper Hadoop集群搭建-01前期准备先保证集群5台虚 ...
Hadoop集群搭建-04安装配置HDFS
Hadoop集群搭建-05安装配置YARN Hadoop集群搭建-04安装配置HDFS Hadoop集群搭建-03编译安装hadoop Hadoop集群搭建-02安装配置Zookeeper Hado ...
Hadoop集群搭建-02安装配置Zookeeper
Hadoop集群搭建-05安装配置YARN Hadoop集群搭建-04安装配置HDFS Hadoop集群搭建-03编译安装hadoop Hadoop集群搭建-02安装配置Zookeeper Hado ...
hadoop集群监控工具ambari安装
Apache Ambari是对Hadoop进行监控.管理和生命周期管理的基于网页的开源项目.它也是一个为Hortonworks数据平台选择管理组建的项目.Ambari支持管理的服务有: Apache ...
大数据系列（5）——Hadoop集群MYSQL的安装
前言有一段时间没写文章了,最近事情挺多的,现在咱们回归正题,经过前面四篇文章的介绍,已经通过VMware安装了Hadoop的集群环境,相关的两款软件VSFTP和SecureCRT也已经正常安装了. ...
基于Hadoop集群搭建Hive安装与配置（yum插件安装MySQL）---linux系统《小白篇》
用到的安装包有: apache-hive-1.2.1-bin.tar.gz mysql-connector-java-5.1.49.tar.gz 百度网盘链接: 链接:https://pan.baid ...
Linux下Hadoop集群环境的安装配置
1)安装Ubuntu或其他Linux系统: a)为减少错误,集群中的主机最好安装同一版本的Linux系统,我的是Ubuntu12.04. b)每个主机的登陆用户名也最好都一样,比如都是hadoop,不 ...
Hadoop集群搭建(六)~安装JDK
前面集群的准备工作都做完了,本篇记录安装JDK,版本位1.8 1,在opt目录下创建software和module文件夹:software用来放安装包,module为安装目录 2,把JDK和hadoo ...
Hadoop集群搭建-虚拟机安装(转)(一)
1.软件准备 a).操作系统:CentOS-7-x86_64-DVD-1503-01 b).虚拟机:VMware-workstation-full-9.0.2-1031769(英文原版先安装) VM ...

随机推荐

centOS7在VirtualBox中装好后的网络连接问题
1. 环境物理机OS:Windows 7 虚拟机:VirtualBox 虚拟机OS:CentOS7 2. 虚拟机网络设置 (该部分内容参考于网络,未深究原因,待后续研究补充) 网卡1设置如下图: 网 ...
mysql-视图、触发器、事务、存储过程、流程控制
目录视图触发器事务存储过程流程控制一.视图视图是由查询结果构成的一张虚拟表,和真实的表一样,带有名称的列和行数据强调:视图是永久存储的,但是视图存储的不是数据,只是一条sql语句视图 ...
python正则表达式--分组、后向引用、前(后)向断言
无名.有名分组 (1)正则表达式—无名分组从正则表达式的左边开始看,看到的第一个左括号“(”表示表示第一个分组,第二个表示第二个分组, 依次类推. 需要注意的是,有一个隐含的全局分组(就是索引号为 ...
I - Beautiful People ZOJ - 2319 （二分法）
The most prestigious sports club in one city has exactly N members. Each of its members is strong an ...
How hacker do IT: Tricks Tools and Techniques （翻译）
本资料是 Alex Noordergraaf 企业产品的说明书现在整理如下: 第一部分: How hackers Do It : Tricks Tools and Techniques 本 ...
树链剖分——线段树区间合并bzoj染色
线段树区间合并就挺麻烦了,再套个树链就更加鬼畜,不过除了代码量大就没什么其他的了.. 一些细节:线段树每个结点用结构体保存,pushup等合并函数改成返回一个结构体,这样好写一些 struct Seg ...
python django2.x报错No module named 'django.core.urlresolvers'
解决方法就是: from django.urls import reverse 最近从django1.9迁移到django2.0中出现一个意外的报错: 这个报错的原因在stack overflow上有 ...
饮冰三年-人工智能-Python-25 Django admin
简介:一个关于后台数据库管理的工具 1:创建一个新的项目 2:设置models,并通过命令生成数据库表 from django.db import models class Book(models.M ...
mysql按天，小时，半小时，N分钟，分钟进行数据分组统计
转自:https://blog.csdn.net/u010946448/article/details/83752984#_75
指定的 CGI 应用程序遇到错误，服务器终止了该进程。
遇到这种错误只需要把这个项目的Cookies删除再重新启动就行了

Hadoop 集群安装（主节点安装）

Hadoop 集群安装（主节点安装）的更多相关文章

随机推荐

热门专题