Centos7 搭建 hadoop3.1.1 集群教程

配置环境要求：

Centos7
jdk 8
Vmware 14 pro
hadoop 3.1.1

Hadoop下载

安装4台虚拟机，如图所示

克隆之后需要更改网卡选项，ip，mac地址，uuid
重启网卡:
为了方便使用，操作时使用的root账户

设置机器名称

再使用hostname命令，观察是否更改

类似的，更改其他三台机器hdp-02、hdp-03、hdp-04。

在任意一台机器Centos7上修改域名映射
1. vi /etc/hosts
2. 修改如下
3. 使用scp命令发送其他克隆机上 scp /etc/hosts 192.168.126.124:/etc/
给四台机器生成密钥文件

确认生成。
把每一台机器的密钥都发送到hdp-01上（包括自己）
将所有密钥都复制到每一台机器上

在每一台机器上测试

无需密码则成功，保证四台机器之间可以免密登录

安装Hadoop

在usr目录下创建Hadoop目录，以保证Hadoop生态圈在该目录下。
使用xsell+xFTP传输文
解压缩Hadoop

配置java与hadoop环境变量

 export JAVA_HOME=/usr/jdk/jdk1..0_131

 export JRE_HOME=${JAVA_HOME}/jre

 export CLASSPATH=.:${JAVA_HOME}/lib:${JRE_HOME}/lib

 export PATH=${JAVA_HOME}/bin:$PATH

 export HADOOP_HOME=/usr/hadoop/hadoop-3.1./

 export PATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

注意：以上四台机器都需要配置环境变量

修改etc/hadoop中的配置文件

注：除了个别提示，其余文件只用修改hdp-01中的即可

修改core-site.xml

 <configuration>

 <property>

 <name>fs.defaultFS</name>
   <!-- 注意别的slave机需要识别master主机名，否则将不能与主机hdp-01沟通 -->

 <value>hdfs://hdp-01:9000</value>

 </property>

  <property>

   <name>hadoop.tmp.dir</name>

     <!-- 以下为存放临时文件的路径 -->

   <value>/opt/hadoop/hadoop-3.1.1/data/tmp</value>

  </property>

 </configuration>

修改hadoop-env.sh
```
 export JAVA_HOME=/usr/jdk/jdk1.8.0_131
```
注：该步骤需要四台都配置

修改hdfs-site.xml

 <configuration>

 <property>

   <name>dfs.namenode.http-address</name>

  <!-- hserver1 修改为你的机器名或者ip -->

   <value>hdp-01:50070</value>

  </property>

  <property>

   <name>dfs.namenode.name.dir</name>

   <value>/hadoop/name</value>

  </property>

  <property>

   <name>dfs.replication</name>

    <!-- 备份次数 -->

   <value>1</value>

  </property>

  <property>

   <name>dfs.datanode.data.dir</name>

   <value>/hadoop/data</value>

  </property>

 </configuration>

修改mapred-site.xml

 <configuration>

 <property>

 <name>mapreduce.framework.name</name>

 <value>yarn</value>

 </property>

 </configuration>

修改 workers
```
 hdp-

 hdp-

 hdp-

 hdp-
```

修改yarn-site.xml文件

 <configuration>

 <!-- Site specific YARN configuration properties -->

 <property>

 <name>yarn.resourcemanager.hostname</name>

  <value>hdp-01</value>

 </property>

 <property>

  <name>yarn.nodemanager.aux-services</name>

   <value>mapreduce_shuffle</value>

 </property>

  <property>

   <name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>

 <value>org.apache.hadoop.mapred.ShuffleHandler</value>

 </property>

 <property>

  <name>yarn.nodemanager.resource.cpu-vcores</name>

  <value>1</value>

 </property>

 </configuration>

注：可以把整个/usr/hadoop目录所有文件复制到其余三个机器上还是通过scp 嫌麻烦的可以先整一台机器，然后再克隆

启动Hadoop

在namenode上初始化

因为hdp-01是namenode，hdp-02、hdp=03和hdp-04都是datanode，所以只需要对hdp-01进行初始化操作，也就是对hdfs进行格式化。

执行初始化脚本，也就是执行命令：hdfs namenode -format

等待一会后，不报错返回 “Exiting with status 0” 为成功，“Exiting with status 1”为失败

在namenode上执行启动命令

直接执行start-all.sh 观察是否报错，如报错执行一下内容

$ vim sbin/start-dfs.sh
$ vim sbin/stop-dfs.sh

在空白位置加入

 HDFS_DATANODE_USER=root

 HADOOP_SECURE_DN_USER=hdfs

 HDFS_NAMENODE_USER=root

 HDFS_SECONDARYNAMENODE_USER=root

$ vim sbin/start-yarn.sh
$ vim sbin/stop-yarn.sh

在空白位置加入

 YARN_RESOURCEMANAGER_USER=root

 HADOOP_SECURE_DN_USER=yarn

 YARN_NODEMANAGER_USER=root

$ vim start-all.sh

$ vim stop-all.sh

 TANODE_USER=root

 HDFS_DATANODE_SECURE_USER=hdfs

 HDFS_NAMENODE_USER=root

 HDFS_SECONDARYNAMENODE_USER=root

 YARN_RESOURCEMANAGER_USER=root

 HADOOP_SECURE_DN_USER=yarn

 YARN_NODEMANAGER_USER=root

配置完毕后执行start-all.sh

运行jps

显示6个进程说明配置成功

去浏览器检测一下 http://hdp-01:50070

创建目录上传不成功需要授权

hdfs dfs -chmod -R a+wr hdfs://hdp-01:9000/

```
//查看容量
hadoop fs -df -h /
```
查看各个机器状态报告
```
hadoop dfsadmin -report
```

Centos7 搭建 hadoop3.1.1 集群教程的更多相关文章

CentOS7搭建Hadoop-3.3.0集群手记
前提这篇文章是基于Linux系统CentOS7搭建Hadoop-3.3.0分布式集群的详细手记. 基本概念 Hadoop中的HDFS和YARN都是主从架构,主从架构会有一主多从和多主多从两种架构,这 ...
CentOS7搭建Hadoop2.8.0集群及基础操作与测试
环境说明示例环境主机名 IP 角色系统版本数据目录 Hadoop版本 master 192.168.174.200 nameNode CentOS Linux release 7.4.1708 ...
CentOS7搭建 Hadoop + HBase + Zookeeper集群
摘要: 本文主要介绍搭建Hadoop.HBase.Zookeeper集群环境的搭建一.基础环境准备 1.下载安装包(均使用当前最新的稳定版本,截止至2017年05月24日) 1)jdk-8u131 ...
18-基于CentOS7搭建RabbitMQ3.10.7集群镜像队列+HaProxy+Keepalived高可用架构
集群架构虚拟机规划 IP hostname 节点说明端口控制台地址 192.168.247.150 rabbitmq.master rabbitmq master 5672 http://192 ...
CentOS7搭建Pacemaker高可用集群（1）
Pacemaker是Red Hat High Availability Add-on的一部分.在RHEL上进行试用的最简单方法是从Scientific Linux 或CentOS存储库中进行安装环境 ...
Storm（二）CentOS7.5搭建Storm1.2.2集群
一.Storm的下载官网下载地址:http://storm.apache.org/downloads.html 这里下载最新的版本storm1.2.2,进入之后选择一个镜像下载二.Storm伪分布 ...
HBase（二）CentOS7.5搭建HBase1.2.6HA集群
一.安装前提 1.HBase 依赖于 HDFS 做底层的数据存储 2.HBase 依赖于 MapReduce 做数据计算 3.HBase 依赖于 ZooKeeper 做服务协调 4.HBase源码是j ...
centos7下安装zookeeper&zookeeper集群的搭建
一.centos7下安装zookeeper 1.zookeeper 下载地址 https://mirrors.tuna.tsinghua.edu.cn/apache/zookeeper/ 2.安装步骤 ...
CentOS7.5搭建spark2.3.1集群
一下载安装包 1 官方下载官方下载地址:http://spark.apache.org/downloads.html 2 安装前提 Java8 安装成功 zookeeper 安 ...

随机推荐

python随机生成手机号码
一句话生成电话号码random.choice(['139','188','185','136','158','151'])+"".join(random.choice(" ...
Angular js ng-bind 和ng-module的区别
1.ng-bind 是从$scope ->view 的单向绑定 ,<span ng-bind="object.***"></span>只用于展示数据 ...
Java—IO流 File类的常用API
File类 1.只用于表示文件(目录)的信息(名称.大小等),不能用于文件内容的访问. package cn.test; import java.io.File; import java.io.IOE ...
BIEE入门（一）架构
BIEE作为Oracle的新的商业智能平台企业版,起源于Oracle所收购的Siebel公司,BIEE原来叫做Siebel Analytic,但是Siebel也不是它的发明者,它是Siebel在200 ...
Dynamics CRM 之团队模板
位置:设置——安全性——访问团队模板实体:关联实体,若关联了实体,相关关联的角色可以对当前实体进行下列访问权限的操作: 团队模板的赋值: 插件代码 //通过团队模板名称获取团队模板 var team ...
linux中启动网卡报错:Bringing up interface eth1: Error: Connection activation failed
在重启linux网络服务的时候提示: Active connection path: /org/freedesktop/NetworkManager/ActiveConnection/2 并且产生报错 ...
用AutoHotkey一键完成Xmind里的几个功能
F5一键添加超链接(类型为主题),常规步骤:Ctrl_h打开窗口,点击[主题],激活光标到输入框. Ctrl-i一键添加截取的图片,常规步骤是:打开画图→粘贴→保存图片为文件→Xmind里Ctrl-i ...
vue.js--基础事件结合双向数据绑定实现todolist 待办事项已经完成和进行中，键盘事件
<template> <div id="app"> <h1>{{ msg }}</h1> <input type=" ...
refinedet网络结构
refinedet只预测4个层,并且只有conv6_1.conv6_2,没有ssd中的conv7.8.9 refinedet的4个层都只有1个aspect ratio和1个min_size,所以每层每 ...
卸载由源码编译安装的软件（如OpenCV）
看安装软件的时候有没有使用--prefix这个参数,如果有那就把你指定的文件给删除了就行了. 如果没有用这个参数就麻烦一点了,那就进入到软件解压后的目录,执行sudo make uninstall看能 ...

Centos7 搭建 hadoop3.1.1 集群教程

配置环境要求：

Hadoop下载

安装4台虚拟机，如图所示

设置机器名称

在任意一台机器Centos7上修改域名映射

给四台机器生成密钥文件

在每一台机器上测试

安装Hadoop

配置java与hadoop环境变量

修改etc/hadoop中的配置文件

启动Hadoop

Centos7 搭建 hadoop3.1.1 集群教程的更多相关文章

随机推荐

热门专题