Hadoop3.2.0集群（4节点-无HA）

1.准备环境

1.1配置dns

# cat /etc/hosts

	172.27.133.60  hadoop-01

  172.27.133.61  hadoop-02

  172.27.133.62  hadoop-03

  172.27.133.63  hadoop-04

1.2配置免密登陆

# ssh-keygen

# ssh-copy-id root@hadoop-02/03/04

1.3关闭防火墙

# cat /etc/selinux/config

	SELINUX=disabled

# systemctl stop firewalld

# systemctl disable firewalld

1.4配置Java环境,Hadoop环境

# tar -xf /data/software/jdk-8u171-linux-x64.tar.gz -C /usr/local/java

# tar -xf /data/software/hadoop-3.2.0.tar.gz -C /data/hadoop

# cat /etc/profile

  export HADOOP_HOME=/data/hadoop/hadoop-3.2.0

  export JAVA_HOME=/usr/local/java/jdk1.8.0_171

  export PATH=$JAVA_HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH

  export CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar

  export HADOOP_CONF_DIR=${HADOOP_HOME}/etc/hadoop

# source /etc/profile

# java -version

  java version "1.8.0_171"

  Java(TM) SE Runtime Environment (build 1.8.0_171-b11)

  Java HotSpot(TM) 64-Bit Server VM (build 25.171-b11, mixed mode)

2.配置Hadoop

2.1配置Hadoop环境脚本文件中的JAVA_HOME参数

# cd /data/hadoop/hadoop-3.2.0/etc/hadoop

# vim hadoop-env.sh 和 mapred-env.sh 和 yarn-env.sh，向脚本添加JAVA_HOME

	export JAVA_HOME=/usr/local/java/jdk1.8.0_171

# hadoop version

  Hadoop 3.2.0

  Source code repository https://github.com/apache/hadoop.git -r e97acb3bd8f3befd27418996fa5d4b50bf2e17bf

  Compiled by sunilg on 2019-01-08T06:08Z

  Compiled with protoc 2.5.0

  From source with checksum d3f0795ed0d9dc378e2c785d3668f39

  This command was run using /data/hadoop/hadoop-3.2.0/share/hadoop/common/hadoop-common-3.2.0.jar

2.2修改Hadoop配置文件

在hadoop-3.2.0/etc/hadoop目录下，修改core-site.xml、hdfs-site.xml、mapred-site.xml、yarn-site.xml、workers文件，具体参数按照实际情况修改。

2.2.1修改core-site.xml

（文件系统）

<configuration>

  <property>

      <!-- 配置hdfs地址 -->

      <name>fs.defaultFS</name>

      <value>hdfs://hadoop-01:9000</value>

  </property>

  <property>

      <!-- 保存临时文件目录，需先在/data/hadoop下创建tmp目录 -->

      <name>hadoop.tmp.dir</name>

     <value>/data/hadoop/tmp</value>

 </property>

</configuration>

# mkdir /data/hadoop/tmp

2.2.2修改hdfs-site.xml

(副本数)

<configuration>

      <property>

         <!-- 主节点地址 -->

          <name>dfs.namenode.http-address</name>

          <value>hadoop-01:50070</value>

      </property>

      <property>

          <name>dfs.secondary.http.address</name>

          <value>hadoop-02:50070</value>

      </property>

      <property>

          <name>dfs.namenode.name.dir</name>

          <value>file:/data/hadoop/dfs/name</value>

     </property>

     <property>

         <name>dfs.datanode.data.dir</name>

         <value>file:/data/hadoop/dfs/data</value>

     </property>

     <property>

        <!-- 备份数为默认值2 -->

        <name>dfs.replication</name>

        <value>2</value>

     </property>

     <property>

        <name>dfs.webhdfs.enabled</name>

        <value>true</value>

     </property>

     <property>

        <name>dfs.permissions</name>

        <value>false</value>

        <description>配置为false后，可以允许不要检查权限就生成dfs上的文件，方便倒是方便了，但是你需要防止误删除.</description>

      </property>

</configuration>

2.2.3修改mapred-site.xml

（资源调度框架）

<configuration>

      <property>

          <name>mapreduce.framework.name</name>

          <value>yarn</value>

      </property>

      <property>

          <name>mapreduce.jobhistory.address</name>

          <value>hadoop-01:10020</value>

      </property>

      <property>

         <name>mapreduce.jobhistory.webapp.address</name>

         <value>hadoop-01:19888</value>

      </property>

　　   <property>

　　 　　<name>mapreduce.application.classpath</name>

      <value>$HADOOP_MAPRED_HOME/share/hadoop/mapreduce/*:$HADOOP_MAPRED_HOME/share/hadoop/mapreduce/lib/*</value>

　　   </property>

</configuration>

2.2.4修改yarn-site.xml

<configuration>

<!-- Site specific YARN configuration properties -->

     <property>

         <name>yarn.resourcemanager.hostname</name>

         <value>hadoop-01</value>

     </property>

     <property>

         <name>yarn.nodemanager.aux-services</name>

         <value>mapreduce_shuffle</value>

     </property>

     <property>

         <name>yarn.resourcemanager.webapp.address</name>

         <value>172.27.133.60:8088</value>

         <description>配置外网只需要替换外网ip为真实ip，否则默认为 localhost:8088</description>

     </property>

     <property>

         <name>yarn.scheduler.maximum-allocation-mb</name>

         <value>2048</value>

         <description>每个节点可用内存,单位MB,默认8182MB</description>

     </property>

     <property>

         <name>yarn.nodemanager.vmem-check-enabled</name>

         <value>false</value>

         <description>忽略虚拟内存的检查，如果你是安装在虚拟机上，这个配置很有用，配上去之后后续操作不容易出问题。</description>

     </property>

     <property>

         <name>yarn.nodemanager.env-whitelist</name>

         <value>JAVA_HOME,HADOOP_COMMON_HOME,HADOOP_HDFS_HOME,HADOOP_CONF_DIR,CLASSPATH_PREPEND_DISTCACHE,HADOOP_YARN_HOME,HADOOP_MAPRED_HOME</value>

     </property>

</configuration>

2.2.5修改workers

添加从节点地址，IP或者hostname

hadoop-02

hadoop-03

hadoop-04

2.3将配置好的文件夹拷贝到其他从节点

# scp -r /data/hadoop root@hadoop-02:/data/hadoop

# scp -r /data/hadoop root@hadoop-03:/data/hadoop

# scp -r /data/hadoop root@hadoop-04:/data/hadoop

2.4配置启动脚本Yarn权限

2.4.1添加hdfs权限

在第二行空白位置添加hdfs权限

# cat sbin/start-dfs.sh

# cat sbin/stop-dfs.sh

  #!/usr/bin/env bash

  HDFS_DATANODE_USER=root

  HDFS_DATANODE_SECURE_USER=hdfs

  HDFS_NAMENODE_USER=root

  HDFS_SECONDARYNAMENODE_USER=root

  ···

2.4.2添加Yarn权限

在第二行空白位置添加Yarn权限

# cat sbin/start-yarn.sh

# cat sbin/stop-yarn.sh

  #!/usr/bin/env bash

  YARN_RESOURCEMANAGER_USER=root

  HDFS_DATANODE_SECURE_USER=yarn

  YARN_NODEMANAGER_USER=root

  ···

如果不添加权限，在启动时候会报错

ERROR: Attempting to launch hdfs namenode as root

ERROR: but there is no HDFS_NAMENODE_USER defined. Aborting launch.

Starting datanodes

ERROR: Attempting to launch hdfs datanode as root

ERROR: but there is no HDFS_DATANODE_USER defined. Aborting launch.

Starting secondary namenodes [localhost.localdomain]

ERROR: Attempting to launch hdfs secondarynamenode as root

ERROR: but there is no HDFS_SECONDARYNAMENODE_USER defined. Aborting launch.

3.初始化并启动

3.1格式化hdfs

# bin/hdfs namenode -format

3.2启动

3.2.1一步启动

# sbin/start-all.sh

3.2.2分布启动

# sbin/start-dfs.sh

# sbin/start-yarn.sh

4.验证

4.1列出进程

主节点hadoop-01

# jps

32069 SecondaryNameNode

2405 NameNode

2965 ResourceManager

3645 Jps

从节点hadoop-02

# jps

25616 NodeManager

25377 DataNode

25508 SecondaryNameNode

25945 Jps

从节点hadoop-03

# jps

14946 NodeManager

15207 Jps

14809 DataNode

从节点hadoop-04

# jps

14433 Jps

14034 DataNode

14171 NodeManager4

4.2访问页面

http://hadoop-01:8088打开ResourceManager页面

http://hadoop-01:50070打开Hadoop Namenode页面

Hadoop3.2.0集群（4节点-无HA）的更多相关文章

全网最新的nacos 2.1.0集群多节点部署教程
原文链接:全网最新的nacos 2.1.0集群多节点部署教程-语雀基本信息进度整理中版本 2.1.0 版本发布日期 2022-04-29 git revision number b5845313 ...
Kafka 1.0.0集群增加节点
原有环境主机名 IP 地址安装路径系统 sht-sgmhadoopdn-01 172.16.101.58 /opt/kafka_2.12-1.0.0 /opt/kafka(软连接) CentOS ...
CentOS7搭建Hadoop-3.3.0集群手记
前提这篇文章是基于Linux系统CentOS7搭建Hadoop-3.3.0分布式集群的详细手记. 基本概念 Hadoop中的HDFS和YARN都是主从架构,主从架构会有一主多从和多主多从两种架构,这 ...
hadoop3.2.0集群搭建的一些坑!
搭建步骤就不多说了,网上教程很多,这里列举几个: https://blog.csdn.net/pucao_cug/article/details/71698903 2.8版本 https://ww ...
hadoop 2.2.0集群安装详细步骤（简单配置，无HA）
安装环境操作系统:CentOS 6.5 i586(32位)java环境:JDK 1.7.0.51hadoop版本:社区版本2.2.0,hadoop-2.2.0.tar.gz 安装准备设置集群的host ...
CentOS完美搭建Redis3.0集群并附测试
线上的统一聊天和推送项目使用的是redis主从,redis版本2.8.6 redis主从和mysql主从目的差不多,但redis主从配置很简单,主要在从节点配置文件指定主节点ip和端口:slaveof ...
二进制方式部署Kubernetes 1.6.0集群(开启TLS)
本节内容: Kubernetes简介环境信息创建TLS加密通信的证书和密钥下载和配置 kubectl(kubecontrol) 命令行工具创建 kubeconfig 文件创建高可用 etcd ...
hadoop-2.6.0集群开发环境配置
hadoop-2.6.0集群开发环境配置一．环境说明 1.1安装环境说明本例中,操作系统为CentOS 6.6, JDK版本号为JDK 1.7,Hadoop版本号为Apache Hadoop 2. ...
Kubernetes-保障集群内节点和网络安全
13.1.在pod中使用宿主节点的Linux命名空间 13.1.1.在pod中使用宿主节点的网络命名空间在pod的yaml文件中就设置spec.hostNetwork: true 这个时候pod使用 ...

随机推荐

Codeforces Round #542 题解
Codeforces Round #542 abstract I决策中的独立性, II联通块染色板子 IIIVoronoi diagram O(N^2 logN) VI环上距离分类讨论加取模,最值中的 ...
LeetCode 242 Valid Anagram 解题报告
题目要求 Given two strings s and t , write a function to determine if t is an anagram of s. 题目分析及思路给出两个 ...
构建react项目失败解决办法
1.初始化项目,报下方错误 2.解决方法,更新淘宝镜像 npm config set registry https://registry.npm.taobao.org 3.在初始化项目 create- ...
git 解决授权失败的方法
git 提示 fatal: Authentication failed for 'http://***********‘’得解决方法首先用 git config --list 查看一下如果不对, ...
自顶向下深入分析Netty（五）--Future
再次回顾这幅图,在上一章中,我们分析了Reactor的完整实现.由于Java NIO事件驱动的模型,要求Netty的事件处理采用异步的方式,异步处理则需要表示异步操作的结果.Future正是用来表示异 ...
iOS 开发笔记 - 导航到地图
导航到地图,已经不是什么新鲜事了.网上有好多参考的资料,我总结出只需要两步第一步:在info中加上支持的各平台比如:iosamap高德地图.comgooglemaps谷歌地图.baidumap百度 ...
个人常用的移动端浅灰底index.html
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/ ...
react github项目
https://github.com/bailicangdu/react-pxq 网址;https://github.com/bailicangdu/react-pxq
测试客户端连接12c ASM实例
环境:Oracle 12.2.0.1 RAC 背景:用户反映12c ASM创建的用户具备sysasm权限,但无法在客户端连接到ASM实例,且没有报错. 1.ASM实例创建用户赋予sysasm权限 2. ...
Java中的过滤器，拦截器，监听器---------简单易懂的介绍
过滤器: 过滤器其主要特点在于:取你需要的东西,忽视那些不需要的东西!在程序中,你希望选择中篇文章中的所有数字,你就可以针对性的挑选数字! 拦截器: 拦截器其主要特点在于:针对你不要的东西进行拦截,比 ...

Hadoop3.2.0集群（4节点-无HA）

1.准备环境

1.1配置dns

1.2配置免密登陆

1.3关闭防火墙

1.4配置Java环境,Hadoop环境

2.配置Hadoop

2.1配置Hadoop环境脚本文件中的JAVA_HOME参数

2.2修改Hadoop配置文件

2.2.1修改core-site.xml

2.2.2修改hdfs-site.xml

2.2.3修改mapred-site.xml

2.2.4修改yarn-site.xml

2.2.5修改workers

2.3将配置好的文件夹拷贝到其他从节点

2.4配置启动脚本Yarn权限

2.4.1添加hdfs权限

2.4.2添加Yarn权限

3.初始化并启动

3.1格式化hdfs

3.2启动

3.2.1一步启动

3.2.2分布启动

4.验证

4.1列出进程

4.2访问页面

Hadoop3.2.0集群（4节点-无HA）的更多相关文章

随机推荐

热门专题