一、基础环境配置

1、三台服务

准备三台Centos7服务,基础环境从伪分布式环境克隆过来。

133 hop01，134 hop02，136 hop03

2、设置主机名

## 设置名称

hostnamectl set-hostname hop01

## 重启

reboot -f

3、主机名通信

vim /etc/hosts

# 添加服务节点

192.168.37.133 hop01

192.168.37.134 hop02

192.168.37.136 hop03

4、SSH免密登录

配置三台服务SSH免密登录。

[root@hop01 ~]# ssh-keygen -t rsa

...一路回车结束

[root@hop01 ~]# cd .ssh

...权限分配到指定集群服务

[root@hop01 .ssh]# ssh-copy-id hop01

[root@hop01 .ssh]# ssh-copy-id hop02

[root@hop01 .ssh]# ssh-copy-id hop03

...在hop01免密登录到hop02

[root@hop01 ~]# ssh hop02

这里针对hop01服务，在hop02和hop03服务都要执行该操作。

5、同步时间

ntp组件安装

# 安装

yum install ntpdate ntp -y

# 查看

rpm -qa|grep ntp

基础管理命令

# 查看状态

service ntpd status

# 启动

service ntpd start

# 开机启动

chkconfig ntpd on

修改时间服务hop01

# 修改ntp配置

vim /etc/ntp.conf

# 添加内容

restrict 192.168.0.0 mask 255.255.255.0 nomodify notrap

server 127.0.0.1

fudge 127.0.0.1 stratum 10

修改hop02\hop03时间机制，从hop01同步时间，并注销网络获取时间的机制。

server 192.168.37.133

# server 0.centos.pool.ntp.org iburst

# server 1.centos.pool.ntp.org iburst

# server 2.centos.pool.ntp.org iburst

# server 3.centos.pool.ntp.org iburst

编写定时任务

[root@hop02 ~]# crontab -e

*/10 * * * * /usr/sbin/ntpdate hop01

修改hop02和hop03服务时间

# 指定时间

date -s "2018-05-20 13:14:55"

# 查看时间

date

这样时间会基于hop01服务的时间不断的更正或同步。

6、环境清理

从伪分布式环境虚拟机克隆三台Centos7服务,删除原来hadoop环境配置的data和log文件夹。

[root@hop02 hadoop2.7]# rm -rf data/ logs/

二、集群环境搭建

1、集群配置概览

服务列表	HDFS文件	YARN调度	单服务
hop01	DataNode	NodeManager	NameNode
hop02	DataNode	NodeManager	ResourceManager
hop03	DataNode	NodeManager	SecondaryNameNode

2、修改配置

vim core-site.xml

<property>

    <name>fs.defaultFS</name>

    <value>hdfs://hop01:9000</value>

</property>

这里三台服务都需要分别指定当前主机名称。

vim hdfs-site.xml

<property>

    <name>dfs.replication</name>

    <value>3</value>

</property>

<property>

      <name>dfs.namenode.secondary.http-address</name>

      <value>hop03:50090</value>

</property>

这里修改副本数为3，并指定SecondaryNameNode服务，三台服务同样修改指定SecondaryNameNode在hop03服务上。

vim yarn-site.xml

<property>

    <name>yarn.resourcemanager.hostname</name>

    <value>hop02</value>

</property>

指定ResourceManager服务在hop02上。

vim mapred-site.xml

<!-- 服务器端地址 -->

<property>

<name>mapreduce.jobhistory.address</name>

<value>hop01:10020</value>

</property>

<!-- 服务器web端地址 -->

<property>

    <name>mapreduce.jobhistory.webapp.address</name>

    <value>hop01:19888</value>

</property>

指定相关web端查看地址在服务hop01上。

3、集群服务配置

路径：/opt/hadoop2.7/etc/hadoop

文件：vim slaves

hop01

hop02

hop03

这里配置三台服务的集群列表。同步修改其他服务相同配置。

4、格式化NameNode

注意这里NameNode配置在hop01服务上。

[root@hop01 hadoop2.7]# bin/hdfs namenode -format

5、启动HDFS

[root@hop01 hadoop2.7]# sbin/start-dfs.sh

Starting namenodes on [hop01]

hop01: starting namenode

hop03: starting datanode

hop02: starting datanode

hop01: starting datanode

Starting secondary namenodes [hop03]

hop03: starting secondarynamenode

注意看这里的打印信息，和配置完全吻合。namenodes在hop01上启动，secondary-namenodes在hop03上启动，可以通过JPS命令到各个服务查看验证。

6、启动YARN

注意Yarn配置在hop02服务上，所以在hop02服务执行启动命令。

[root@hop02 hadoop2.7]# sbin/start-yarn.sh

starting yarn daemons

starting resourcemanager

hop03: starting nodemanager

hop01: starting nodemanager

hop02: starting nodemanager,

注意这里的启动打印日志，至此集群规划的服务都启动完毕。

[root@hop01 hadoop2.7]# jps

4306 NodeManager

4043 DataNode

3949 NameNode

[root@hop02 hadoop2.7]# jps

3733 ResourceManager

3829 NodeManager

3613 DataNode

[root@hop03 hadoop2.7]# jps

3748 DataNode

3928 NodeManager

3803 SecondaryNameNode

查看各个服务下的集群进程，与规划配置一致。

7、Web端界面

NameNode：http://hop01:50070

SecondaryNameNode：http://hop03:50090

三、源代码地址

GitHub·地址

https://github.com/cicadasmile/big-data-parent

GitEE·地址

https://gitee.com/cicadasmile/big-data-parent

推荐阅读：编程体系整理

序号	项目名称	GitHub地址	GitEE地址	推荐指数
01	Java描述设计模式,算法,数据结构	GitHub·点这里	GitEE·点这里	☆☆☆☆☆
02	Java基础、并发、面向对象、Web开发	GitHub·点这里	GitEE·点这里	☆☆☆☆
03	SpringCloud微服务基础组件案例详解	GitHub·点这里	GitEE·点这里	☆☆☆
04	SpringCloud微服务架构实战综合案例	GitHub·点这里	GitEE·点这里	☆☆☆☆☆
05	SpringBoot框架基础应用入门到进阶	GitHub·点这里	GitEE·点这里	☆☆☆☆
06	SpringBoot框架整合开发常用中间件	GitHub·点这里	GitEE·点这里	☆☆☆☆☆
07	数据管理、分布式、架构设计基础案例	GitHub·点这里	GitEE·点这里	☆☆☆☆☆
08	大数据系列、存储、组件、计算等框架	GitHub·点这里	GitEE·点这里	☆☆☆☆☆

Hadoop框架：集群模式下分布式环境搭建的更多相关文章

7.redis 集群模式的工作原理能说一下么？在集群模式下，redis 的 key 是如何寻址的？分布式寻址都有哪些算法？了解一致性 hash 算法吗？
作者:中华石杉面试题 redis 集群模式的工作原理能说一下么?在集群模式下,redis 的 key 是如何寻址的?分布式寻址都有哪些算法?了解一致性 hash 算法吗? 面试官心理分析在前几年, ...
Spark Streaming揭秘 Day31 集群模式下SparkStreaming日志分析（续）
Spark Streaming揭秘 Day31 集群模式下SparkStreaming日志分析(续) 今天延续昨天的内容,主要对为什么一个处理会分解成多个Job执行进行解析. 让我们跟踪下Job调用过 ...
Spark Streaming揭秘 Day30 集群模式下SparkStreaming日志分析
Spark Streaming揭秘 Day30 集群模式下SparkStreaming日志分析今天通过集群运行模式观察.研究和透彻的刨析SparkStreaming的日志和web监控台. Day28 ...
Redis集群模式之分布式集群模式
前言 Redis集群模式主要有2种: 主从集群分布式集群. 前者主要是为了高可用或是读写分离,后者为了更好的存储数据,负载均衡. 本文主要讲解主从集群.本章主要讲解后一半部分,Redis集群. 与本 ...
就publish/subscribe功能看redis集群模式下的队列技术（一）
Redis 简介 Redis 是完全开源免费的,是一个高性能的key-value数据库. Redis 与其他 key - value 缓存产品有以下三个特点: Redis支持数据的持久化,可以将内存中 ...
hadoop学习(三)----hadoop2.x完全分布式环境搭建
今天我们来完成hadoop2.x的完全分布式环境搭建,话说学习本来是一件很快乐的事情,可是一到了搭环境就怎么都让人快乐不起来啊,搭环境的时间比学习的时间还多.都是泪.话不多说,走起. 1 准备工作开 ...
【Hadoop离线基础总结】完全分布式环境搭建
完全分布式环境搭建服务规划适用于工作当中正式环境搭建安装步骤第一步:安装包解压停止之前的Hadoop集群的所有服务,并删除所有机器的Hadoop安装包,然后重新解压Hadoop压缩包三台机 ...
Hadoop学习笔记1：伪分布式环境搭建
在搭建Hadoop环境之前,请先阅读如下博文,把搭建Hadoop环境之前的准备工作做好,博文如下: 1.CentOS 6.7下安装JDK , 地址: http://blog.csdn.net/yule ...
【Redis集群原理专题】分析一下相关的Redis集群模式下的脑裂问题！
技术格言世界上并没有完美的程序,但是我们并不因此而沮丧,因为写程序就是一个不断追求完美的过程. 什么是脑裂字面含义首先,脑裂从字面上理解就是脑袋裂开了,就是思想分家了,就是有了两个山头,就是有了 ...

随机推荐

Java动态代理（二）——jdk动态代理
一.什么是动态代理?代理类在程序运行时创建的代理方式被成为动态代理.动态代理的代理类并不是在Java代码中定义的,而是在运行时根据我们在Java代码中的“指示”动态生成的.相比于静态代理, 动态代理的 ...
Arduboy基本用法(一)
Arduboy基本用法(一) 一.第一个Arduboy程序在arduino中新建项目示例代码 #include<Arduboy.h> Arduboy arduboy; void set ...
渲染更换头像文件转成url地址
需求:在一个后台页面中,插入iform页面,需求为更换头像(layui框架) 一.前提:创建user_buddha.html 页面在侧边栏对应的 a 标签设置 ...
多层v-for循环嵌套导致v-model双向绑定失败，页面不重新渲染
数据格式是数组包对象,对象里面再包数组,数组再包对象,如下: 外层for遍历出editInfo里面所有的属性,内层for遍历Options. 最终实现样子两个问题: 1.点加减按钮的时候往optio ...
android开发之java的一些基础知识详解，java编程语法，扎实自己的android基本功
1.对象的初始化 (1)非静态对象的初始化在创建对象时,对象所在类的所有数据成员会首先进行初始化. 基本类型:int型,初始化为0. 如果为对象:这些对象会按顺序初始化. ※在所有类成员初始化完成之 ...
amd、cmd、CommonJS以及ES6模块化
AMD.CMD.CommonJs.ES6的对比他们都是用于在模块化定义中使用的,AMD.CMD.CommonJs是ES5中提供的模块化编程的方案,import/export是ES6中定义新增的什么 ...
流光shader 和流光+扭曲shader
我认为这种shader能通过简单的方式呈现出不错的效果. 1.流光shader: Shader "Unlit/StreamShader" { //流光shader Properti ...
Web测试和前端技术
Html Form表单用户需要输入内容的地方一般有一个表单元素 method:GET/POST action:要打开/提交的目文件 Table表格检查表格数据和数据库的一致性表格的布局检测:填满 ...
vue 多环境打包
https://cli.vuejs.org/zh/guide/mode-and-env.html#%E6%A8%A1%E5%BC%8F 模式模式是 Vue CLI 项目中一个重要的概念.默认情况下, ...
Jmeter简单操作取样器，监听器
1.创建线程组 1.2 (1) 线程组主要包含三个参数:线程数.准备时长(Ramp-Up Period(in seconds)).循环次数. (2) 线程数:虚拟用户数.一个虚拟用户占用一个进程或线 ...

Hadoop框架：集群模式下分布式环境搭建