基于Docker搭建大数据集群（三）Hadoop部署

主要内容

Hadoop安装

前提

zookeeper正常使用
JAVA_HOME环境变量

安装包

Hadoop 2.7.7

角色划分

角色分配	NN	DN	SNN
cluster-master	是	否	否
cluster-slave1	否	是	是
cluster-slave1	否	是	否
cluster-slave1	否	是	否

一、环境准备

上传到docker镜像

docker cp hadoop-2.7.7.tar.gz cluster-master:/root/tar

解压

tar xivf hadoop-2.7.7.tar.gz -C /opt/hadoop

二、配置文件

core-site.xml

<configuration>

        <property>

                <name>fs.defaultFS</name>

                <value>hdfs://jinbill</value>

        </property>

        <property>

                <name>ha.zookeeper.quorum</name>

                <value>cluster-master:2181</value>

        </property>

        <property>

                <name>hadoop.tmp.dir</name>

                <value>/opt/hadoop</value>

        </property>

</configuration>

yarn-site.xml

<configuration>

        <property>

                 <name>yarn.nodemanager.aux-services</name>

                 <value>mapreduce_shuffle</value>

        </property>

        <property>

                 <name>yarn.resourcemanager.ha.enabled</name>

                 <value>true</value>

        </property>

        <property>

                 <name>yarn.resourcemanager.cluster-id</name>

                 <value>mr_jinbill</value>

        </property>

        <property>

                 <name>yarn.resourcemanager.ha.rm-ids</name>

                 <value>rm1,rm2</value>

        </property>

        <property>

                 <name>yarn.resourcemanager.hostname.rm1</name>

                 <value>cluster-slave2</value>

        </property>

        <property>

                 <name>yarn.resourcemanager.hostname.rm2</name>

                 <value>cluster-slave3</value>

        </property>

        <property>

                 <name>yarn.resourcemanager.zk-address</name>

                 <value>192.168.11.46:12181</value>

        </property>

        <property>

                <name>yarn.nodemanager.pmem-check-enabled</name>

                <value>false</value>

        </property>

        <property>

                <name>yarn.nodemanager.vmem-check-enabled</name>

                <value>false</value>

        </property>

</configuration>

hadoop-env.sh

export JAVA_HOME=/opt/jdk/jdk1.8.0_221

hdfs-site.xml

<configuration>

        <property>

                <name>dfs.nameservices</name>

                <value>jinbill</value>

        </property>

        <property>

                <name>dfs.ha.namenodes.jinbill</name>

                <value>nn1,nn2</value>

        </property>

        <property>

                <name>dfs.namenode.rpc-address.jinbill.nn1</name>

                <value>cluster-master:8020</value>

        </property>

        <property>

                <name>dfs.namenode.rpc-address.jinbill.nn2</name>

                <value>cluster-slave1:8020</value>

        </property>

        <property>

                <name>dfs.namenode.http-address.shsxt.nn1</name>

                <value>cluster-master:50070</value>

        </property>

        <property>

                <name>dfs.namenode.http-address.shsxt.nn2</name>

                <value>cluster-slave1:50070</value>

        </property>

        <property>

                <name>dfs.namenode.shared.edits.dir</name>

                <value>qjournal://cluster-slave1:8485;cluster-slave2:8485;cluster-slave3:8485/jinbill</value>

        </property>

        <property>

                <name>dfs.client.failover.proxy.provider.jinbill</name>

                <value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider

        </value>

        </property>

        <property>

                <name>dfs.ha.fencing.methods</name>

                <value>sshfence</value>

        </property>

        <property>

                <name>dfs.ha.fencing.ssh.private-key-files</name>

                <value>/root/.ssh/id_rsa</value>

        </property>

        <property>

                <name>dfs.journalnode.edits.dir</name>

                <value>/opt/hadoop/data</value>

        </property>

        <property>

                <name>dfs.ha.automatic-failover.enabled</name>

                <value>true</value>

        </property>

</configuration>

新建slaves文件，若有则直接编辑

cluster-slave1

cluster-slave2

cluster-slave3

三、初始化

启动所有节点JournalNode

hadoop-daemon.sh start journalnode

在NN上初始化元数据

hdfs namenode -forma

将格式化后的元数据拷贝到SNN上

scp /opt/zookeeper/dfs cluster-slave1:/opt/hadoop

启动master节点的NN

hadoop-daemon.sh start namenode

在SNN上执行

hdfs namenode -bootstrapStandby

启动SNN

hadoop-daemon.sh start namenode

在NN或SNN上初始化ZKFC

hdfs zkfc -formatZK

停止上面节点

stop-dfs.sh

四、启动

start-dfs.sh

start-yarn.sh

五、测试是否成功

因为网段不同，所以得加路由才能访问

打开cmd，需要管理员权限
route add 172.15.0.0 mask 255.255.0.0 192.168.11.38 -p

访问UI界面

Hadoop 集群访问地址

 Hadoop 作业地址

基于Docker搭建大数据集群（三）Hadoop部署的更多相关文章

基于Docker搭建大数据集群（六）Hive搭建
基于Docker搭建大数据集群(六)Hive搭建前言之前搭建的都是1.x版本,这次搭建的是hive3.1.2版本的..还是有一点细节不一样的 Hive现在解析引擎可以选择spark,我是用spar ...
基于Docker搭建大数据集群（七）Hbase部署
基于Docker搭建大数据集群(七)Hbase搭建一.安装包准备 Hbase官网下载微云下载 | 在 tar 目录下二.版本兼容三.角色分配节点 Master Regionserver cl ...
基于Docker搭建大数据集群（一）Docker环境部署
本篇文章是基于Docker搭建大数据集群系列的开篇之作主要内容 docker搭建 docker部署CentOS 容器免密钥通信容器保存成镜像 docker镜像发布环境 Linux 7.6 一.D ...
基于Docker搭建大数据集群（五）Mlsql部署
主要内容 mlsql部署前提 zookeeper正常使用 spark正常使用 hadoop正常使用安装包微云下载 | tar包目录下 mlsql-cluster-2.4_2.11-1.4.0.t ...
基于Docker搭建大数据集群（二）基础组件配置
主要内容 jdk环境搭建 scala环境搭建 zookeeper部署 mysql部署前提 docker容器之间能免密钥登录 yum源更换为阿里源安装包微云分享 | tar包目录下 JDK 1.8 ...
基于Docker搭建大数据集群（四）Spark部署
主要内容 spark部署前提 zookeeper正常使用 JAVA_HOME环境变量 HADOOP_HOME环境变量安装包微云下载 | tar包目录下 Spark2.4.4 一.环境准备上传到 ...
Docker搭建大数据集群 Hadoop Spark HBase Hive Zookeeper Scala
Docker搭建大数据集群给出一个完全分布式hadoop+spark集群搭建完整文档,从环境准备(包括机器名,ip映射步骤,ssh免密,Java等)开始,包括zookeeper,hadoop,hiv ...
关于在真实物理机器上用cloudermanger或ambari搭建大数据集群注意事项总结、经验和感悟心得（图文详解）
写在前面的话 (1) 最近一段时间,因担任我团队实验室的大数据环境集群真实物理机器工作,至此,本人秉持负责.认真和细心的态度,先分别在虚拟机上模拟搭建ambari(基于CentOS6.5版本)和clo ...
庐山真面目之十二微服务架构基于Docker搭建Consul集群、Ocelot网关集群和IdentityServer版本实现
庐山真面目之十二微服务架构基于Docker搭建Consul集群.Ocelot网关集群和IdentityServer版本实现一.简介在第七篇文章<庐山真面目之七微服务架构Consul ...

随机推荐

Oracle数据库测试和优化最佳实践： OTest介绍（转）
当前Oracle数据库最佳测试工具OTest * Otest是用于Oracle数据库测试.优化.监控软件. * Otest是免费提供给Oracle客户和广大DBA工程师使用的软件.由原厂技术专家王 ...
P1357 花园状压矩阵快速幂
题意小L有一座环形花园,沿花园的顺时针方向,他把各个花圃编号为1~N(2<=N<=10^15).他的环形花园每天都会换一个新花样,但他的花园都不外乎一个规则,任意相邻M(2<=M& ...
CF Edu54 E. Vasya and a Tree DFS+树状数组
Vasya and a Tree 题意: 给定一棵树,对树有3e5的操作,每次操作为,把树上某个节点的不超过d的子节点都加上值x; 思路: 多开一个vector记录每个点上的操作.dfs这颗树,同时以 ...
lightoj 1140 - How Many Zeroes?（数位dp）
Jimmy writes down the decimal representations of all natural numbers between and including m and n, ...
hdu 1503 Advanced Fruits 最长公共子序列 *
Advanced Fruits Time Limit: 2000/1000 MS (Java/Others) Memory Limit: 65536/32768 K (Java/Others) ...
hotcss.js Flexible 移动端适配在dpr=2和dpr=3出现的字体大小设置不正确问题.
这段时间一直在用hotcss做移动端适配,做了几个页面没有发现什么问题,后来老大要加快进度,我把项目分出一块给另一个同事做,她发现了一个问题就是字体在dpr=2,dpr=3,的设备上字体大小显示老是不 ...
net core天马行空系列：一个接口多个实现类，利用mixin技术通过自定义服务名，实现精准属性注入
系列目录 1.net core天马行空系列:原生DI+AOP实现spring boot注解式编程 2.net core天马行空系列: 泛型仓储和声明式事物实现最优雅的crud操作哈哈哈哈,大家好,我 ...
Java中String为什么是不可变的
1.在Java中,String类是不可变类,一个不可变类是一个简单的类,并且这个的实例也不能被修改, 这个类的实例创建的时候初始化所有的信息,并且这些信息不能够被修改 2.字符串常量池字符串常量池是 ...
FreeSql （三十一）分区分表
分区分区就是把一个数据表的文件和索引分散存储在不同的物理文件中.把一张表的数据分成N多个区块,这些区块可以在同一个磁盘上,也可以在不同的磁盘上,数据库不同实现方式有所不同. 与分表不同,一张大表进行 ...
超级密码（BFS）
Problem Description Ignatius花了一个星期的时间终于找到了传说中的宝藏,宝藏被放在一个房间里,房间的门用密码锁起来了,在门旁边的墙上有一些关于密码的提示信息: 密码是一个C进 ...

基于Docker搭建大数据集群（三）Hadoop部署

主要内容

前提

安装包

角色划分

一、环境准备

上传到docker镜像

解压

二、配置文件

core-site.xml

yarn-site.xml

hadoop-env.sh

hdfs-site.xml

新建slaves文件，若有则直接编辑

三、初始化

启动所有节点JournalNode

在NN上初始化元数据

将格式化后的元数据拷贝到SNN上

启动master节点的NN

在SNN上执行

启动SNN

在NN或SNN上初始化ZKFC

停止上面节点

四、 启动

五、测试是否成功

因为网段不同，所以得加路由才能访问

访问UI界面

基于Docker搭建大数据集群（三）Hadoop部署的更多相关文章

随机推荐

热门专题

四、启动