hadoop完全分布式文件系统集群搭建

一、准备工作：

　　1、找3台以上的主机（因为HDFS文件系统中保存的文件的blocak在datanode中至少要有3份或3份以上的备份，备份不能放于同一个机架上，更不能放于同一台主机上），我这里使用的是4台，分别是hadoop1、hadoop2、hadoop3和hadoop4。

　　2、安装每台主机的基本环境：linux CentOS6.5 64x系统，启动每台主机的系统，配置好网络和主机名《====》ip的映射。

　　　　配置网络的文件在：/etc/sysconfig/network-scripts/ifcfg-eth0文件中

　　　　　　注：每一台主机都要配置，但是IP不能重复。

　　　　主机名与IP的映射文件在：/etc/hosts文件中

　　3、关闭每台主机的防火墙。注：必须关闭，千万不能忘记，我已经在这个上面吃亏很多次了。

　　　　Command：service iptables stop

　　4、同步每台主机的时间，这里使用的是上海交通大学网络中心NTP服务器来同步时间。

　　　　Command：ntpdate ntp.sjtu.edu.cn

二、安装并配置zookeeper服务器：这里将主机名为hadoop1、hadoop2和hadoop3的主机定为zookeeper服务器。

　　1、在hadoop1中安装zookeeper。自己从zookeeper官方网站上下载，我这里使用的是zookeeper-3.4.6，安装步骤不在这里详解了。

　　2、使用vim 编辑器修改zookeeper安装目录中conf下的zoo_sample.cfg文件，即zookeeper的配置文件。vim是vi编辑器的升级版，可自行安装，使用vi也可以。

　　　　Command：vi /root/zookeeper-3.4.6/conf/zoo_sample.cfg

　　3、在zoo_sample.cfg文件的末尾添加：

　　4、通过网络拷贝命令将hadoop1上的zookeeper安装目录拷贝到hadoop2和hadoop3的相同目录下：

　　　　Command：

　　　　　　scp /root/zookeeper-3.4.6 root@hadoop2:/root/

　　　　　　scp /root/zookeeper-3.4.6 root@hadoop3:/root/

　　5、为各zookeeper服务器主机创建/home/zk_data目录

　　　　Command：

　　　　　　mkdir /home/zk_data

　　6、为各zookeeper服务器配置myid文件,myid这个文件是不存在的，使用vim编辑器编辑保存后会自动创建该文件，该文件的内容为上述配置文件中为其zookeeper服务器在server.x=hadoopx:2888:3888中server后面的x代表的id，编辑保存即可。每台zookeeper服务器主机都要配置。

　　　　Command：

　　　　　　vim /home/zk_data/myid

　　7、启动3台zookeeper服务器

　　　　Command：

　　　　　　/root/zookeeper-3.4.6/bin/zkServer.sh start

　　8、到zookeeper安装目录的父目录中查看日志文件，看是否启动成功

三、配置HDFS中的namenode、JN，这里将hadoop1和hadoop4定为namenode，将hadoop1-3定为JN。

　　1、在hadoop1主机中安装hadoop，我这里安装的是hadoop-2.5.1。

　　2、修改hadoop1配置文件中hdfs-site.cfg文件　　　

　　3、修改hadoop1配置文件中core-site.cfg文件

　　4、通过网络拷贝命令将hadoop1中hadoop的安装目录拷贝到另外三台机器中。

　　Command：

　　　　scp /root/hadoop-2.5.1 root@hadoop2:/root/

　　　　scp /root/hadoop-2.5.1 root@hadoop3:/root/

　　　　scp /root/hadoop-2.5.1 root@hadoop4:/root/

　　5、启动hadoop1-3主机中的JN

　　Command：

　　　　/root/hadoop-2.5.1/sbin/hadoop-daemon.sh start journalnode

　　6、初始化主机hadoop1中的hadoop

　　Command：

　　　　　/root/hadoop-2.5.1/bin/hdfs namenode -format

　　7、在hadoop1中执行：

　　Command：

　　　　/root/hadoop-2.5.1/sbin/hadoop-daemon.sh start namenode

　　8、在hadoop4中执行：

　　Command：

　　　　/root/hadoop-2.5.1/bin/hdfs namenode -bootstrapStandby

　　9、关闭hadoop1的namenode

　　Command：

　　　　/root/hadoop-2.5.1/sbin/hadoop-daemon.sh stop namenode

　　10、在ZK中创建znode来存储automatic Failover的数据，在hadoop1中执行：

　　Command：

　　　　/root/hadoop-2.5./bin/hdfs zkfc -formatZK

　　11、从hadoop1启动namenode

　　Command：

　　　　/root/hadoop-2.5.1/sbin/start-dfs.sh

hadoop完全分布式文件系统集群搭建的更多相关文章

Hadoop HA高可用集群搭建（Hadoop+Zookeeper+HBase）
声明:作者原创,转载注明出处. 作者:帅气陈吃苹果一.服务器环境主机名 IP 用户名密码安装目录 master188 192.168.29.188 hadoop hadoop /home/ha ...
Ubuntu 12.04下Hadoop 2.2.0 集群搭建（原创）
现在大家可以跟我一起来实现Ubuntu 12.04下Hadoop 2.2.0 集群搭建,在这里我使用了两台服务器,一台作为master即namenode主机,另一台作为slave即datanode主机 ...
高可用Hadoop平台－HBase集群搭建
1.概述今天补充一篇HBase集群的搭建,这个是高可用系列遗漏的一篇博客,今天抽时间补上,今天给大家介绍的主要内容目录如下所示: 基础软件的准备 HBase介绍 HBase集群搭建单点问题验证截 ...
Hadoop初期学习和集群搭建
留给我学习hadoop的时间不多了,要提高效率,用上以前学的东西.hadoop要注重实战,把概念和原理弄清楚,之前看过一些spark,感觉都是一些小细节,对于理解hadoop没什么帮助.多看看资料,把 ...
Hadoop HA高可用集群搭建（2.7.2）
1.集群规划: 主机名 IP 安装的软件执行的进程 drguo1 192.168.80.149 j ...
Zookeeper（四）Hadoop HA高可用集群搭建
一.高可就集群搭建 1.集群规划 2.集群服务器准备 (1) 修改主机名(2) 修改 IP 地址(3) 添加主机名和 IP 映射(4) 同步服务器时间(5) 关闭防火墙(6) 配置免密登录(7) 安装 ...
hadoop HA+kerberos HA集群搭建
IP.主机名规划 hadoop集群规划: hostname IP hadoop 备注 hadoop1 110.185.225.158 NameNode,ResourceManager,DFSZKFai ...
3.环境搭建-Hadoop（CDH）集群搭建
目录目录实验环境安装 Hadoop 配置文件在另外两台虚拟机上搭建hadoop 启动hdfs集群启动yarn集群本文主要是在上节CentOS集群基础上搭建Hadoop集群. 实验环境 Ha ...
Hadoop HA 高可用集群搭建
一.首先配置集群信息 vi /etc/hosts 二.安装zookeeper 1.解压至/usr/hadoop/下 .tar.gz -C /usr/hadoop/ 2.进入/usr/hadoop/zo ...

随机推荐

Linux软件包管理 RMP包管理
概述 RPM 包的命名一般都会遵守统一的命名规则,例如: httpd-2.2.15-15.el6.centos.1.i686.rpm 其中的各项代表的含义如下: httpd:软件包名. 2.2.15: ...
1000M链路的理论值计算
1000M约等于(1秒/(1纳秒))/ (1024*1024) ============================================================== 1.什么是 ...
Linux进程中TIME_OUT解析
TIMEWAIT状态本身和应用层的客户端或者服务器是没有关系的.仅仅是主动关闭的一方,在使用FIN|ACK|FIN|ACK四分组正常关闭TCP连接的时候会出现这个TIMEWAIT.服务器在处理客户端请 ...
nodejs数据接收body-parser中间件
给大家翻译一下npm上body-parser的资料 nodejs 的body数据解析中间件插件作用:对于req.body属性,在操作数据前分析进来的请求体的插件首先学习解析一个http处理这篇文 ...
VCS 常用命令速查
VCS是编译型Verilog模拟器,它完全支持OVI标准的Verilog HDL语言.PLI和SDF.VCS具有目前行业中最高的模拟性能,其出色的内存管理能力足以支持千万门级的ASIC设计,而其模 ...
CSS3 3D旋转按钮对话框
在线演示本地下载
HISAT2的运用
功能: 用于有参考基因组存在的比对工具(适用于whole-genome, transcriptome, and exome sequencing data) 用法: hisat2-build [opt ...
BZOJ 4154 kd-tree dfs序 + 二维空间的区间(矩阵)更新单点查找
一开始没思路感觉像是一个树形dp 然而不会然后看了一眼题解就明白了一个点的子树用dfs序表示肯定是一个连续的区间并且由于有子树的距离限制可以转化为一个深度的区间于是每个点都会有一个在二维 ...
Java -- 利用反射操作任意数组，包括对象数组和基本数据类型的数组
items为任意数组
PrepareStatement
import java.sql.DriverManager; import java.sql.Connection; import java.sql.PreparedStatement; import ...

hadoop完全分布式文件系统集群搭建

hadoop完全分布式文件系统集群搭建的更多相关文章

随机推荐

热门专题