hadoop完全分布式文件系统集群搭建

一、准备工作：

　　1、找3台以上的主机（因为HDFS文件系统中保存的文件的blocak在datanode中至少要有3份或3份以上的备份，备份不能放于同一个机架上，更不能放于同一台主机上），我这里使用的是4台，分别是hadoop1、hadoop2、hadoop3和hadoop4。

　　2、安装每台主机的基本环境：linux CentOS6.5 64x系统，启动每台主机的系统，配置好网络和主机名《====》ip的映射。

　　　　配置网络的文件在：/etc/sysconfig/network-scripts/ifcfg-eth0文件中

　　　　　　注：每一台主机都要配置，但是IP不能重复。

　　　　主机名与IP的映射文件在：/etc/hosts文件中

　　3、关闭每台主机的防火墙。注：必须关闭，千万不能忘记，我已经在这个上面吃亏很多次了。

　　　　Command：service iptables stop

　　4、同步每台主机的时间，这里使用的是上海交通大学网络中心NTP服务器来同步时间。

　　　　Command：ntpdate ntp.sjtu.edu.cn

二、安装并配置zookeeper服务器：这里将主机名为hadoop1、hadoop2和hadoop3的主机定为zookeeper服务器。

　　1、在hadoop1中安装zookeeper。自己从zookeeper官方网站上下载，我这里使用的是zookeeper-3.4.6，安装步骤不在这里详解了。

　　2、使用vim 编辑器修改zookeeper安装目录中conf下的zoo_sample.cfg文件，即zookeeper的配置文件。vim是vi编辑器的升级版，可自行安装，使用vi也可以。

　　　　Command：vi /root/zookeeper-3.4.6/conf/zoo_sample.cfg

　　3、在zoo_sample.cfg文件的末尾添加：

　　4、通过网络拷贝命令将hadoop1上的zookeeper安装目录拷贝到hadoop2和hadoop3的相同目录下：

　　　　Command：

　　　　　　scp /root/zookeeper-3.4.6 root@hadoop2:/root/

　　　　　　scp /root/zookeeper-3.4.6 root@hadoop3:/root/

　　5、为各zookeeper服务器主机创建/home/zk_data目录

　　　　Command：

　　　　　　mkdir /home/zk_data

　　6、为各zookeeper服务器配置myid文件,myid这个文件是不存在的，使用vim编辑器编辑保存后会自动创建该文件，该文件的内容为上述配置文件中为其zookeeper服务器在server.x=hadoopx:2888:3888中server后面的x代表的id，编辑保存即可。每台zookeeper服务器主机都要配置。

　　　　Command：

　　　　　　vim /home/zk_data/myid

　　7、启动3台zookeeper服务器

　　　　Command：

　　　　　　/root/zookeeper-3.4.6/bin/zkServer.sh start

　　8、到zookeeper安装目录的父目录中查看日志文件，看是否启动成功

三、配置HDFS中的namenode、JN，这里将hadoop1和hadoop4定为namenode，将hadoop1-3定为JN。

　　1、在hadoop1主机中安装hadoop，我这里安装的是hadoop-2.5.1。

　　2、修改hadoop1配置文件中hdfs-site.cfg文件　　　

　　3、修改hadoop1配置文件中core-site.cfg文件

　　4、通过网络拷贝命令将hadoop1中hadoop的安装目录拷贝到另外三台机器中。

　　Command：

　　　　scp /root/hadoop-2.5.1 root@hadoop2:/root/

　　　　scp /root/hadoop-2.5.1 root@hadoop3:/root/

　　　　scp /root/hadoop-2.5.1 root@hadoop4:/root/

　　5、启动hadoop1-3主机中的JN

　　Command：

　　　　/root/hadoop-2.5.1/sbin/hadoop-daemon.sh start journalnode

　　6、初始化主机hadoop1中的hadoop

　　Command：

　　　　　/root/hadoop-2.5.1/bin/hdfs namenode -format

　　7、在hadoop1中执行：

　　Command：

　　　　/root/hadoop-2.5.1/sbin/hadoop-daemon.sh start namenode

　　8、在hadoop4中执行：

　　Command：

　　　　/root/hadoop-2.5.1/bin/hdfs namenode -bootstrapStandby

　　9、关闭hadoop1的namenode

　　Command：

　　　　/root/hadoop-2.5.1/sbin/hadoop-daemon.sh stop namenode

　　10、在ZK中创建znode来存储automatic Failover的数据，在hadoop1中执行：

　　Command：

　　　　/root/hadoop-2.5./bin/hdfs zkfc -formatZK

　　11、从hadoop1启动namenode

　　Command：

　　　　/root/hadoop-2.5.1/sbin/start-dfs.sh

hadoop完全分布式文件系统集群搭建的更多相关文章

Hadoop HA高可用集群搭建（Hadoop+Zookeeper+HBase）
声明:作者原创,转载注明出处. 作者:帅气陈吃苹果一.服务器环境主机名 IP 用户名密码安装目录 master188 192.168.29.188 hadoop hadoop /home/ha ...
Ubuntu 12.04下Hadoop 2.2.0 集群搭建（原创）
现在大家可以跟我一起来实现Ubuntu 12.04下Hadoop 2.2.0 集群搭建,在这里我使用了两台服务器,一台作为master即namenode主机,另一台作为slave即datanode主机 ...
高可用Hadoop平台－HBase集群搭建
1.概述今天补充一篇HBase集群的搭建,这个是高可用系列遗漏的一篇博客,今天抽时间补上,今天给大家介绍的主要内容目录如下所示: 基础软件的准备 HBase介绍 HBase集群搭建单点问题验证截 ...
Hadoop初期学习和集群搭建
留给我学习hadoop的时间不多了,要提高效率,用上以前学的东西.hadoop要注重实战,把概念和原理弄清楚,之前看过一些spark,感觉都是一些小细节,对于理解hadoop没什么帮助.多看看资料,把 ...
Hadoop HA高可用集群搭建（2.7.2）
1.集群规划: 主机名 IP 安装的软件执行的进程 drguo1 192.168.80.149 j ...
Zookeeper（四）Hadoop HA高可用集群搭建
一.高可就集群搭建 1.集群规划 2.集群服务器准备 (1) 修改主机名(2) 修改 IP 地址(3) 添加主机名和 IP 映射(4) 同步服务器时间(5) 关闭防火墙(6) 配置免密登录(7) 安装 ...
hadoop HA+kerberos HA集群搭建
IP.主机名规划 hadoop集群规划: hostname IP hadoop 备注 hadoop1 110.185.225.158 NameNode,ResourceManager,DFSZKFai ...
3.环境搭建-Hadoop（CDH）集群搭建
目录目录实验环境安装 Hadoop 配置文件在另外两台虚拟机上搭建hadoop 启动hdfs集群启动yarn集群本文主要是在上节CentOS集群基础上搭建Hadoop集群. 实验环境 Ha ...
Hadoop HA 高可用集群搭建
一.首先配置集群信息 vi /etc/hosts 二.安装zookeeper 1.解压至/usr/hadoop/下 .tar.gz -C /usr/hadoop/ 2.进入/usr/hadoop/zo ...

随机推荐

sudoers文件设置sudo命令无密码（root密码）登录
参考博客:http://xvshell.iteye.com/blog/1838093 1. 当用户执行sudo时,Linux系统会去寻找/etc/sudoers文件,并且这是主动的,判断用户是否有执行 ...
ag-grid
使用: import { AgGridVue } from "ag-grid-vue"; <ag-grid-vue style="width:100%;height ...
【Flask】sqlalchemy 排序
### 排序:1. order_by:可以指定根据这个表中的某个字段进行排序,如果在前面加了一个-,代表的是降序排序.2. 在模型定义的时候指定默认排序:有些时候,不想每次在查询的时候都指定排序的方式 ...
MongoDB部署指南
下載安裝包 http://www.mongodb.org/ 安裝MongoDB systemLog: destination: file path: E:\MongoDB\log\mongo.log ...
安装MySQL5.7.18遇到的坑
最近才注意到MySQL的各个版本之间差别还挺大的,比如5.5.x版本的timestamp类型列只能有一个设置为default CURRENT_TIMESTAMP的,于是尝试了换成一个新版本是mysql ...
JDBC方式操作数据库
1.读取配置文件,我将配置信息写入配置文件(.properties)中,方便后期数据库变更后或者其他项目使用,扩展性好些,尽量避免硬编码. driver=oracle.jdbc.driver.Orac ...
tensorflow笔记：流程，概念和简单代码注释
tensorflow是google在2015年开源的深度学习框架,可以很方便的检验算法效果.这两天看了看官方的tutorial,极客学院的文档,以及综合tensorflow的源码,把自己的心得整理了一 ...
css3实现六边形
实现原理:这个效果的主要css样式有:1.>transform: rotate(120deg); 图片旋转2.>overflow:hidden; 超出隐藏3.>visibility: ...
Linux命令之awk_1
简介 awk是一个强大的文本分析工具,相对于grep的查找,sed的编辑,awk在其对数据分析并生成报告时,显得尤为强大.简单来说awk就是把文件逐行的读入,以空格为默认分隔符将每行切片,切开的部分再 ...
Model compatibility cannot be checked because the database does not contain model metadata. Ensure that IncludeMetadataConvention has been added to the DbModelBuilder conventions
Model compatibility cannot be checked because the database does not contain model metadata. Ensure t ...

hadoop完全分布式文件系统集群搭建

hadoop完全分布式文件系统集群搭建的更多相关文章

随机推荐

热门专题