Hadoop hdfs完全分布式搭建教程

1、安装环境

　　①、四台Linux CentOS6.7 系统

　　hostname ipaddress 　　 subnet mask geteway　　　　

1、 master　　　　　192.168.146.200　　　　255.255.255.0　　　　　　192.168.146.2

2、 slave1　　　　　 192.168.146.201　　　　255.255.255.0　　　　　　192.168.146.2

3、 slave2　　　　　 192.168.146.202　　　　255.255.255.0　　　　　　192.168.146.2

4、 slave3　　　　　 192.168.146.203　　　　255.255.255.0　　　　　　192.168.146.2

　　其中 master 机器是 NameNode;

　　　　 slave1 机器是 SecondaryNameNode

　　　　 slave1,slave2,slave3 是三台 DataNode

　　②、hadoop 2.7 安装包

　　　　百度云下载链接：http://pan.baidu.com/s/1gfaKpA7密码：3cl7

　　③、三台机器上建立一个相同的用户 hadoop

2、安装 JDK

　　教程：http://www.cnblogs.com/ysocean/p/6952166.html

3、配置SSH 无密码登录

　　教程：http://www.cnblogs.com/ysocean/p/6959776.html

我们以 master 机器来进行如下配置：

4、解压 hadoop-2.7.3.tar.gz

　　①、将下载的 hadoop-2.7.3.tar.gz 复制到 /home/hadoop 目录下（可以利用工具 WinSCP）

　　②、解压，进入/home/hadoop 目录下，输入下面命令

tar -zxvf hadoop-2.7.3.tar.gz

　　③、给 hadoop-2.7.3文件夹重命名，以便后面引用

mv hadoop-2.7.3 hadoop2.7

　　④、删掉压缩文件 hadoop-2.7.3.tar.gz,并在/home/hadoop 目录下新建文件夹tmp

　 ⑤、配置 hadoop 环境变量(这里我Java 和 hadoop 环境变量一起配置了)

　　使用 root 用户登录。输入

vi /etc/profile

5、配置 hadoop 文件中相应的文件

　需要配置的文件如下，hadoop-env.sh，core-site.xml，hdfs-site.xml，slaves，所有的文件配置均位于hadoop2.7.1/etc/hadoop下面，具体需要的配置如下：

　　5.1 配置/home/hadoop/hadoop2.7/etc/hadoop目录下的core-site.xml

<configuration>

    <property>

        <name>fs.defaultFS</name>

        <value>hdfs://192.168.146.200:9000</value>

    </property>

    <property>

        <name>hadoop.tmp.dir</name>

        <value>/home/hadoop/tmp</value>

    </property>

</configuration>

　　注意：hadoop.tmp.dir是hadoop 文件系统依赖的配置文件。默认是在 /tmp 目录下的，而这个目录下的文件，在Linux系统中，重启之后，很多都会被清空。所以我们要手动指定这写文件的保存目录。

　　　　　这个目录路径要么不存在，hadoop启动的时候会自动帮我们创建；要么是一个空目录，不然在启动的时候会报错。

　　5.2配置/home/hadoop/hadoop-2.7/etc/hadoop目录下的hdfs-site.xml

<configuration>

    <property>

        <name>dfs.replication</name>

        <value>3</value>

    </property>

    <property>

        <name>dfs.namenode.secondary.http-address</name>

        <value>192.168.146.201:50090</value>

    </property>

</configuration>

　　注意：dfs.replication 是配置文件保存的副本数；dfs.namenode.secondary.http-address 是指定 secondary 的节点。

　　5.3配置/home/hadoop/hadoop-2.7/etc/hadoop目录下hadoop-env.sh 的JAVA_HOME

　　设置 JAVA_HOME 为自己在系统中安装的 JDK 目录

　　5.4配置/home/hadoop/hadoop-2.7/etc/hadoop目录下的slaves，删除默认的localhost，增加3个从节点

　　5.5、指定 SecondaryNameNode 节点

　　在 /home/hadoop hadoop-2.7/etc/hadoop 目录下手动创建一个 masters 文件

vi masters

　　打开文件后，输入 SecondaryNameNode 节点的主机名或者 IP 地址

6、将配置好的 hadoop 文件上传给其它三个节点

scp -r /home/hadoop 192.168.146.201:/home/

scp -r /home/hadoop 192.168.146.202:/home/

scp -r /home/hadoop 192.168.146.203:/home/

7、启动 hadoop

在master服务器启动hadoop，从节点会自动启动，进入/home/hadoop/hadoop-2.7目录

(1)初始化，输入命令，bin/hdfs namenode -format

(2)启动hdfs 命令：sbin/start-dfs.sh

(3)停止命令，sbin/stop-hdfs.sh

(4)输入命令，jps，可以看到相关信息

8、访问界面

　　①、关闭防火墙

service iptables stop

chkconfig iptables off

　　②、访问 NameNode 节点信息：http://192.168.146.200:50070

　　　　点击DataNodes 查看 DataNode 节点

　　③、访问 SecondaryNameNode 节点信息，就是我们在hdfs-site.xml 中配置的路径 http://192.168.146.201:50090

Hadoop hdfs完全分布式搭建教程的更多相关文章

hadoop HDFS完全分布式搭建
1.准备阶段准备好两台虚拟机(安装好hadoop,见:https://www.cnblogs.com/cjq10029/p/12336446.html),计划: IP 主机名 192.168.3.7 ...
Hadoop的完全分布式搭建
一.准备虚拟机两台 1.将虚拟机进行克隆https://www.cnblogs.com/the-roc/p/12336745.html 2.1将克隆虚拟机的IP修改一下 vi /etc/sysconf ...
hbase+hadoop+hdfs集群搭建集成spring
序言最近公司一个汽车项目想用hbase做存储,然后就有了这篇文字,来,来,来, 带你一起征服hbase,并推荐一本书<hbase权威指南> 这是一本极好的hbase入门书籍,我花了一个晚 ...
Hadoop单机模式和伪分布式搭建教程CentOS
1. 安装JAVA环境 2. Hadoop下载地址: http://archive.apache.org/dist/hadoop/core/ tar -zxvf hadoop-2.6.0.tar.gz ...
Hadoop的伪分布式搭建
我们在搭建伪分布式Hadoop环境,需要将一系列的配置文件配置好. 一.配置文件 1. 配置文件hadoop-env.sh export JAVA_HOME=/opt/modules/jdk1.7.0 ...
大数据hadoop的伪分布式搭建
1.配置环境变量JDK配置 1.JDK安装个人喜欢在 vi ~/.bash profile 下配置 export JAVA_HOME=/home/hadoop/app/jdk1.8.0_91ex ...
HDFS——完全分布式搭建
架构 NN--namenode SNN--secondnamenode DN--datanode hadoop_env.sh中修改JAVA_HOME core-site.xml <propert ...
Linux单机环境下HDFS伪分布式集群安装操作步骤v1.0
公司平台的分布式文件系统基于Hadoop HDFS技术构建,为开发人员学习及后续项目中Hadoop HDFS相关操作提供技术参考特编写此文档.本文档描述了Linux单机环境下Hadoop HDFS伪分 ...
『实践』VirtualBox 5.1.18+Centos 6.8+hadoop 2.7.3搭建hadoop完全分布式集群及基于HDFS的网盘实现
『实践』VirtualBox 5.1.18+Centos 6.8+hadoop 2.7.3搭建hadoop完全分布式集群及基于HDFS的网盘实现 1.基本设定和软件版本主机名 ip 对应角色 mas ...

随机推荐

webmagic源码学习(一)
最近工作主要是一些爬虫相关的东西,由于公司需要构建自己的爬虫框架,在调研过程中参考了许多优秀的开源作品,包括webmagic,webcollector,Spiderman等,通过学习这些优秀的源码获益 ...
线下市场，选择微信小程序从未显得如此重要
2017 年 1 月 9 日,小程序正式上线,到今日,3 月 8 号,这个新产品面世刚好满两个月.小程序刚推出便受到全球关注,腾讯股价当天即创逾一个月高位,但关注度先是急速上涨,不久便迅速降温,甚至在 ...
android在myeclipse上创建的项目各种报错
这几天被android弄得头疼死了.差不多把电脑弄了个遍. 先是离线安装ADT,下载ADT,然后配置,但是因为ADT与MyEclipse冲突.所以直接不要再myeclipse下弄Android的环境了 ...
微信公众号开发笔记1(nodejs开发的)
本篇记录了微信公众号开发的一些笔记一.微信服务器与我们服务器的交流微信开发者拥有自己的服务器,在我们服务器上可以与微信服务器进行交流.既然可以交流,那就必定需要前提条件(微信认证),也就是说,只有 ...
Thinkphp模板简单入门
Thinkphp模板概述: ThinkPHP内置了一个基于XML的性能卓越的模板引擎,这是一个专门为ThinkPHP服务的内置模板引擎,使用了XML标签库技术的编译型模板引擎,支持两种类型的模板标签, ...
Android 6.0的权限问题
Android 6.0的权限获取不同于别的版本,具体的实例如下: if (ContextCompat.checkSelfPermission(this, Manifest.permission.REA ...
[js笔记整理]面向对象篇
一.js面向对象基本概念对象:内部封装.对外预留接口,一种通用的思想,面向对象分析: 1.特点 (1)抽象 (2)封装 (3)继承:多态继承.多重继承 2.对象组成 (1)属性: 任何对象都可以添加 ...
redis中的事务
首先明白在java中线程和进程的区别: 1.什么是多线程? 是指一个应用程序同时执行多个任务,一般来说一个任务就是一个线程 ,而一个应用程序有一个以上的线程我们称之为多线程. 2.什么是进程? 进程是 ...
Java学习笔记——排序算法之进阶排序（堆排序与分治并归排序）
春蚕到死丝方尽,蜡炬成灰泪始干 --无题这里介绍两个比较难的算法: 1.堆排序 2.分治并归排序先说堆. 这里请大家先自行了解完全二叉树的数据结构. 堆是完全二叉树.大顶堆是在堆中,任意双亲值都大 ...
微信公众号开发《三》微信JS-SDK之地理位置的获取，集成百度地图实现在线地图搜索
本次讲解微信开发第三篇:获取用户地址位置信息,是非常常用的功能,特别是服务行业公众号,尤为需要该功能,本次讲解的就是如何调用微信JS-SDK接口,获取用户位置信息,并结合百度地铁,实现在线地图搜索,与 ...

Hadoop hdfs完全分布式搭建教程

Hadoop hdfs完全分布式搭建教程的更多相关文章

随机推荐

热门专题