centos6 hadoop2.7.3分布式搭建

一、hadoop下载

apache所有的project都有自己的域名，可以通过apache官网下的project list去找，也可以直接定位project.apache.org，比如hadoop直接输入网址hadoop.apache.org就可以了

二、环境准备，三台集群机器（centos）

Master 192.168.0.101

Slave1 192.168.0.102

Slave2 192.168.0.103

centos网络设置

首先是虚拟机网络设置，使用net模式，可以保证连上外网

然后是centos的网络设置，注意网卡地址和一些网络单词

最后，修改主机名（防止免密码验证混肴）

vi /etc/sysconfig/netword 和 vi /etc/hosts

修改主机名

三、配置JDK

首先查看服务器是否存在已安装JDK，java -version，看到已装，请将openJDK卸载，安装自己的JDK

vi /etc/profile
export JAVA_HOME=${JAVA_HOME} ${JAVA_HOME} 是你配置jdk的地址，bin的上一层

export PATH=$JAVA_HOME/bin:path

四、克隆服务器

在服务器右键管理，进行克隆

克隆后，修改主机网卡

vi /etc/udev/rules.d/70-presistent-net.rules

将原来的PCI device下面name=“eth0”的网卡删除，将eth1修改为eth0，并记下ATTR（address）

vi /etc/sysconfig/network-script/ifcfg-eth0

修改ip和HWADDR（就是你记住的ATRR）

五、解压hadoop，配置环境变量（以下操作，都在主机）

vi /etc/profile
export HADOOP_HOME=${HADOOP_HOME} 同样这里是你hadoop的解压地址
export PATH=$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$JAVA_HOME/bin:$PATH

六、最关键一步，配置hadoop环境(官方文档：http://hadoop.apache.org/docs/r2.7.3/)

${HADOOP_HOME}/etc/hadoop/hadoop-env.sh

export JAVA_HOME=${JAVA_HOME}      这里配置JDK位置

${HADOOP_HOME}/etc/hadoop/hdfs-site.xml
<property>
<name>dfs.namenode.secondary.http-address</name>
<value>Master：9001</value>
<descript>配置主节点名和端口号</descript>
</property>

<property>

<name>dfs.namenode.name.dir</name>

<value>/usr/local/hadoop-2.7.3/name</value>
<descript>配置从节点名和端口号</descript>

</property>

<property>

<name>dfs.replication</name>

<value>2</value>
<descript>配置副本数</descript>

</property>

<property>

<name>dfs.datanode.data.dir</name>

<value>/usr/local/hadoop-2.7.3/data</value>
<descript>配置datanode的数据存储目录</descript>

</property>

${HADOOP_HOME}/etc/hadoop/core-site.xml
<property>
<name>fs.defaultFS</name>
<value>hdfs://master:9000</value>
<descript>这里的值指的是默认的HDFS地址</descript>
</property>
<property>
<name>io.file.buffer.size</name>
<value>131072</value>
<descript>缓冲区大小：io.file.buffer.size默认是4KB</descript>
</property>
<property>
<name>hadoop.tmp.dir</name>
<value>/usr/local/hadoop-2.7.3/tmp</value>
</property>

${HADOOP_HOME}/etc/hadoop/yarn-site.xml

<property>

<name>yarn.resourcemanager.address</name>

<value>master:8032</value>
<descript>resourcemanager的地址</descript>

</property>

<property>

<name>yarn.resourcemanager.scheduler.address</name>

<value>master:8030</value>
<descript>调度器的端口</descript>

</property>

<property>

<name>yarn.resourcemanager.resource-tracker.address</name>

<value>master:8031</value>
<descript>resource-tracker端口</descript>

</property>

<property>

<name>yarn.resourcemanager.admin.address</name>

<value>master:8033</value>
<descript>resourcemanager管理器端</descript>

</property>

<property>

<name>yarn.resourcemanager.webapp.address</name>

<value>master:8088</value>
<descript>ResourceManager 的 Web 端口，监控 job 的资源调度</descript>

</property>

<property>

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

${HADOOP_HOME}/etc/hadoop/mapred-site.xml
#hadoop对map-reduce运行框架一共提供了3种实现，在mapred-site.xml中通过"mapreduce.framework.name"这个属性来设置为"classic"、"yarn"或者"local"

<property>

<name>mapreduce.framework.name</name>

<value>yarn</value>

</property>

<property>

<name>mapreduce.jobhistory.address</name>

<value>master:10200</value>
<descript>MapReduce JobHistory Server地址</descript>

</property>

<property>

<name>mapreduce..jobhistory.webapp.address</name>

<value>hadoop1:19888</value>
<descript>MapReduce JobHistory Server Web UI地址</descript>

</property>

${HADOOP_HOME}/etc/hadoop/slave

slave1

slave2

这是个人配置，建议还是自己去官网查看配置，可能会对你配置更进一步

七、免密码登录

ssh-keygen -t rsa  四个回车

ssh-copy-id master 对主机免密码

ssh-copy-id slave1

ssh-copy-id slave2

复制hadoop到从机相应地址

scp -r ${HADOOP} slave1:/${HADOOP}

scp -r ${HADOOP} slave2:/${HADOOP}

八、hadoop启动操作（在master执行）

hdfs namenode -format
start-all.sh

使用jps查看各服务器进程

Master：ResourceManager、jps、NameNode、SecondaryNameNode

Slave：jps、DataNode、NodeManager

九、访问

如果是照着步骤一步一步来的话，应该是可以到这最后一步了，

首先在虚拟机外的宿主机的hosts文件中加入Master地址

master:8088、master:50070 进行访问

centos6 hadoop2.7.3分布式搭建的更多相关文章

hadoop2.7伪分布式搭建
0.配置主机名 hostnamectl set-hostname spark1 1.上传hadoop-2.7.1.tar.gz文件并解压 tar -xvf hadoop-2.7.1.tar.gz 2. ...
Docker中自动化搭建Hadoop2.6完全分布式集群
这一节将在<Dockerfile完成Hadoop2.6的伪分布式搭建>的基础上搭建一个完全分布式的Hadoop集群. 1. 搭建集群中需要用到的文件 [root@centos-docker ...
Centos7完全分布式搭建Hadoop2.7.3
(一)软件准备 1,hadoop-2.7.3.tar.gz(包) 2,三台机器装有cetos7的机子 (二)安装步骤 1,给每台机子配相同的用户进入root : su root ---------& ...
hadoop2.8 集群 1 （伪分布式搭建）
简介: 关于完整分布式请参考: hadoop2.8 ha 集群搭建 [七台机器的集群] Hadoop:(hadoop2.8) Hadoop是一个由Apache基金会所开发的分布式系统基础架构.用户 ...
centos7搭建hadoop2.10完全分布式
本篇介绍在centos7中大家hadoop2.10完全分布式,首先准备4台机器:1台nn(namenode);3台dn(datanode) IP hostname 进程 192.168.30.141 ...
ubuntu + hadoop2.5.2分布式环境配置
ubuntu + hadoop2.5.2分布式环境配置我之前有详细写过hadoop-0.20.203.0rc1版本的环境搭建 hadoop学习笔记——环境搭建 http://www.cnblogs. ...
基于centos6.5 hbase 集群搭建
注意本章内容是在上一篇文章“基于centos6.5 hadoop 集群搭建”基础上创建的 1.上传hbase安装包 hbase-0.96.2-hadoop2 我的目录存放在/usr/hadoop/hb ...
Hadoop 完全分布式搭建
搭建环境 https://www.cnblogs.com/YuanWeiBlogger/p/11456623.html 修改主机名------------------- 1./etc/hostname ...
hadoop2集群环境搭建
在查询了很多资料以后,发现国内外没有一篇关于hadoop2集群环境搭建的详细步骤的文章. 所以,我想把我知道的分享给大家,方便大家交流. 以下是本文的大纲: 1. 在windows7 下面安装虚拟机2 ...

随机推荐

uoj#422. 【集训队作业2018】小Z的礼物（MIn-Max容斥+插头dp）
题面传送门题解好迷-- 很明显它让我们求的是\(Max(S)\),我们用\(Min-Max\)容斥,因为\(Min(S)\)是很好求的,只要用方案数除以总方案数算出概率,再求出倒数就是期望了然 ...
kuangbin专题七 HDU3974 Assign the task （dfs时间戳建树）
There is a company that has N employees(numbered from 1 to N),every employee in the company has a im ...
pacman命令用法
Pacman 是一个命令行工具,这意味着当你执行下面的命令时,必须在终端或控制台中进行. 1.更新系统在 Arch Linux 中,使用一条命令即可对整个系统进行更新: pacman -Syu 如果 ...
P4245 【模板】任意模数NTT
Luogu4245 只要做三次的NTT,快的飞起普通NTT,做9次 #include<cstdio> #include<cstring> #include<iostre ...
AngularJS页面【uib-dropdown】控件在模态窗口（弹出窗）中无法使用问题
如果你的下拉框中有属性 dropdown-append-to-body 将它去掉,即可正常使用该插件. <div class="btn-group dropdown" uib ...
poj3020 建信号塔（匈牙利算法最小覆盖边集）
Antenna Placement Time Limit: 1000MS Memory Limit: 65536K Total Submissions: 10518 Accepted: 518 ...
Experimental Educational Round: VolBIT Formulas Blitz N
Description The Department of economic development of IT City created a model of city development ti ...
内置函数_eval
eval功能:将字符串str当成有效的表达式来求值并返回计算结果. 语法: eval(source[, globals[, locals]]) -> value 参数说明: expression ...
基于Visual Studio .NET2015的单元测试 OpenCover
https://www.cnblogs.com/XiaoRuLiang/p/10095723.html 基于Visual Studio .NET2015的单元测试 1. 在Visual Stud ...
java——巨简陋文本编辑器
String :equals()方法是进行内容比较,而不是引用比较. “==”比较两个变量本身的值,即两个对象在内存中的首地址. Scanner :用Scanner实现字符串的输入有两种方法,一种是n ...

centos6 hadoop2.7.3分布式搭建

centos6 hadoop2.7.3分布式搭建的更多相关文章

随机推荐

热门专题