超详细从零记录Ubuntu16.04.1 3台服务器上Hadoop2.7.3完全分布式集群部署过程。包含，Ubuntu服务器创建、远程工具连接配置、Ubuntu服务器配置、Hadoop文件配置、Hadoop格式化、启动。（首更时间2016年10月27日）

主机名/hostname	IP	角色
hadoop1	192.168.193.131	ResourceManager/NameNode/SecondaryNameNode
hadoop2	192.168.193.132	NodeManager/DataNode
hadoop3	192.168.193.133	NodeManager/DataNode

1.0.准备

1.1.目录

用VMware创建3个Ubuntu虚拟机
用mobaxterm远程连接创建好的虚拟机
配置Ubuntu虚拟机源、ssh无密匙登录、jdk
配置Hadoop集群文件(Github源码)
启动Hadoop集群、在Windows主机上显示集群状态。

1.2.提前准备安装包

Windows10（宿主操作系统）
VMware12 workstation（虚拟机）
Ubuntu16.04.1 LTS 服务器版
Hadoop2.7.3
jdk1.8
MobaXterm（远程连接工具）
Github源码,记得start哦（CSDN博文中全部源码公开至个人github）

2. VMvare安装Ubuntu16.04.1LTS服务器版过程

2.1.注意在安装时username要一致如xiaolei，即主机用户名。而主机名hostname可不同如hadoop1,hadoop2,hadoop3.或者master,slave1,slave2.在本篇博文中用hadoop1,2,3区分hostname主机名。

2.2.VMvare安装Ubuntu16.04.1LTS桌面版过程

2.3.在VMvare中选择 `文件` 然后 `新建虚拟机`

2.4选择典型安装

2.5.选择下载好的Ubuntu64位 16.04.1 LTS服务器版镜像

2.6.个性化Linux设置

2.7.虚拟机命名及文件路径 wangxiaolei \ hadoop1等随意可更换

2.8.磁盘分配，默认即可，磁盘大小可以根据自身硬盘空间调节（不要太小）

2.9.然后就是等待安装完成，输入登录名 xiaolei 登录密码**…

建立好的虚拟机如下

通过ipconfig命令查看服务器ip地址

IP 192.168.193.131   默认主机名ubuntu

IP 192.168.193.132   默认主机名ubuntu

IP 192.168.193.133   默认主机名ubuntu

下一步会修改主机名hostname

3. 配置Ubuntu系统（服务器版在VMware中操作不方便，通过远程在putty或者MobaXterm操作比较快捷些）

3.1 安装ssh即可。这里不需要 `ssh-keygen`。

打开终端或者服务器版命令行
查看是否安装（ssh）openssh-server，否则无法远程连接。

sshd

sudo apt install openssh-server

3.2.安装ssh后，可以通过工具（putty或者MobaXterm）远程连接已经建立好的服务器（Hadoop1，Hadoop2，Hadoop3）

同样三个虚拟机建立连接

3.3.更换为国内源（清华大学帮助文档）

在Hadoop1、Hadoop2、Hadoop3中

xiaolei@ubuntu:~$ sudo vi /etc/apt/sources.list

# 默认注释了源码镜像以提高 apt update 速度，如有需要可自行取消注释

deb https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ xenial main restricted universe multiverse

# deb-src https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ xenial main main restricted universe multiverse

deb https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ xenial-updates main restricted universe multiverse

# deb-src https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ xenial-updates main restricted universe multiverse

deb https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ xenial-backports main restricted universe multiverse

# deb-src https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ xenial-backports main restricted universe multiverse

deb https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ xenial-security main restricted universe multiverse

# deb-src https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ xenial-security main restricted universe multiverse

# 预发布软件源，不建议启用

# deb https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ xenial-proposed main restricted universe multiverse

# deb-src https://mirrors.tuna.tsinghua.edu.cn/ubuntu/ xenial-proposed main restricted universe multiverse

更新源

xiaolei@ubuntu:~$ sudo apt update

3.4.安装vim编辑器，默认自带vi编辑器

sudo apt install vim

更新系统（服务器端更新量小，桌面版Ubuntu更新量较大，可以暂时不更新）

sudo apt-get upgrade

3.5.修改Ubuntu服务器hostname主机名，主机名和ip是一一对应的。

#在192.168.193.131

xiaolei@ubuntu:~$ sudo hostname hadoop1

#在192.168.193.131

xiaolei@ubuntu:~$ sudo hostname hadoop2

#在192.168.193.131

xiaolei@ubuntu:~$ sudo hostname hadoop3

#断开远程连接，重新连接即可看到已经改变了主机名。

3.6.增加hosts文件中ip和主机名对应字段

在Hadoop1,2,3中

xiaolei@hadoop1:~$ sudo vim /etc/hosts

192.168.193.131 hadoop1

192.168.193.132 hadoop2

192.168.193.133 hadoop3

3.7.更改系统时区（将时间同步更改为北京时间）

xiaolei@hadoop1:~$ date

Wed Oct 26 02:42:08 PDT 2016

xiaolei@hadoop1:~$ sudo tzselect

根据提示选择Asia China Beijing Time yes
最后将Asia/Shanghai shell scripts 复制到/etc/localtime

xiaolei@hadoop1:~$ sudo cp /usr/share/zoneinfo/Asia/Shanghai  /etc/localtime

xiaolei@ubuntu:~$ date

Wed Oct 26 17:45:30 CST 2016

4. Hadoop集群完全分布式部署过程

JDK配置
Hadoop集群部署

4.1.安装JDK1.8 (配置源码Github，记得start哦)

4.1.1将所需文件（Hadoop2.7.3、JDK1.8）上传至Hadoop1服务器（可以直接复制粘贴）

4.1.2.解压缩并将jdk放置/opt路径下

xiaolei@hadoop1:~$ tar -zxf jdk-8u111-linux-x64.tar.gz

hadoop1@hadoop1:~$ sudo mv jdk1.8.0_111 /opt/

[sudo] password for hadoop1:

xiaolei@hadoop1:~$

4.1.3.配置环境变量

编写环境变量脚本并使其生效

xiaolei@hadoop1:~$ sudo vim /etc/profile.d/jdk1.8.sh

输入内容(或者在我的github上下载jdk环境配置脚本源码)

#!/bin/sh

# author:wangxiaolei 王小雷

# blog:http://blog.csdn.net/dream_an

# date:20161027

export JAVA_HOME=/opt/jdk1.8.0_111

export JRE_HOME=${JAVA_HOME}/jre

export CLASSPATH=.:${JAVA_HOME}/lib:${JRE_HOME}/lib

export PATH=${JAVA_HOME}/bin:$PATH

xiaolei@hadoop1:~$ source /etc/profile

4.1.4.验证jdk成功安装

xiaolei@hadoop1:~$ java -version

java version "1.8.0_111"

Java(TM) SE Runtime Environment (build 1.8.0_111-b14)

Java HotSpot(TM) 64-Bit Server VM (build 25.111-b14, mixed mode)

4.1.5.同样方法安装其他集群机器。

也可通过scp命令

#注意后面带 : 默认是/home/xiaolei路径下

xiaolei@hadoop1:~$ scp jdk-8u111-linux-x64.tar.gz hadoop2:

命令解析：scp 远程复制 -r 递归 本机文件地址 app是文件，里面包含jdk、Hadoop包 远程主机名@远程主机ip:远程文件地址

4.2.集群ssh无密匙登录

4.2.1.在hadoop1,hadoop2,hadoop3中执行

sudo apt install ssh

sudo apt install rsync

xiaolei@ubuntu:~$ ssh-keygen -t rsa //一路回车就好

4.2.2.在 Hadoop1（master角色）执行，将~/.ssh/下的id_rsa.pub公私作为认证发放到hadoop1,hadoop2,hadoop3的~/.ssh/下

ssh-copy-id -i ~/.ssh/id_rsa.pub hadoop1

ssh-copy-id -i ~/.ssh/id_rsa.pub hadoop2

ssh-copy-id -i ~/.ssh/id_rsa.pub hadoop3

4.2.3.然后在 Hadoop1 上登录其他Linux服务器不需要输入密码即成功。

#不需要输入密码

ssh hadoop2

5.hadoop完全分布式集群文件配置和启动

在hadoop1上配置完成后将Hadoop包直接远程复制scp到其他Linux主机即可。
Linux主机Hadoop集群完全分布式分配

5.1.Hadoop主要文件配置（Github源码地址）

5.1.1.在Hadoop1，2，3中配置Hadoop环境变量

xiaolei@hadoop2:~$ sudo vim /etc/profile.d/hadoop2.7.3.sh

输入

#!/bin/sh

# Author:wangxiaolei 王小雷

# Blog:http://blog.csdn.net/dream_an

# Github:https://github.com/wxiaolei

# Date:20161027

# Path：/etc/profile.d/hadoop2.7.3.sh

export HADOOP_HOME="/opt/hadoop-2.7.3"

export PATH="$HADOOP_HOME/bin:$PATH"

export HADOOP_CONF_DIR=$HADOOP_HOME/etc/hadoop

export YARN_CONF_DIR=$HADOOP_HOME/etc/hadoop

5.1.2.配置 hadoop-env.sh 增加如下内容

export JAVA_HOME=/opt/jdk1.8.0_111

5.1.3.配置slaves文件，增加slave主机名

hadoop2

hadoop3

5.1.4.配置 core-site.xml

<configuration>

        <!-- 指定hdfs的nameservice为ns1 -->

        <property>

                <name>fs.defaultFS</name>

                <value>hdfs://Hadoop1:9000</value>

        </property>

        <!-- Size of read/write buffer used in SequenceFiles. -->

        <property>

         <name>io.file.buffer.size</name>

         <value>131072</value>

       </property>

        <!-- 指定hadoop临时目录,自行创建 -->

        <property>

                <name>hadoop.tmp.dir</name>

                <value>/home/xiaolei/hadoop/tmp</value>

        </property>

</configuration>

5.1.5.配置 hdfs-site.xml

<configuration>

    <property>

      <name>dfs.namenode.secondary.http-address</name>

      <value>hadoop1:50090</value>

    </property>

    <property>

      <name>dfs.replication</name>

      <value>2</value>

    </property>

    <property>

      <name>dfs.namenode.name.dir</name>

      <value>file:/home/xiaolei/hadoop/hdfs/name</value>

    </property>

    <property>

      <name>dfs.datanode.data.dir</name>

      <value>file:/home/xiaolei/hadoop/hdfs/data</value>

    </property>

</configuration>

5.1.6.配置yarn-site.xml

<configuration>

<!-- Site specific YARN configuration properties -->

<!-- Configurations for ResourceManager -->

     <property>

          <name>yarn.nodemanager.aux-services</name>

          <value>mapreduce_shuffle</value>

     </property>

     <property>

           <name>yarn.resourcemanager.address</name>

           <value>hadoop1:8032</value>

     </property>

     <property>

          <name>yarn.resourcemanager.scheduler.address</name>

          <value>hadoop1:8030</value>

      </property>

     <property>

         <name>yarn.resourcemanager.resource-tracker.address</name>

         <value>hadoop1:8031</value>

     </property>

     <property>

         <name>yarn.resourcemanager.admin.address</name>

         <value>hadoop1:8033</value>

     </property>

     <property>

         <name>yarn.resourcemanager.webapp.address</name>

         <value>hadoop1:8088</value>

     </property>

</configuration>

5.1.7.配置mapred-site.xml

<configuration>

  <property>

    <name>mapreduce.framework.name</name>

    <value>yarn</value>

  </property>

  <property>

          <name>mapreduce.jobhistory.address</name>

          <value>hadoop1:10020</value>

  </property>

  <property>

          <name>mapreduce.jobhistory.address</name>

          <value>hadoop1:19888</value>

  </property>

</configuration>

5.1.8.复制Hadoop配置好的包到其他Linux主机

xiaolei@hadoop1:~$ scp -r hadoop-2.7.3 hadoop3:

将每个Hadoop包sudo mv移动到/opt/路径下。不要sudo cp，注意权限。

xiaolei@hadoop1:sudo mv hadoop-2.7.3 /opt/

5.2.格式化节点

在hadoop1上执行

xiaolei@hadoop1:/opt/hadoop-2.7.3$ hdfs namenode -format

5.3.hadoop集群全部启动

### 5.3.1. 在Hadoop1上执行

xiaolei@hadoop1:/opt/hadoop-2.7.3/sbin$ ./start-all.sh

5.3.2.其他主机上`jps`

5.3.3.在主机上查看，博主是Windows10，直接在浏览器中输入hadoop1 集群地址即可。

http://192.168.193.131:8088/

5.3.4. Github源码位置——超详细从零记录Hadoop2.7.3完全分布式集群部署过程

5.4.可能问题：

权限问题：
chown -R xiaolei:xiaolei hadoop-2.7.3
解析：将hadoop-2.7.3文件属主、组更换为xiaolei:xiaolei
chmod 777 hadoop
解析：将hadoop文件权限变成421 421 421 可写、可读可、执行即 7 7 7
查看是否安装openssh-server

ssd

或者

ps -e|grep ssh

安装 openssh-server

sudo apt install openssh-server

问题解决：
问题
Network error: Connection refused
解决安装

Network error: Connection refused

超详细从零记录Hadoop2.7.3完全分布式集群部署过程的更多相关文章

Centos7.5搭建Hadoop2.8.5完全分布式集群部署
一.基础环境设置 1. 准备4台客户机(VMware虚拟机) 系统版本:Centos7.5 节点配置: 192.168.208.128 --Master 192.168.208.129 --Slave ...
超详细，多图文使用galera cluster搭建mysql集群并介绍wsrep相关参数
超详细,多图文使用galera cluster搭建mysql集群并介绍wsrep相关参数介绍galera cluster原理的文章已经有一大堆了,百度几篇看一看就能有相关了解,这里就不赘述了.本文主 ...
# 从零開始搭建Hadoop2.7.1的分布式集群
Hadoop 2.7.1 (2015-7-6更新),Hadoop的环境配置不是特别的复杂,可是确实有非常多细节须要注意.不然会造成很多配置错误的情况.尽量保证一次配置正确防止重复改动. 网上教程有非常 ...
搭建Hadoop2.7.1的分布式集群
Hadoop 2.7.1 (2015-7-6更新),hadoop的环境配置不是特别的复杂,但是确实有很多细节需要注意,不然会造成许多配置错误的情况.尽量保证一次配置正确防止反复修改. 网上教程有很多关 ...
Hadoop（二）CentOS7.5搭建Hadoop2.7.6完全分布式集群
一完全分布式集群(单点) Hadoop官方地址:http://hadoop.apache.org/ 1 准备3台客户机 1.1防火墙,静态IP,主机名关闭防火墙,设置静态IP,主机名此处略,参考 ...
Hadoop2.X分布式集群部署
本博文集群搭建没有实现Hadoop HA,详细文档在后续给出,本次只是先给出大概逻辑思路. (一)hadoop2.x版本下载及安装 Hadoop 版本选择目前主要基于三个厂商(国外)如下所示: 基于A ...
CentOS7.5搭建Hadoop2.7.6完全分布式集群
一完全分布式集群搭建 Hadoop官方地址:http://hadoop.apache.org/ 1 准备3台客户机 1.2 关闭防火墙,设置静态IP,主机名关闭防火墙,设置静态IP,主机名此处略 ...
Hadoop2.7.3+spark2.1.0+hbase0.98分布式集群部署
运行环境配置(10.79.115.111-114) 1.关闭防火墙与selinux 关闭防火墙: CentOS 7.x默认使用的是firewall作为防火墙. systemctl stop firew ...
新闻实时分析系统-Hadoop2.X分布式集群部署
(一)hadoop2.x版本下载及安装 Hadoop 版本选择目前主要基于三个厂商(国外)如下所示: 1.基于Apache厂商的最原始的hadoop版本, 所有发行版均基于这个版本进行改进. 2.基于 ...

随机推荐

作业20171102 alpha-review 成绩
申诉对成绩有疑问或不同意见的同学,请在群里[@杨贵福]. 申诉时间截止2017年12月12日 17:00. 成绩 review NABCD-评论 SPEC-评论例行报告附加分数合计本周归一化 ...
Linux内核分析——第三章进程管理
第三章进程管理 3.1 进程 1.进程就是处于执行期的程序:进程就是正在执行的程序代码的实时结果:进程是处于执行期的程序以及相关的资源的总称:进程包括代码段和其他资源. 线程:是在进程中活动的对象. ...
关于git的一些体会：
周忠贤github链接:https://github.com/zhouzhongxian git学习心得:通过这次的学习,体会到了许多东西只要你用心去做,就没有什么做不成,,这次体会到了网上学习的重要 ...
Leetcode——53.最大子序和
@author: ZZQ @software: PyCharm @file: leetcode53_最大子序和.py @time: 2018/11/26 12:39 要求:给定一个整数数组 nums ...
Hadoop and net core a match made in docker
https://blog.sixeyed.com/hadoop-and-net-core-a-match-made-in-docker/
css 按钮凹陷的感觉
.login-btn{ margin-top: 60rpx !important; background-color:transparent !important; width: 40%; margi ...
ionic动态切换主题皮肤
本来想通过css自定义属性值: :root{ --red:red; } p{ color:var(--red); } div{ background:var(--red); } 在ionic2设置动态 ...
ionic3应用的Android打包签名发布步骤
版权声明:本文为博主原创文章,未经博主允许不得转载. 当我们的ionic应用开发结束之后,就要开始上线到应用市场,那么Android的发布步骤具体是怎么样的呢? 1)编译运行命令行: ionic c ...
python箱型图
#-*- coding: utf-8 -*- import pandas as pd catering_sale = '../data/catering_sale.xls' #餐饮数据 data = ...
sql server2005查询分析器显示行号方法
工具栏:工具--选项--文本编辑器---所有语言--右边复选框行号打上勾就ok了

超详细从零记录Hadoop2.7.3完全分布式集群部署过程