CentOS 6.7安装Hadoop 2.6.3集群环境

在CentOS 6.7 x64上搭建Hadoop 2.6.3完全分布式环境，并在DigitalOcean上测试成功。

本文假设：

主节点（NameNode）域名（主机名）：m.fredlab.org

子节点（DataNode）域名（主机名）：s1.fredlab.org

                              s2.fredlab.org

                              s3.fredlab.org

Tip：单个NameNode或DataNode内存大于1G，在512MB内存的VPS上测试不成功。

一、配置SSH互信

1、master机上生成公私钥：id_rsa和id_rsa.pub

ssh-keygen

2、上传到每个节点机器的.ssh/目录下

.ssh/----

    |--

    |--id_rsa

    |--id_rsa.pub

    |--authorized_keys

    |--

3、更改私钥权限为0600

chmod  id_rsa

4、复制公钥至authorized_keys

cat id_rsa.pub >> authorized_keys

5、配置SSH免询问（yes）登录（可选）

修改/etc/ssh/ssh_config的以下两行

StrictHostKeyChecking no

GSSAPIAuthentication no

重启ssh服务

service sshd restart

二、为各个主机配置域名（主机名）

1、修改主机名

vim /etc/sysconfig/network

修改HOSTNAME=s1.fredlab.org（主机名），其他节点同理。

2、将主机名和对应ip地址加入/etc/hosts，格式类似：

104.236.142.235   m.fredlab.org

104.236.143.22    s1.fredlab.org

104.236.143.54    s2.fredlab.org

107.170.224.199   s3.fredlab.org

三、安装Java JDK环境

1、下载java jdk rpm包

http://www.oracle.com/technetwork/java/javase/downloads/index.html

2、安装

rpm -ih jdk-8u72-linux-x64.rpm

3、检验java路径，以及版本

which java

which javac

java -version

4、默认JAVA_HOME=/usr

四、安装hadoop 2.6.3

【以下操作均在master上进行】

1、下载hadoop 2.6.3

wget http://www.eu.apache.org/dist/hadoop/common/hadoop-2.6.3/hadoop-2.6.3.tar.gz

2、解压安装（安装位置/usr/local/hadoop2）

tar zxf hadoop-2.6..tar.gz

mv hadoop-2.6. /usr/local/hadoop2

3、增加数据目录和临时目录（位置可选，与配置文件对应即可）

mkdir /usr/local/hadoop2/tmp

mkdir /usr/local/hadoop2/hdfs

4、修改配置文件（位于/usr/local/hadoop2/etc/hadoop/目录下）

主配置文件：core-site，其中m.fredlab.org为NameNode的域名（主机名）

<configuration>

  <property>

    <name>hadoop.tmp.dir</name>

    <value>/usr/local/hadoop2/tmp</value>

    <description>temp dir</description>

  </property>

  <property>

    <name>fs.defaultFS</name>

    <value>hdfs://m.fredlab.org:9000</value>

  </property>

  <property>

    <name>io.file.buffer.size</name>

    <value></value>

  </property>

</configuration>

hdfs配置文件：hdfs-site.xml

<configuration>

  <property>

    <name>dfs.namenode.name.dir</name>

    <value>file:/usr/local/hadoop2/hdfs/name</value>

  </property>

  <property>

    <name>dfs.datanode.data.dir</name>

    <value>file:/usr/local/hadoop2/hdfs/data</value>

  </property>

  <property>

    <name>dfs.blocksize</name>

    <value></value>

  </property>

  <property>

    <name>dfs.namenode.handler.count</name>

    <value></value>

  </property>

   <property>

    <name>dfs.replication</name>

    <value></value>

  </property>

</configuration>

yarn-site.xml

<configuration>

    <property>

        <name>yarn.nodemanager.aux-services</name>

        <value>mapreduce_shuffle</value>

    </property>

</configuration>

mapred-site.xml

<configuration>

  <property>

    <name>mapreduce.framework.name</name>

    <value>yarn</value>

  </property>

</configuration>

将java路径加入hadoop-env.sh和yarn-env.sh

echo "export JAVA_HOME=/usr" >> hadoop-env.sh

echo "export JAVA_HOME=/usr" >> yarn-env.sh

在slaves文件中加入各个节点的域名（主机名），每行一个，类似：

s1.fredlab.org

s2.fredlab.org

s3.fredlab.org

五、复制配置好的hadoop到各个Slaves

将/usr/local/hadoop2目录一起拷贝到各个DataNode机器上

scp -r /usr/local/hadoop2 root@s1.fredlab.org:/usr/local/

六、启动hadoop集群

1、格式化文件系统

/usr/local/hadoop2/bin/hdfs namenode -format

2、启动集群

启动hdfs

/usr/local/hadoop2/sbin/start-dfs.sh

启动yarn

/usr/local/hadoop2/sbin/start-yarn.sh

3、检查文件系统

/usr/local/hadoop2/bin/hdfs dfsadmin -report

4、web页面观测集群运行情况

集群运行状态：http://m.fredlab.org:50070

http://master_ip:50070

集群应用状态：http://m.fredlab.org:8088

http://master_ip:8088

5、查看各个节点java进程

NameNode，m.fredlab.org上执行：jps

 ResourceManager

 NameNode

 SecondaryNameNode

 Jps

DataNode，s1.fredlab.org上执行：jps

 Jps

 DataNode

CentOS 6.7安装Hadoop 2.6.3集群环境的更多相关文章

1.如何在虚拟机ubuntu上安装hadoop多节点分布式集群
要想深入的学习hadoop数据分析技术,首要的任务是必须要将hadoop集群环境搭建起来,可以将hadoop简化地想象成一个小软件,通过在各个物理节点上安装这个小软件,然后将其运行起来,就是一个had ...
Hadoop+HBase+ZooKeeper分布式集群环境搭建
一.环境说明集群环境至少需要3个节点(也就是3台服务器设备):1个Master,2个Slave,节点之间局域网连接,可以相互ping通,下面举例说明,配置节点IP分配如下: Hostname IP ...
CentOS 7.4 安装 K8S v1.11.0 集群所遇到的问题
0.引言最近打算将现有项目的 Docker 部署到阿里云上面,但是之前是单机部署,现在阿里云上面有 3 台机器,所以想做一个 Docker 集群.之前考虑是用 Docker Swarm 来做这个事情 ...
基于CentOS 8服务器来搭建FastDFS高可用集群环境
服务器版本我们在服务器的命令行输入如下命令来查看服务器的内核版本. [root@localhost lib]# cat /etc/redhat-release CentOS Linux releas ...
Hadoop学习12-配置集群环境
由于之前虚拟机都是用的桥接方式,有时候没有网络可用,想学习的时候,就狠不方便. 于是研究了一下,希望搭建一个多台虚机组成一个局域网的集群,即host-only方式 1.安装VM,网络选择“host-o ...
Linux安装ElasticSearch与MongoDB分布式集群环境下数据同步
ElasticSearch有一个叫做river的插件式模块,可以将外部数据源中的数据导入elasticsearch并在上面建立索引.River在集群上是单例模式的,它被自动分配到一个节点上,当这个节点 ...
centos 7.2 安装域名服务器（bind9.9 集群--主从架构）,私有域名服务器+缓存
1.安装组件 yum install bind bind-utils -y 2.启动域名服务 service named start chkconfig named on ss -unlt |grep ...
大数据hadoop入门学习之集群环境搭建集合
目录: 1.基本工作准备 1.虚拟机准备 2.java 虚拟机-jdk环境配置 3.ssh无密码登录 2.hadoop的安装与配置 3.hbase安装与配置(集成安装zookeeper) 4.zook ...
kubeadm安装kubernetes V1.11.1 集群
之前测试了离线环境下使用二进制方法安装配置Kubernetes集群的方法,安装的过程中听说 kubeadm 安装配置集群更加方便,因此试着折腾了一下.安装过程中,也有一些坑,相对来说操作上要比二进制方 ...

随机推荐

[topcoder]NinePuzzle
http://community.topcoder.com/stat?c=problem_statement&pm=11225&rd=14427 http://apps.topcode ...
使用Qt实现简单的图片预览效果 good
http://www.cnblogs.com/appsucc/archive/2012/02/28/2371506.html Qt之实现工具箱界面程序 http://www.cnblogs.com/a ...
JBPM4.4部署到tomcat6异常解决办法
java.lang.LinkageError: loader constraint violation: when resolving interface method "javax.ser ...
【转】Android开发之旅：环境搭建及HelloWorld
原文网址: http://www.cnblogs.com/skynet/archive/2010/04/12/1709892.html 引言本系列适合0基础的人员,因为我就是从0开始的,此系列记录我 ...
Java程序员从笨鸟到菜鸟全部博客目录
本文来自:曹胜欢博客专栏.转载请注明出处:http://blog.csdn.net/csh624366188 大学上了一年半,接触java也一年半了,虽然中间也有其他东西的学习,但是还是以java为主 ...
动态规划（DP计数）：HDU 5116 Everlasting L
Matt loves letter L.A point set P is (a, b)-L if and only if there exists x, y satisfying:P = {(x, y ...
MonkeyRunner执行Python脚本实例——发送短信增强版
很久之前就写好的了,准备写个自动执行Monkey的脚本时才想到去找它,还是写在博客里找起来方便. 这次更新了批处理自动连接设备后执行Py脚本,结构如下图: 其中shotscreen为存放截图文件夹,s ...
rails第一次做项目
最近这几天一直都是在做rails的入门,也就是熟悉rails的增.删.改.查操作,做到rails的入门.这几天的熟悉,只是对于操作的熟悉,对于rails语言的机制还有很多不是很熟悉.昨天接手第一个真正 ...
[经典] atoi && itoa
atoi原型:int atoi(const char *nptr) atoi,需要考虑的内容: 1. 第一个字符为"-"时为负,系数为-1:为"+"时为正,系数 ...
python爬虫学习(2)__抓取糗百段子，与存入mysql数据库
import pymysql import requests from bs4 import BeautifulSoup#pymysql链接数据库 conn=pymysql.connect(host= ...

CentOS 6.7安装Hadoop 2.6.3集群环境

CentOS 6.7安装Hadoop 2.6.3集群环境的更多相关文章

随机推荐

热门专题