环境:

CentOS7+SunJDK1.8@VMware12。

NameNode虚拟机节点主机名:master,IP规划:192.168.23.101,职责:Name node,Secondary name node,Resource manager。

DataNode虚拟机节点主机名:slave1,IP规划:192.168.23.102,职责:Data node,Node manager。

每个虚拟机分配资源:CPU单颗,内存2GB,硬盘20GB。

过程概要:

  1. 创建2个虚拟机,主机名分别为:master(做NameNode、JobTracker)、slave1(做DataNode、TaskTracker),分配固定ip。
  2. 每个虚拟机都创建一个hadoop用户,并拥有sudo权限。
  3. 解压hadoop包,并把其所属用户及组改为hadoop、hadoop。
  4. 生成openssh密钥对,使master、slave之间的ssh访问免输密码。

过程详细:

  • VMware中建立两个CentOS7主机,创建上述两个主机名和固定IP(VMware CentOS固定IP设置参见http://www.centoscn.com/CentOS/config/2014/1028/4009.html)。

以master节点为例:

修改/etc/hosts为(注意:要把集群所有节点的ip跟主机名映射全加进来):

修改:/etc/sysconfig/network-scripts/ifcfg-eno16777736为(经测试,此种方法可能会被系统再次动态增加一个IP地址,变成双IP。因此不如图形界面的方法可靠):

 或者在CentOS7的图形界面下,点击网络图标,IP改为手动,设置IP地址、掩码、网关、DNS(推荐)

上述为master节点。slave节点类似修改。确保双方IP能互相ping通。

  • 创建hadoop用户,并赋予sudo权限:

命令:su   root  (切换到root用户)

命令:chmod u+w /etc/sudoers (给sudoers增加写权限)

命令:vi /etc/sudoers  (修改sudoers文件)

执行命令后会进入sudoers文件的查看模式,该模式下按“i”进入文件修改模式,

然后在root ALL=(ALL)  ALL下方增加hadoop ALL=(ALL)NOPASSWD:ALL  按 “esc”键推出修改模式,大写模式下,按两次“z”保存退出。

命令:chmod u-w /etc/sudoers (撤销sudoers文件的写权限)。

改后的/etc/sudoers文件内容如下:

把hadoop-2.6.4.tar.gz拷贝到/usr/下,解压:tar zxvf hadoop-2.6.4.tar.gz ,并用chmod、chgrp命令将其所属用户、用户组都改为hadoop(重要!否则hadoop无法在其中新建临时目录和日志)。效果如下:

  • 创建ssh免密码登录:

Master机器上生成密码对。命令:ssh-keygen –t rsa  (生成其无密码密钥对,一路回车键,生成的密钥对:id_rsa和id_rsa.pub,默认存储在"/home/hadoop/.ssh"目录)

命令:cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys (把id_rsa.pub追加到授权的key里面去)

命令:chmod 600 ~/.ssh/authorized_keys(修改文件"authorized_keys"权限,这步骤很重要,很多莫名其妙的错误有可能就是权限的问题)

命令:sudo vi /etc/ssh/sshd_config (修改SSH配置文件"/etc/ssh/sshd_config"),修改如下内容:

RSAAuthentication yes # 启用 RSA 认证
PubkeyAuthentication yes # 启用公钥私钥配对认证方式
AuthorizedKeysFile .ssh/authorized_keys # 公钥文件路径(和上面生成的文件同)

命令:service sshd restart(重新启动服务)

命令:ssh localhost  (测试是否成功)

下面是把公钥复制到所有的slave节点上去:

命令:scp ~/.ssh/id_rsa.pub hadoop@192.168.239.129:~/(记得改成自己的ip,这个是我的slave1的ip,就是把master节点的公钥发送到了slave1的根目录下了)

  • 卸载openjdk,安装sun-jdk8(过程不赘述),安装后效果如下:

  • 关闭CentOS7的防火墙:
  • systemctl stop firewalld.service #停止
    systemctl disable firewalld.service #禁用
    之前的版本:
    service iptables stop #停止
    chkconfig iptables off #禁用
  • 修改几个重要的配置文件:

添加环境变量

/etc/profile里添加

export HADOOP_HOME=/usr/hadoop-2.6./
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

修改 Hadoop 配置文件

在 hadoop 解压路径下面,/etc/hadoop/hadoop-env.sh 增加下面两行

export JAVA_HOME=/usr/java/jdk1..0_101
export HADOOP_PREFIX=/usr/hadoop-2.6.

在 hadoop 解压路径下面,/etc/hadoop/core-site.xml增加下面内容:

<configuration>
<property>
<name>fs.defaultFS</name>
<value>hdfs://master:9000/</value>
</property>
<property>
<name>hadoop.tmp.dir</name>
<value>/usr/hadoop-2.6.4/tmp</value>
</property>
</configuration>

在 hadoop 解压路径下面,/etc/hadoop/hdfs-site.xml 增加下面内容:

<configuration>
<property>
<name>dfs.replication</name>
<value>2</value>
</property>
</configuration>

这里设置成2,表示数据有2个副本(数值不大于DataNode数)。

在 hadoop 解压路径下面,/etc/hadoop/mapred-site.xml 增加下面内容:

<configuration>
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
</configuration>

在 hadoop 解压路径下面,/etc/hadoop/yarn-env.sh 增加下面,增加JAVA_HOME 配置:

export JAVA_HOME=/usr/java/jdk1..0_101

在 hadoop 解压路径下面,/etc/hadoop/yarn-site.xml 增加下面内容:

<configuration>
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
<property>
<name>yarn.resourcemanager.hostname</name>
<value>master</value>
</property>
<property>
<description>The address of the applications manager interface in the RM.</description>
<name>Yarn.resourcemanager.address</name>
<value>master:18040</value>
</property> <property>
<description>The address of the scheduler interface.</description>
<name>Yarn.resourcemanager.scheduler.address</name>
<value>master:18030</value>
</property> <property>
<description>The address of the RM web application.</description>
<name>Yarn.resourcemanager.webapp.address</name>
<value>master:18088</value>
</property> <property>
<description>The address of the resource tracker interface.</description>
<name>Yarn.resourcemanager.resource-tracker.address</name>
<value>master:8025</value>
</property>
</configuration>

这里添加的一些端口号,方便从远程通过浏览器查看集群情况,推荐按照这样添加。

在 hadoop 解压路径下面,/etc/hadoop/slaves 增加下面内容:

master
slave1

按照上面流程,把 slaver1上的环境变量添加好,然后直接:

scp -r /hadoop2.6.4 hadoop@slave1:/usr/

复制到 slave1下面。

启动 hadoop 集群:

格式化文件系统:

hdfs namenode -format

启动 NameNode 和 DateNode:

/usr/hadoop-2.6.4/sbin , 运行:

start-dfs.sh

使用 jps 命令查看 master 上的Java进程,我的进程如下:

jps 命令也可以查看 slave1上的 Java 进程。应该可以看到DataNode启动。如:

[hadoop@slave1 hadoop]# jps
6130 DataNode
1264 Jps

查看 NameNode 和 NameNode 信息:

master的浏览器输入:

localhost:50070/dfshealth.html#tab-datanode

可以看到DataNode启动成功。

启动 ResourceManager 和 NodeManager

运行 start-yarn.sh , jps查看进程如下:

切换到 slave1,jps查看进程:

[hadoop@slave1 hadoop]# jps
DataNode
Jps
NodeManager

成功了

Hadoop 集群就已经启动了。

----------------------------------------------------------------------------------------------------------------------------------------

最后,参考文章:

配置sudoer权限、创建免密码登录:http://blog.sina.com.cn/s/blog_95b63fc90102vrvy.html

修改hadoop配置文件、进程查看:http://blog.csdn.net/sa14023053/article/details/51952534

CentOS7搭建hadoop2.6.4双节点集群的更多相关文章

  1. kubeadm安装K8S单master双节点集群

    宿主机:master:172.16.40.97node1:172.16.40.98node2:172.16.40.99 # 一.k8s初始化环境:(三台宿主机) 关闭防火墙和selinux syste ...

  2. centos7搭建hadoop2.10高可用(HA)

    本篇介绍在centos7中搭建hadoop2.10高可用集群,首先准备6台机器:2台nn(namenode);4台dn(datanode):3台jns(journalnodes) IP hostnam ...

  3. centos7搭建hadoop2.10完全分布式

    本篇介绍在centos7中大家hadoop2.10完全分布式,首先准备4台机器:1台nn(namenode);3台dn(datanode) IP hostname 进程 192.168.30.141 ...

  4. centos7搭建hadoop-2.7.3,zookeeper-3.4.6,hbase-1.2.5(root用户)

    环境:[centos7.hadoop-2.7.3.zookeeper-3.4.6.hbase-1.2.5] 两个节点:[主节点,主机名为Master,用户为root:从节点,主机名为Slave,用户为 ...

  5. 搭建Hadoop2.7.1的分布式集群

    Hadoop 2.7.1 (2015-7-6更新),hadoop的环境配置不是特别的复杂,但是确实有很多细节需要注意,不然会造成许多配置错误的情况.尽量保证一次配置正确防止反复修改. 网上教程有很多关 ...

  6. # 从零開始搭建Hadoop2.7.1的分布式集群

    Hadoop 2.7.1 (2015-7-6更新),Hadoop的环境配置不是特别的复杂,可是确实有非常多细节须要注意.不然会造成很多配置错误的情况.尽量保证一次配置正确防止重复改动. 网上教程有非常 ...

  7. CentOS7搭建Hadoop2.8.0集群及基础操作与测试

    环境说明 示例环境 主机名 IP 角色 系统版本 数据目录 Hadoop版本 master 192.168.174.200 nameNode CentOS Linux release 7.4.1708 ...

  8. Hadoop(二)CentOS7.5搭建Hadoop2.7.6完全分布式集群

    一 完全分布式集群(单点) Hadoop官方地址:http://hadoop.apache.org/ 1  准备3台客户机 1.1防火墙,静态IP,主机名 关闭防火墙,设置静态IP,主机名此处略,参考 ...

  9. CentOS7.5搭建Hadoop2.7.6完全分布式集群

    一 完全分布式集群搭建 Hadoop官方地址:http://hadoop.apache.org/ 1  准备3台客户机 1.2 关闭防火墙,设置静态IP,主机名 关闭防火墙,设置静态IP,主机名此处略 ...

随机推荐

  1. linux基础-第十二单元 硬盘分区、格式化及文件系统的管理一

    第十二单元 硬盘分区.格式化及文件系统的管理一 硬件设备与文件名的对应关系 硬盘的结构及硬盘分区 为什么进行硬盘分区 硬盘的逻辑结构 Linux系统中硬盘的分区 硬盘分区的分类 分区数量的约束 使用f ...

  2. mysql中insert into select from的使用

    如何在mysql从多个表中组合字段然后插入到一个新表中,通过一条sql语句实现.具体情形是:有三张表a.b.c,现在需要从表b和表c中分别查几个字段的值插入到表a中对应的字段.对于这种情况,我们可以使 ...

  3. ORA-600(qerltcInsertSelectRop_bad_state)错误

    来源于: http://blog.itpub.net/22458783/viewspace-615501/ 这是碰到的第一个11.2上的bug,在利用IGNORE_ROW_ON_DUPKEY_INDE ...

  4. 你需要知道的MySQL开源存储引擎TokuDB

    在四月份的Percona Live MySQL会议上, TokuDB庆祝自己成为开源存储引擎整一周年.我现在仍能记得一年前它刚创建时的官方声明与对它的期望.当时的情况非常有意思,因为它拥有帮助MySQ ...

  5. [转]跟我一起学extjs5(02--建立工程项目)

    原文地址:http://blog.csdn.net/jfok/article/details/35569057 目录(?)[+] 跟我一起学extjs5(02--建立工程项目) 我们先建立一个java ...

  6. [转]Java中怎样判断一个字符串能否转成数字

    原文地址:http://blog.sina.com.cn/s/blog_7bac470701014mjf.html 判断字符串是否为数字 //1.正则表达式  public static boolea ...

  7. 【BZOJ 4269】再见Xor

    zky学长提供的线性基求法: for(int i=1;i<=n;i++) for(int j=64;j>=1;j--) { if(a[i]>>(j-1)&1) { if ...

  8. Spring 在web 容器中的启动过程

    1.对于一个web 应用,其部署在web 容器中,web 容器提供其一个全局的上下文环境,这个上下文就是 ServletContext ,其后面的spring IoC 容器提供宿主环境 2.在web. ...

  9. quartz启动时间配置

    这些星号由左到右按顺序代表 : * * * * * * * 格式: [秒] [分] [小时] [日] [月] [周] [年] 序号 说明 是否必填 允许填写的值 允许的通配符 1 秒 是 0-59 , ...

  10. SurfaceView, TextureView, SurfaceTexture等的区别

    SurfaceView, GLSurfaceView, SurfaceTexture以及TextureView是Android当中名字比较绕,关系又比较密切的几个类.本文基于Android 5.0(L ...