3.1-3.5 分布式部署hadoop2.x的准备和配置

一、环境

192.168.1.130     master

192.168.1.131     slave1

192.168.1.132     slave2

所有主机：

1、关闭防火墙、selinux

2、配置hosts文件

3、yum -y install vim wget tree ntpdate lrzsz openssh-clients

4、配置文件描述符等，同步时间；

5、mkdir -p /opt/app #hadoop安装目录

6、mkdir -p /opt/{datas,modules,softwares,tools} #存放其他程序或文件的目录

二、节点配置规划

服务：

服务	master	slave1	slave2
HDFS	namenode		secondarynamenode
HDFS	datanode	datanode	datanode
yarn		resourcemanager
yarn	nodemanager	nodemanager	nodemanager
mapreduce	jobhistoryserver

配置文件：

HDFS：
    hadoop-env.sh     -->JDK

     core-site.xml    -->namenode

    hdfs-site.xml    -->secondarynamenode

    slaves        -->datanode

YARN：

    yarn-env.sh    -->JDK

    yarn-site.xml    -->resourcemanager

    slaves        -->nodemanager

MapReduce:

    mapred-env.sh    -->JDK

    mapred-site.xml    -->Jobhistoryserver

三、安装

1、安装JDK(所有节点)

#先卸载系统自带的JDK

[root@master softwares]# pwd    #softwares目录存放安装包

/opt/softwares

[root@master softwares]# ls

hadoop-2.5.0.tar.gz  jdk-7u80-linux-x64.tar.gz

[root@master softwares]# tar zxf jdk-7u80-linux-x64.tar.gz -C /opt/moduls/

#配置环境变量

vim /etc/profile

#JDK

export JAVA_HOME=/opt/modules/jdk1.7.0_80

export PATH=$PATH:$JAVA_HOME/bin

#source

source /etc/profile

java -version

2、安装hadoop

(1)hdfs

#解压

[root@master softwares]# tar zxf hadoop-2.5.0.tar.gz -C /opt/app/  #现在只解压到master，后面会分发

#hadoop-env.sh

export JAVA_HOME=/opt/modules/jdk1.7.0_80

#core-site.xml

<configuration>

    <property>

        <name>fs.defaultFS</name>

        <value>hdfs://master:8020</value>

    </property>

    <property>

        <name>hadoop.tmp.dir</name>

        <value>/opt/app/hadoop-2.5.0/data/tmp</value>

    </property>

    <property>

        <name>fs.trash.interval</name>

        <value>10080</value>

    </property>

</configuration>

#创建 /opt/app/hadoop-2.5.0/data/tmp

[root@master ~]# mkdir -p /opt/app/hadoop-2.5.0/data/tmp

#hdfs-site.xml

<configuration>

    <property>

        <name>dfs.namenode.secondary.http-address</name>

        <value>slave2:50090</value>

    </property>

</configuration>

#slaves  (datanode和nodemanager都在是这里面配置的)

master

slave1

slave2

(2)yarn

#yarn-env.sh

export JAVA_HOME=/opt/modules/jdk1.7.0_80

#yarn-site.xml

<configuration>

    <property>

        <name>yarn.nodemanager.aux-services</name>

        <value>mapreduce_shuffle</value>

    </property>

    <property>

        <name>yarn.resourcemanager.hostname</name>

        <value>slave1</value>

    </property>

    <property>

        <name>yarn.nodemanager.resource.memory-mb</name>

        <value>4096</value>

    </property>

    <property>

        <name>yarn.nodemanager.resource.cpu-vcores</name>

        <value>4</value>

    </property>

    <property>

        <name>yarn.log-aggregation-enable</name>

        <value>true</value>

    </property>

    <property>

        <name>yarn.log-aggregation.retain-seconds</name>

        <value>604800</value>

    </property>

</configuration>

#slaves

master

slave1

slave2

(3)mapreduce

#mapred-env.sh

export JAVA_HOME=/opt/modules/jdk1.7.0_80

#mapred-site.xml

<configuration>

    <property>

        <name>mapreduce.framework.name</name>

        <value>yarn</value>

    </property>

    <property>

        <name>mapreduce.jobhistory.address</name>

        <value>master:10020</value>

    </property>

    <property>

        <name>mapreduce.jobhistory.webapp.address</name>

        <value>master:19888</value>

    </property>

</configuration>

四、配置ssh免密登陆

此步骤不难，基本可以略过；

cd /root/.ssh/

ssh-keygen -t rsa

cat id_rsa.pub >>authorized_keys

五、分发

分发HADOOP安装包至各个机器节点；

#master上

[root@master ~]# scp -r /opt/app/hadoop-2.5.0 root@slave1:/opt/app/

[root@master ~]# scp -r /opt/app/hadoop-2.5.0 root@slave2:/opt/app/

#slave1

[root@slave1 ~]# ls /opt/app/

hadoop-2.5.0

#slave2

[root@slave2 ~]# ls /opt/app/

hadoop-2.5.0

3.1-3.5 分布式部署hadoop2.x的准备和配置的更多相关文章

hadoop2.6分布式部署时 livenodes等于1的原因
1.问题描述在进行hadoop2.x版本的hdfs分布式部署时,遇到了一个奇怪的问题: 使用start-dfs.sh命令启动dfs之后,所有的datanode节点上均能看到datanode进程,然而 ...
hadoop2.4完全分布式部署
hadoop2.4完全分布式部署感谢:http://blog.csdn.net/licongcong_0224/article/details/12972889 集群组成: 两台red hat en ...
Hadoop2 伪分布式部署
一.简单介绍二.安装部署三.执行hadoop样例并測试部署环境四.注意的地方一．简单介绍 Hadoop是一个由Apache基金会所开发的分布式系统基础架构,Hadoop的框架最核心的设计就是: ...
Hadoop 2.6.0分布式部署參考手冊
Hadoop 2.6.0分布式部署參考手冊关于本參考手冊的word文档.能够到例如以下地址下载:http://download.csdn.net/detail/u012875880/8291493 ...
Apache Hadoop 2.9.2 完全分布式部署
Apache Hadoop 2.9.2 完全分布式部署(HDFS) 作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 一.环境准备 1>.操作平台 [root@node101.y ...
Hadoop生态圈-zookeeper完全分布式部署
Hadoop生态圈-zookeeper完全分布式部署作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 本篇博客部署是建立在Hadoop高可用基础之上的,关于Hadoop高可用部署请参 ...
Hadoop 完全分布式部署
完全分布式部署Hadoop 分析: 1)准备3台客户机(关闭防火墙.静态ip.主机名称) 2)安装jdk 3)配置环境变量 4)安装hadoop 5)配置环境变量 6)安装ssh 7)集群时间同步 7 ...
Hadoop生态圈-flume日志收集工具完全分布式部署
Hadoop生态圈-flume日志收集工具完全分布式部署作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 目前为止,Hadoop的一个主流应用就是对于大规模web日志的分析和处理 ...
Hadoop生态圈-phoenix完全分布式部署以及常用命令介绍
Hadoop生态圈-phoenix完全分布式部署作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. phoenix只是一个插件,我们可以用hive给hbase套上一个JDBC壳,但是你 ...

随机推荐

android EditText监听和长度监测事件
<?xml version="1.0" encoding="utf-8"?>  ...
Docker资源限制实现——cgroup
摘要随着Docker技术被越来越多的个人.企业所接受,其用途也越来越广泛.Docker资源管理包含对CPU.内存.IO等资源的限制,但大部分Docker使用者在使用资源管理接口时往往还比较模糊. 本 ...
【postMan】发送post请求，返回错误码415
解决方法: 参看:https://www.cnblogs.com/spec-dog/p/3731279.html 将Request的Content-Type:application/json;char ...
BUPT复试专题—哈夫曼编码(2009)
题目描述哈夫曼编码中平均码长=码长×码字出现的概率如:ABCDE 五个字符的出现次数分别为50 20 5 10 15 那么,其哈夫曼编码为A:0 B:10 C:1110 D:111 ...
BUPT复试专题—中位数(2014-2)
题目描述给定一个长度为N的非降数列,求数列的中位数.中位数:当数列的项数N为奇数吋,处于中间位置的变最值即为中位数:当N 为偶数时,中位数则为处于中间位置的两个数的平均数. 输入输入数据第一行 ...
【转】Code Your Own PHP MVC Framework in 1 Hour
原文: https://www.codeproject.com/Articles/1080626/Code-Your-Own-PHP-MVC-Framework-in-Hour --------- ...
【转载】.NET Remoting学习笔记（一）概念
目录 .NET Remoting学习笔记(一)概念 .NET Remoting学习笔记(二)激活方式 .NET Remoting学习笔记(三)信道背景自接触编程以来,一直听过这个名词Remotin ...
China Vis 2015 会议小结
China Vis 2015 Paper有6个分会场.主要有 1.天气.气象.灾害可视化. 2.文本可视化应用: 3.树.网络.以及高维技术. 4.时空分析. 5.科学可视化与应用: 五个方面主题. ...
C++ string 实现大整数相加减
随意两个大整数的加减算法.可自己主动推断正负号.代码例如以下: #include <iostream> #include <vector> #include <cstri ...
ln: 正在创建指向“asm-arm”的符号链接“asm”: 不支持的操作
原因是不能在windows共享目录编译,将待编译的uboot源码copy到home目录

3.1-3.5 分布式部署hadoop2.x的准备和配置

3.1-3.5 分布式部署hadoop2.x的准备和配置的更多相关文章

随机推荐

热门专题