实验环境

Hadoop版本：CDH 5.3.6

*本实验项目所需软件均可在百度网盘链接：http://pan.baidu.com/s/1dFeNR6h 密码：1zx4中获取。

安装 Hadoop

上传hadoop文件到/usr/local目录下

rz

解压

tar -zxvf hadoop-2.5.0-cdh5.3.6.tar.gz

删除tar包

rm -rf hadoop-2.5.0-cdh5.3.6.tar.gz

重命名
mv hadoop-2.5.0-cdh5.3.6 hadoop

设置环境变量

vi ~/.bashrc

export HADOOP_HOME=/usr/local/hadoop

export PATH=$HADOOP_HOME/bin:$HADOOP_HOME/sbin

生效设置

source ~/.bashrc

测试

hadoop

hadoop version

yarn

yarn version

创建/usr/local/data目录

配置文件

修改core-site.xml文件

cd /hadoop/etc/hadoop

ls

vi core-sie.xml

<property>

  <name>fs.default.name</name>

  <value>hdfs://sparkproject1:9000</value>

</property>

修改hdfs-site.xml

<property>

  <name>dfs.name.dir</name>

  <value>/usr/local/data/namenode</value>

</property>

<property>

  <name>dfs.data.dir</name>

  <value>/usr/local/data/datanode</value>

</property>

<property>

  <name>dfs.tmp.dir</name>

  <value>/usr/local/data/tmp</value>

</property>

<property>

  <name>dfs.replication</name>

  <value>2</value>

</property>

修改mapred-site.xml

cp mapred-site.xml.template mapred-site.xml

vi mapred-site.xml

<property>

  <name>mapreduce.framework.name</name>

  <value>yarn</value>

</property>

修改yarn-site.xml

<property>

  <name>yarn.resourcemanager.hostname</name>

  <value>sparkproject1</value>

</property>

<property>

  <name>yarn.nodemanager.aux-services</name>

  <value>mapreduce_shuffle</value>

</property>

修改slaves

sparkproject2

sparkproject3

sparkproject1是主节点，sparkproject2和sparkproject3是从节点

在另外两台虚拟机上搭建hadoop

在sparkproject1上使用scp命令将配置好的文件传输到另外两个虚拟机上

cd /usr/local

scp -r hadoop root@sparkproject2:/usr/local

scp -r hadoop root@sparkproject3:/usr/local

scp ~/.bashrc root@sparkproject2:~/

scp ~/.bashrc root@sparkproject3:~/

在sparkproject2和sparkproject3上分别执行

source ~/.bashrc

在sparkproject2和sparkproject3的/usr/local目录下创建data目录

cd /usr/local

mkdir data

启动hdfs集群

格式化namenode
在sparkproject1上执行

hdfs namenode –format

启动集群

start-dfs.sh

查看是否启动成功

在浏览器中输入sparkproject1:50070查看状态

上传测试文件

vi hello.txt

Hello world !

hdfs dfs -put hell.txt /hello.txt

在网页端查看上传的文件

启动yarn集群

start-yarn.sh

使用jps检查各节点启动状态，sparkproject1上启动ResourceManager，sparkproject2和sparkproject3节点上启动NodeManager

在浏览器中输入sparkproject1：8088查看

至此，hadoop集群搭建完成，下一步将安装Hive。

更多文章：Spark大型电商项目实战：http://blog.csdn.net/u012318074/article/category/6744423

3.环境搭建-Hadoop（CDH）集群搭建的更多相关文章

超快速使用docker在本地搭建hadoop分布式集群
超快速使用docker在本地搭建hadoop分布式集群超快速使用docker在本地搭建hadoop分布式集群学习hadoop集群环境搭建是hadoop入门的必经之路.搭建分布式集群通常有两个办法: ...
Hadoop分布式集群搭建hadoop2.6+Ubuntu16.04
前段时间搭建Hadoop分布式集群,踩了不少坑,网上很多资料都写得不够详细,对于新手来说搭建起来会遇到很多问题.以下是自己根据搭建Hadoop分布式集群的经验希望给新手一些帮助.当然,建议先把HDFS ...
Hadoop分布式集群搭建
layout: "post" title: "Hadoop分布式集群搭建" date: "2017-08-17 10:23" catalog ...
使用Docker在本地搭建Hadoop分布式集群
学习Hadoop集群环境搭建是Hadoop入门必经之路.搭建分布式集群通常有两个办法: 要么找多台机器来部署(常常找不到机器) 或者在本地开多个虚拟机(开销很大,对宿主机器性能要求高,光是安装多个虚拟 ...
Hadoop+HBase 集群搭建
Hadoop+HBase 集群搭建 1. 环境准备说明:本次集群搭建使用系统版本Centos 7.5 ,软件版本 V3.1.1. 1.1 配置说明本次集群搭建共三台机器,具体说明下: 主机名 IP ...
分布式计算（一）Ubuntu搭建Hadoop分布式集群
最近准备接触分布式计算,学习分布式计算的技术栈和架构知识.目前的分布式计算方式大致分为两种:离线计算和实时计算.在大数据全家桶中,离线计算的优秀工具当属Hadoop和Spark,而实时计算的杰出代表非 ...
hadoop+spark集群搭建入门
忽略元数据末尾回到原数据开始处 Hadoop+spark集群搭建说明: 本文档主要讲述hadoop+spark的集群搭建,linux环境是centos,本文档集群搭建使用两个节点作为集群环境:一个 ...
hadoop ha集群搭建
集群配置: jdk1.8.0_161 hadoop-2.6.1 zookeeper-3.4.8 linux系统环境:Centos6.5 3台主机:master.slave01.slave02 Hado ...
使用docker搭建hadoop分布式集群
使用docker搭建部署hadoop分布式集群在网上找了非常长时间都没有找到使用docker搭建hadoop分布式集群的文档,没办法,仅仅能自己写一个了. 一:环境准备: 1:首先要有一个Cento ...
CDH集群搭建视频教程百度云网盘下载
CDH集群搭建视频教程百度云网盘下载链接: http://pan.baidu.com/s/1i5DVBlb 密码:2mny

随机推荐

[转载]ExtJs4 笔记（2） ExtJs对js基本语法扩展支持
作者:李盼(Lipan)出处:[Lipan] (http://www.cnblogs.com/lipan/) 本篇主要介绍一下ExtJs对JS基本语法的扩展支持,包括动态加载.类的封装等. 一.动态引 ...
Win7通知区域的图标怎么去除?
由于本人有洁癖,最近在用win7的时候,很收不了已经卸载了的一些软件,在win7右下角的通知区域图标中还留有痕迹,于是上网查找了下解决方案. 用以下方法完美解决问题. 这里依然是以注册表的修改方法为主 ...
monkey测试工具与常用的linux命令
Monkey测试工具说明:monkey是一个安卓自带的命令行工具,可以模拟用户向应用发起一定的伪随机事件.主要用于对app进行稳定性测试与压力测试. 实现:首先需要安装一个ADB工具,安装完之后,需 ...
Python的深浅copy
27.简述Python的深浅拷贝以及应用场景? 深浅拷贝的原理深浅拷贝用法来自copy模块. 导入模块:import copy 浅拷贝:copy.copy 深拷贝:copy.deepcopy 字面理 ...
[uiautomator篇][8] 增加应用读取内置存储卡的权限
1 要在androidmainfest.xml增加权限(这样之后,在设备上的权限才可以点击,不然是灰色) <uses-permission android:name="android. ...
进程，线程，以及Python的多进程实例
什么是进程,什么是线程? 进程与线程是包含关系,进程包含了线程. 进程是系统资源分配的最小单元,线程是系统任务执行的最小单元. 打个比方,打开word,word这个程序是一个进程,里面的拼写检查,字数 ...
[luoguP1963] [NOI2009]变换序列（二分图最大匹配）
传送门根据公式xjb推一下,然后就可以连边. 考虑到字典序最小,和匈牙利算法的实现过程,要倒序匹配. #include <cmath> #include <cstdio> # ...
洛谷P2664 树上游戏【点分治 + 差分】
题目 lrb有一棵树,树的每个节点有个颜色.给一个长度为n的颜色序列,定义s(i,j) 为i 到j 的颜色数量.以及现在他想让你求出所有的sum[i] 输入格式第一行为一个整数n,表示树节点的数量 ...
居然有这种操作？各路公司面试题（作者：马克-to-win）
我喜欢考试,不考试,谁知道哪些掌握了哪些没有?? 面试什么的最有爱了(变态笑)~~~ http://www.mark-to-win.com/JavaBeginner/JavaBeginner4_web ...
kali2 install Nessus
注册: https://www.tenable.com/products/nessus-home 安装: 设置登录用户名,密码,输入注册码:

3.环境搭建-Hadoop（CDH）集群搭建

目录