Hadoop分布式集群搭建_1
Hadoop是一个开源的分布式系统框架
一.集群准备
1. 三台虚拟机,操作系统Centos7,三台主机名分别为k1,k2,k3,NAT模式
2.节点分布
k1: NameNode DataNode ResourceManager NodeManager
k2: SecondNameNode DataNode NodeManager
k3 : DataNode NodeManager
3.安装包准备
jdk-8uxx-linux-x64.rpm
hadoop-2.7.1.tar.gz
二.Linux准备
1.关闭防火墙
systemctl status firewalld //查看防火墙状态
systemctl stop firewalld //关闭防火墙
systemctl disable firewalld //防火墙开机不启动
2.修改主机名
hostnamectl set-hostname 主机名
注:如果克隆的虚拟机,那么需要修改主机名
3.IP设置
编辑:vi /etc/sysconfig/network-scripts/ifcfg-ens33
文件中修改 :
BOOTPROTO=none
ONBOOT=yes [开机启动网卡]
文件中添加 :
IPADDR=xxx [IP地址]
NETMASK=xxx [子网掩码]
GATEWAY=xxx [网关]
DNS1=xxx
重启网卡 : systemctl restart network
注 : 克隆的虚拟机需要修改IP地址,删除UUID
4.添加hosts文件
编辑:vi /etc/host
文件中添加:
IP地址 主机名
IP地址 主机名
IP地址 主机名
5.安装JDK
安装包 : jdk-8uxx-linux-x64.rpm
安装 : rpm -ivh jdk-8uxx-linux-x64.rpm
配置环境变量 : vi /etc/profile
文件中添加 : JAVA_HOME=/usr/java/jdk PATH=$PATH:$JAVA_HOME/bin: CLASSPATH=.:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar: |
环境变量生效 : source /etc/profile
查看:java -version
6.SSH免密
1. ssh-keygen
之后一直回车就可以
2.ssh-copy-id 主机名
三台机子都需要进行免密
3.ssh 主机名
测试免密是否成功
三.HADOOP环境搭建
1.解压缩
安装包 : hadoop-2.7.1.tar.gz
解压缩 : tar -zxvf hadoop-2.7.1.tar.gz -C /opt/apps
2.修改环境变量
编辑 :vi /etc/profile
文件中添加 :
export HADOOP_HOME=/opt/apps/hadoop.2.7.1/
export PATH=$HADOOP_HOME/bin:$HADOOP_HOME/sbin:
3.环境变量生效
source/etc/profile
四.HADOOP配置文件
1.进入hadoop配置文件目录
cd /opt/apps/hadoop.2.7.1/etc/hadoop
2.修改配置文件 : hadoop-env.sh
vi hadoop-env.sh
修改文件中JAVA_HOME,改为自己JDK的路径
3.配置文件 :core-site.xml
vi core-site.xml 添加如下内容:
<property>
<name>fs.defaultFS</name>
<value>hdfs://主机名:8020</value> //NameNode节点主机名
</property>
<property>
<name>io.file.buffer.size</name>
<value>4096<value>
</property>
<property>
<name>hadoop.tmp.dir</name>
<value>/home/hadoopdata/bigdata/tmp</value>
</property>
4.配置文件 : hdfs-site.xml
vi hdfs-site.xml 添加如下内容:
<property>
<name>dfs.namenode.name.dir</name>
<value>file:///home/hadoopdata/dfs/name</value>
</property>
<property>
<name>dfs.datanode.data.dir</name>
<value>file:///home/hadoopdata/dfs/data<>
</property>
<property>
<name>dfs.http.address</name>
<value>NameNode节点主机名:50070</value>
</property>
<property>
<name>dfs.secondary.http.address</name>
<value>SecondNameNode节点主机名:50090</value>
</property>
<property>
<name>dfs.replication</name>
<value>3</value>
</property>
<property>
<name>dfs.webhdfs.enabled</name>
<value>true</value>
</property>
<property>
<name>dfs.permissions</name>
<value>false</value>
</property>
5.配置文件 : salves
vi salves 添加以下内容(三台机器的主机名) :
hostname1
hostname2
hostname3
6.配置文件 : mapred-site.xml
mv mapred-site.xml.template mapred-site.xml (进行重命名)
vi mapred-site.xml 添加以下内容 :
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
<final>true</final>
</property>
<property>
<name>mapreduce.jobhistory.address</name>
<value>历史服务:10020</value>
</property>
<property>
<name>mapreduce.jobhistory.webapp.address</name>
<value>历史服务节点主机名:19888</value>
</property>
7.配置文件 : yarn-site.xml
vi yarn-site.xml 添加如下内容 :
<property>
<name>yarn.resourcemanager.hostname</name>
<value>ResourceManager节点主机名</value>
</property>
<property>
<name>yarn.nodemanager.aux-services</name>
<value>mapreduce_shuffle</value>
</property>
<property>
<name>yarn.resourcemanager.address</name>
<value>ResourceManager节点主机名:8032</value>
</property>
<property>
<name>yarn.resourcemanager.scheduler.address</name>
<value>ResourceManager节点主机名:8030</value>
</property>
<property>
<name>yarn.resourcemanager.resource-tracker.address</name>
<value>ResourceManager节点主机名:8031</value>
</property>
<property>
<name>yarn.resourcemanager.admin.address</name>
<value>ResourceManager节点主机名:8033</value>
</property>
<property>
<name>yarn.resourcemanager.webapp.address</name>
<value>ResourceManager节点主机名:8088</value>
</property>
<property>
<name>yarn.client.failover-proxy-provider</name>
<value>org.apache.hadoop.yarn.client.ConfiguredRMFailoverProxyProvider</value> </property>
<property>
<name>yarn.web-proxy.address</name>
<value>ResourceManager节点主机名:9989</value>
</property>
五.Hadoop启动【Hadoop分发到别的机器,三台机器都要有Hadoop】
1.格式化NameNode
hdfs namenode -format
注 : 如出现 [name has been successfully formated] 则格式化成功
2.启动进程
start-dfs.sh
start-yarn.sh
3.查看节点 ------ jps
4.创建wordcount.txt 验证Yarn
yarn jar /root/app/hadoop-2.7.2/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.2.jar wordcount /hello.txt /out/1
六.谢谢
本人还处于小白阶段,可能写的地方可能让人晦涩,还请多见谅,我还会继续努力!
Hadoop分布式集群搭建_1的更多相关文章
- Hadoop分布式集群搭建
layout: "post" title: "Hadoop分布式集群搭建" date: "2017-08-17 10:23" catalog ...
- Hadoop分布式集群搭建hadoop2.6+Ubuntu16.04
前段时间搭建Hadoop分布式集群,踩了不少坑,网上很多资料都写得不够详细,对于新手来说搭建起来会遇到很多问题.以下是自己根据搭建Hadoop分布式集群的经验希望给新手一些帮助.当然,建议先把HDFS ...
- hadoop分布式集群搭建(2.9.1)
1.环境 操作系统:ubuntu16 jdk:1.8 hadoop:2.9.1 机器:3台,master:192.168.199.88,node1:192.168.199.89,node2:192.1 ...
- hadoop分布式集群搭建前期准备(centos7)
那玩大数据,想做个大数据的从业者,必须了解在生产环境下搭建集群哇?由于hadoop是apache上的开源项目,所以版本有些混乱,听说都在用Cloudera的cdh5来弄?后续研究这个吧,就算这样搭建不 ...
- [过程记录]Centos7 下 Hadoop分布式集群搭建
过程如下: 配置hosts vim /etc/hosts 格式: ip hostname ip hostname 设置免密登陆 首先:每台主机使用ssh命令连接其余主机 ssh 用户名@主机名 提示是 ...
- Centos 7下Hadoop分布式集群搭建
一.关闭防火墙(直接用root用户) #关闭防火墙 sudo systemctl stop firewalld.service #关闭开机启动 sudo systemctl disable firew ...
- 使用Docker在本地搭建Hadoop分布式集群
学习Hadoop集群环境搭建是Hadoop入门必经之路.搭建分布式集群通常有两个办法: 要么找多台机器来部署(常常找不到机器) 或者在本地开多个虚拟机(开销很大,对宿主机器性能要求高,光是安装多个虚拟 ...
- 分布式计算(一)Ubuntu搭建Hadoop分布式集群
最近准备接触分布式计算,学习分布式计算的技术栈和架构知识.目前的分布式计算方式大致分为两种:离线计算和实时计算.在大数据全家桶中,离线计算的优秀工具当属Hadoop和Spark,而实时计算的杰出代表非 ...
- 大数据系列之Hadoop分布式集群部署
本节目的:搭建Hadoop分布式集群环境 环境准备 LZ用OS X系统 ,安装两台Linux虚拟机,Linux系统用的是CentOS6.5:Master Ip:10.211.55.3 ,Slave ...
随机推荐
- byr面经两则
人人,金山西山居,腾讯互娱,微信,网易游戏offer及面经 首先感谢师兄在两年前发的贴([天道酬勤] 腾讯.百度.网易游戏.华为Offer及笔经面经 ),这篇文章对我帮助很大. 我写这篇文章一是为了感 ...
- C#多个线程同时执行一个任务示例
注意:如果电脑是单核单线程的,这么做是没有意义的. 这里直接贴一下主要代码 using System; using System.Collections.Generic; using System.T ...
- php读取大文件如日志文件
需求如下: 现有一个1G左右的日志文件,大约有500多万行, 用php返回最后几行的内容. 1. 直接采用file函数来操作 or file_get_content() 肯定报内存溢出注: 由于 fi ...
- December 20th 2016 Week 52nd Tuesday
With the wonder of your love, the sun above always shines. 拥有你美丽的爱情,太阳就永远明媚. To accept the love from ...
- html转canvas html2canvas.js
$("#btn-html2canvas").on("click",function(){//btn-html2canvas为按钮 //content-main为 ...
- css文字闪烁效果
<!DOCTYPE html> <html> <head lang="en"> <meta charset="UTF-8&quo ...
- PhoneGap 介绍
一.PhoneGap 是什么 1.PhoneGap 是一个用基于 HTML,CSS 和 JavaScript 的,创建移动跨平台移动应用程序的快速开发框架. 2.它使开发者能够利用 iPhone,An ...
- 以整数元素构成的list中的数字组成最小整数
问题 把一个int型数组中的数字拼成一个串,这个串代表的数字最小. 思路说明 不同角度,对原题理解有所不同.我依照以下的理解方式求解. 对这个问题的理解: 有一个元素是int类型的list: 将上述l ...
- POJ3690 Constellations
嘟嘟嘟 哈希 刚开始我一直在想二维哈希,但发现如果还是按行列枚举的话会破坏子矩阵的性质.也就是说,这个哈希只能维护一维的子区间的哈希值. 所以我就开了个二维数组\(has_{i, j}\)表示原矩阵\ ...
- HTML5本地存储——IndexedDB
在HTML5本地存储——Web SQL Database提到过Web SQL Database实际上已经被废弃,而HTML5的支持的本地存储实际上变成了 Web Storage(Local Stora ...