Hadoop集群安装指南(CHD5.9.1)(分布式+图文详解)
centos7.1,CDH5.9.1,3台机器,终极指导安装
下载链接如下:
安装文件下载链接如下:
链接:https://pan.baidu.com/s/1RQYNiWn9a-T8GXcCsoDBsA 密码:mu83
报错解决方法在最后面
报错解决方法在最后面
报错解决方法在最后面
基础配置
首先查看IP地址
$ ifconfig

如果没有显示的话,需要修改配置文件 ifcfg-enp5s0(名字不唯一,一般是第一个)
$ cd /etc/sysconfig/network-scripts
$ vim ifcfg-enp5s0

$ 修改箭头处,分别是静态地址,系统启动时是否激活网卡,ip地址,网关,DNS

重启服务
$ systemctl retart network.service
检测一下
$ ping www.baidu.com

修改主机名分别为master,node1,node2
$ hostname

更改yum源,Yum原本的源都在国外,更新特别浪费时间,我们改为阿里源:
首先我们将原来的源进行备份:
$ mv /etc/yum.repos.d/CentOS-Base.repo /etc/yum.repos.d/CentOS-Base.repo.backup
接下来我们用阿里源进行替换:
$ wget -O/etc/yum.repos.d/CentOS-Base.repo http://mirrors.aliyun.com/repo/Centos-7.repo

设置ssh
主要有三步:①生成公钥和私钥、②导入公钥到认证文件、③更改权限
首先添加各个节点的host
$ vim /etc/hosts
127.0.0.1 localhost
::1 localhost
210.44.71.51 master
210.44.71.52 node1
210.44.71.53 node2

$ ssh-keygen -t rsa -f ~/.ssh/id_rsa
$ cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys
$ chmod 700 ~/.ssh && chmod 600 ~/.ssh/*


设置主机->从机的无密码登录
$ cat ~/.ssh/id_rsa.pub | ssh root@node1 'cat - >> ~/.ssh/authorized_keys'
$ cat ~/.ssh/id_rsa.pub | ssh root@node2 'cat - >> ~/.ssh/authorized_keys'

测试
$ ssh node1
$ ssh node2


设置从机->主机的无密码登录
分别在node1、node2上执行
$ cat ~/.ssh/id_rsa.pub | ssh root@master 'cat - >> ~/.ssh/authorized_keys'

测试
$ ssh master

安装JDK
如果有openjdk先卸载
$ rpm -qa | grep java
$ rpm -e --nodeps +openjdkname
安装
$ rpm -ivh jdk-8u121-linux-x64.rpm

发给其他节点(主节点),然后重复上一次操作
$ scp /root/jdk-8u121-linux-x64.rpm node1:/root/
$ scp /root/jdk-8u121-linux-x64.rpm node2:/root/

检测一下
$ which java
$ java -version
$ which javac
$ javac -version

关闭防火墙,分别为关闭防火墙,禁止开机启动
$ systemctl stop firewalld.service
$ systemctl disable firewalld.service

关闭SELinux,重启生效
$ vim /etc/selinux/config
$ reboot

下载Cloudera相关rpm
下载cloudera-manager.repo:
http://archive.cloudera.com/cm5/redhat/7/x86_64/cm/cloudera-manager.repo
修改其中的版本号为要安装的版本号
**修改所有的 https 为 http **
**baseurl=http://archive.cloudera.com/cm5/redhat/7/x86_64/cm/5.9.1/ **
gpgkey =http://archive.cloudera.com/cm5/redhat/7/x86_64/cm/RPM-GPG-KEY-cloudera
下载cloudera-manager-installer.bin:
http://archive.cloudera.com/cm5/installer/5.9.1/
下载RPMS(目录下的所有文件):
http://archive.cloudera.com/cm5/redhat/7/x86_64/cm/5.9.1/RPMS/x86_64/
下载CDH-Parcel文件(三个): (注意manifest.json需要自己复制下来,粘到txt重命名,下载后将.sha1文件后缀更改为.sha)
CDH-5.9.1-1.cdh5.9.1.p0.4-el7.parcel
CDH-5.9.1-1.cdh5.9.1.p0.4-el7.parcel.sha1
manifest.json
http://archive.cloudera.com/cdh5/parcels/5.9.1/

在所有节点上拷贝安装文件
将cloudera-manager.repo文件拷贝到所有节点的/etc/yum.repos.d/文件夹下
$ mkdir -p /etc/yum.repos.d/
$ cp /root/cloudera-manager.repo /etc/yum.repos.d/
传给其他节点
$ scp /root/cloudera-manager.repo node1:/root/
$ cp /root/cloudera-manager.repo /etc/yum.repos.d/ //node1
$ cp /root/cloudera-manager.repo /etc/yum.repos.d/ //node2

将下载的RPMS所有文件,拷贝到/opt/cloudera-RPMS/目录下,需要新建目录(主节点全部,从节点部分):
$ mkdir -p /opt/cloudera-RPMS
node中不需要安装server的包,只需要安装下面两个
cloudera-manager-agent-5.9.1-1.cm591.p0.8.el7.x86_64.rpm
cloudera-manager-daemons-5.9.1-1.cm591.p0.8.el7.x86_64.rpm
$ scp /opt/cloudera-RPMS/cloudera-manager-agent-5.9.1-1.cm591.p0.8.el7.x86_64.rpm node1:/opt/cloudera-RPMS/
$ scp /opt/cloudera-RPMS/cloudera-manager-daemons-5.9.1-1.cm591.p0.8.el7.x86_64.rpm node1:/opt/cloudera-RPMS/
$ scp /opt/cloudera-RPMS/cloudera-manager-agent-5.9.1-1.cm591.p0.8.el7.x86_64.rpm node2:/opt/cloudera-RPMS/
$ scp /opt/cloudera-RPMS/cloudera-manager-daemons-5.9.1-1.cm591.p0.8.el7.x86_64.rpm node2:/opt/cloudera-RPMS/

将下载的CDH-Parcel文件(三个)拷贝到/opt/cloudera/parcel-repo 目录下 (如果该目录不存在,手动创建,所有节点)
传给其他节点
//主节点
$ mkdir -p /opt/cloudera/parcel-repo
//从节点
$ mkdir -p /opt/cloudera
$ scp -r /opt/cloudera/parcel-repo/ node1:/opt/cloudera/
$ scp -r /opt/cloudera/parcel-repo/ node2:/opt/cloudera/

所有节点都需要执行的
$ cd /opt/cloudera-RPMS
$ yum -y localinstall --nogpgcheck *.rpm
只需要在主节点(Master)上执行的
将cloudera-manager-installer.bin拷贝到/opt目录下
给.bin文件添加可执行权限
$ sudo chmod +x /opt/cloudera-manager-installer.bin
执行安装
/opt/cloudera-manager-installer.bin
依次出现这些页面








进入web页面210.44.71.51:7180
账号密码都是admin


在搜索框里输入节点名字,搜索,英文逗号分隔



不要选择JDK,已经安装过了

默认即可

设置密码

一定保证所有节点连网 这里图片有个错误,应该包含master节点


修改请看最后教程


默认即可







可能出现的错误
Fatal error

把数据文件删除(改名字)
如果后来又出现错误可继续删除
$ cd /etc/cloudera-scm-server/
$ mv /etc/cloudera-scm-server/db.properties /etc/cloudera-scm-server/db.properties.backup

更改SELinux需要重启
$ reboot
错误3

查看日志文件后发现是获取不到镜像,DNS没配好
错误8

可能是因为cloudera-manager.repo没有拷贝到目标文件夹
或者是因为启动失败,主节点中/etc/yum.repos.d目录下cloudera-manager.repo自动改名导致的,重新拷贝一份进去
cp /root/cloudera-manager.repo /etc/yum.repos.d/
配置时警告错误

1、透明大页面问题
临时关闭:
echo never > /sys/kernel/mm/transparent_hugepage/defrag
修改开机设置
vi /etc/rc.local
echo never > /sys/kernel/mm/transparent_hugepage/defrag

临时修改:
sysctl vm.swappiness=0
永久设置:
vi /etc/sysctl.conf
vm.swappiness = 10
sysctl -p
Hadoop集群安装指南(CHD5.9.1)(分布式+图文详解)的更多相关文章
- 大规模Hadoop集群实践:腾讯分布式数据仓库(TDW)
TDW 是腾讯最大的离线数据处理平台.本文主要从需求.挑战.方案和未来计划等方面,介绍了TDW在建设单个大规模集群中采取的 JobTracker 分散化和 NameNode 高可用两个优化方案. TD ...
- 集群之LVS(负载均衡)详解
提高服务器响应能力的方法 scale on 在原有服务器的基础上进行升级或者直接换一台新的性能更高的服务器. scale out 横向扩展,将多台服务器并发向外响应客户端的请求.优点:成本低,扩展 ...
- MySQL集群Percona XtraDB Cluster安装搭建步骤详解
http://www.linuxidc.com/Linux/2017-05/143501.htm http://blog.csdn.net/thundermeng/article/details/52 ...
- Centos mini系统下的Hadoop集群搭建
1.事前了解 1.1 Hadoop 百度百科:https://baike.baidu.com/item/Hadoop/3526507?fr=aladdin Hadoop是一个由Apache基金会所开发 ...
- Hadoop集群
你可以用以下三种支持的模式中的一种启动Hadoop集群: 单机模式 伪分布式模式 完全分布式模式 单机模式的操作方法 默认情况下,Hadoop被配置成以非分布式模式运行的一个独立Java进程.这对调试 ...
- Hadoop的学习前奏(二)——Hadoop集群的配置
前言: Hadoop集群的配置即全然分布式Hadoop配置. 笔者的环境: Linux: CentOS 6.6(Final) x64 JDK: java version "1.7 ...
- Hadoop集群搭建
配置IP,修改主机名,关闭防火墙,配置SSH免密码登录
- Hadoop集群搭建的详细过程
Hadoop集群搭建 一.准备 三台虚拟机:master01,node1,node2 时间同步 1.date命令查看三台虚拟机时间是否一致 2.不一致时间同步:ntpdate ntp.aliyun.c ...
- 大数据系列(3)——Hadoop集群完全分布式坏境搭建
前言 上一篇我们讲解了Hadoop单节点的安装,并且已经通过VMware安装了一台CentOS 6.8的Linux系统,咱们本篇的目标就是要配置一个真正的完全分布式的Hadoop集群,闲言少叙,进入本 ...
随机推荐
- 纳尼,Java 存在内存泄泄泄泄泄泄漏吗?
01. 怎么回事? 纳尼,Java 不是自动管理内存吗?怎么可能会出现内存泄泄泄泄泄泄漏! Java 最牛逼的一个特性就是垃圾回收机制,不用像 C++ 需要手动管理内存,所以作为 Java 程序员很幸 ...
- ACM中java的使用
ACM中java的使用 转载自http://www.cnblogs.com/XBWer/archive/2012/06/24/2560532.html 这里指的java速成,只限于java语法,包括输 ...
- 洛谷 - P2657 - windy数 - 数位dp
https://www.luogu.org/problemnew/show/P2657 不含前导零且相邻两个数字之差至少为2的正整数被称为windy数. 这道题是个显然到不能再显然的数位dp了. 来个 ...
- 洛谷P3209 [HNOI2010]平面图判定(2-SAT)
传送门 看到哈密顿回路就被吓傻了……结果没有好好考虑性质…… 首先,平面图有个性质:边数小于等于$3n-6$(我也不知道为啥),边数大于这个的直接pass 然后考虑原图,先把哈密顿回路单独摘出来,就是 ...
- sql server 获取数据字段(表的字段和类型信息)
获取数据字段(表的字段和类型信息) SELECT 表名= then d.name else '' end, 表说明= then isnull(f.value,'') else '' end, 字段序号 ...
- 维骨力Glucosamine的最关键的几点...
1.每日劑量應為多少?長期服用安全嗎? 由於葡萄糖胺(Glucosamine)和軟骨素(Chondroitin)原來就存在於人體,是人體每天會生產製造的必需營養素,因此,一般認為服用此類產品的安全性相 ...
- Suricata的命令行解释
见官网 https://suricata.readthedocs.io/en/latest/command-line-options.html root@SELKS:~# suricata Suric ...
- C#中的委托(转)
C# 中的委托和事件 引言 委托 和 事件在 .Net Framework中的应用非常广泛,然而,较好地理解委托和事件对很多接触C#时间不长的人来说并不容易.它们就像是一道槛儿,过了这个槛的人,觉得真 ...
- c#自定义鼠标形状
更改鼠标指针,需要使用到 Windows API: 1. 添加命名空间的引用: using System.Runtime.InteropServices; using System.Reflectio ...
- CF765C Table Tennis Game 2
题意: Misha and Vanya have played several table tennis sets. Each set consists of several serves, each ...