hadoop再次集群搭建（4）-Cloudera Manager Installation

决定选择 Cloudera Manager 进行安装，阅读官方文档，掌握大概脉络。

Cloudera Manager在集群已经实现ssh免秘钥登录，能够访问网络资源和本地资源的情况下，可以自动安装和配置CDH(Cloudera distributed hadoop),以及管理在这个集群上面的服务。

Cloudera Manager安装软件包括：

A small self-executing Cloudera Manager installation program to install the Cloudera Manager Server and other packages in preparation for host installation.
Cloudera Manager wizard for automating CDH and managed service installation and configuration on the cluster hosts. Cloudera Manager provides two methods for installing CDH and managed services: traditional packages (RPMs or
Debian packages) or parcels. Parcels simplify the installation process, and more importantly allows you to download, distribute, and activate new minor versions of CDH and managed services from within Cloudera Manager.

他的主要功能是：

Automated deployment and configuration.
Customizable Monitoring and reporting.
Effortless, robust troubleshooting.
Zero downtime maintenance.

在安装之前，我们需要执行两个操作，很重要。关闭防火墙是防止出现访问被拒绝， SElinux也是如此。集群之间的通信很重要，确保不会因为任何限制而导致通信失败。

关闭防火墙

在Hadoop安装过程中需要关闭防火墙和SElinux，否则会异常

1. service iptables status 查看防火墙状态

2. 使用如下命令关闭iptables，执行该命令后重启机器生效

chkconfig iptables off

关闭之后：

关闭SElinux

1. 使用getenforce命令查看是否关闭

2. 修改/etc/selinux/config 文件

将SELINUX=enforcing改为SELINUX=disabled，执行该命令后重启机器生效

SELinux (Security-Enhanced Linux) 是美国国家安全局（NSA）对于强制访问控制的实现，是 Linux历史上最杰出的新安全子系统。 NSA 是在Linux社区的帮助下开发了一种访问控制体系，在这种访问控制体系的限制下，进程只能访问那些在他的任务中所需要文件。 SELinux 默认安装在Fedora 和Red Hat Enterprise Linux 上，也可以作为其他发行版上容易安装的包得到。 SELinux 是 2.6 版本的Linux 内核中提供的强制访问控制(MAC）系统。

在 Cloudera Manager部署官方解答中，有三种部署方式，这里我选择第一种，自动安装。

安装路径
A — 通过 Cloudera Manager 自动安装 - Cloudera Manager 自动安装 Oracle JDK、Cloudera Manager Server、嵌入式 PostgreSQL 数据库、Cloudera Manager Agent、CDH、管理服务软件至群集主机，并为 Cloudera Manager Server 和 Hive Metastore
以及 Cloudera Management Service 角色（可选）配置数据库。建议概念部署演示和证明使用路径，但不建议产品部署使用，因为它不能扩展，随着群集的增长可能需要进行数据库迁移。要使用此方法，服务器和群集主机必须满足以下要求：

可使用根帐户或具有无密码权限的账户登录 Cloudera Manager Server 主机。
允许 Cloudera Manager Server 主机在同一端口具有统一的 SSH 访问，可访问所有主机。更多信息，请参阅网络和安全要求。
所有主机必须具有访问标准软件包存储库以及 archive.cloudera.com 或包含必要安装文件的本地存储库的权限。

对于以上三点要求，我的集群是满足的，之前配置了hadoop用户之间的免秘钥登录，所有主机都可以访问网络。

Pre-requisites: multiple, Internet-connected Linux machines, with SSH access, and significant free space in /var and /opt. 确认之后三部到位

$ wget http://archive.cloudera.com/cm5/installer/latest/cloudera-manager-installer.bin

$ chmod u+x cloudera-manager-installer.bin

$ sudo ./cloudera-manager-installer.bin

最后一步的时候，报错，hadoop不在superdoers中。进行配置即可。

vi /etc/sudoers

增加 hadoop ALL=（ALL） ALL

这一步是赋予用户hadoop所有root的权限。

执行第三步：

接下来一些列对话框，跳过即可，接着就是安装jdk

解决：我删除了 /etc/yum.repos.d/下面的几个repo文件：

-rw-r--r-- 1 root root 195 Oct 19 14:54 cloudera-manager.repo

-rw-r--r-- 1 root root 195 Oct 19 14:54 cloudera-manager.repo.rpmnew

-rw-r--r-- 1 root root 290 Dec 10 02:21 cloudera-manager.repo.rpmsave

然后重新安装就回复正常了，可能是之前我独自下载了一个repo文件的问题。

然后怎么知道正在安装呢？我想的是安装流量监控软件看网络是否有下载网速。

iptraf软件是一个监控网络的好工具，安装在这里不在介绍，点击这个链接查看详细步骤。

我得到了我的机器的下载jdk的网速：

可见网速十分缓慢。可能是办公室网络比较慢，用的源是越南的，而我所在地没有源，所以速度也就只能这样了。

到这里想起月凤先生讲过的一些道理。顺势而为，顺其自然是最好的方式，网速既然只有这样，那就这样最好。请耐心等待变盘的时刻。

耐心等待下终于安装好了，接下来安装server,中间等待的时间可能有10多分钟，一定要有耐心，不然中途退出就不好了。这个安装界面因为进度条显示不是实时的，总怀疑是不是出了什么问题，所以在这之前安装一个网络监控软件是一个很不错的选择，对于我这种需要安全感的人而言，看到网络tcp保持连接有网速，就觉得安心，也就不会怀疑停在这个界面是不是出了什么问题。

当然，另外一个好的选择就是 tail -f /var/log/cloudera-manager-installer/3.install-cloudera-manager-server.log 查看日志，不过也不是实时的貌似。

+------------------ Installing ------------------+

| . Cloudera Manager Server . |

| 40% |

| cloudera-manager-server |

| |

+------------------------------------------------+

这个时候的网速还是很快的：

可能因为cdh太大，还是要等待很长时间才会完成。粗略计算：jdk130MB+server
Total download size: 481 M 一共需下载600MB，需要二十分钟到三十分钟。

完成安装之后：

+--------------------------------------------------------- Next step ----------------------------------------------------------+

| Point your web browser to http://node1.com:7180/. Log in to Cloudera Manager with username: 'admin' and password: 'admin' to |

| continue installation. (Note that the hostname may be incorrect. If the url does not work, try the hostname you use when |

| remotely connecting to this machine.) If you have trouble connecting, make sure you have disabled firewalls, like iptables. |

|------------------------------------------------------------------------------------------------------------------------------|

| < OK > |

+------------------------------------------------------------------------------------------------------------------------------+

看到node1.com,我们需要在其他机器上打开这个链接，因此在本地计算机配置hosts文件加入：

192.168.122.128 node1.com

192.168.122.129 node2.com

192.168.122.130 node3.com

打开链接，显示登录框，表示我们安装成功：

接下来进行CDH的安装了。

Charles 于2015-12-17 Phnom Penh

版权说明：

本文由Charles Dong原创，本人支持开源以及免费有益的传播，反对商业化谋利。

CSDN博客：http://blog.csdn.net/mrcharles

个人站：http://blog.xingbod.cn

EMAIL：charles@xingbod.cn

hadoop再次集群搭建（4）-Cloudera Manager Installation的更多相关文章

hadoop再次集群搭建（5）-CDH Install
登录 http://node1.com:7180/.用户名和密码都是admin.启动服务命令是 service cloudera-scm-server start 最开始两个页面直接conti ...
hadoop再次集群搭建（3）-如何选择相应的hadoop版本
之前接触过很多很多hadoop版本,现在重新搭建平台,面临选择哪个版本的问题. 当我们决定是否采用某个软件用于开源环境时,通常需要考虑以下几个因素: (1)是否为开源软件,即是否免费. (2) 是否有 ...
hadoop再次集群搭建（1）-安装系统
从8月份到现在12月份,中间有四个月的时间没有学习hadoop系统了.其实适应新的环境,到现在一切尘埃落定,就应该静下心来,好好学习一下hadoop以及我之前很想学习的mahout.个人对算法比较感兴 ...
hadoop再次集群搭建（2）-配置免秘钥ssh登录
SSH对于大多程序员都不陌生,目前主流的云服务提供上也是通过SSH来提供链接的安全保障,比如AWS通过使用下载的私钥(private key)实现与EC2实例安全连接.GitHub通过上传的公钥(pu ...
Hadoop+HBase 集群搭建
Hadoop+HBase 集群搭建 1. 环境准备说明:本次集群搭建使用系统版本Centos 7.5 ,软件版本 V3.1.1. 1.1 配置说明本次集群搭建共三台机器,具体说明下: 主机名 IP ...
hadoop+spark集群搭建入门
忽略元数据末尾回到原数据开始处 Hadoop+spark集群搭建说明: 本文档主要讲述hadoop+spark的集群搭建,linux环境是centos,本文档集群搭建使用两个节点作为集群环境:一个 ...
Hadoop分布式集群搭建
layout: "post" title: "Hadoop分布式集群搭建" date: "2017-08-17 10:23" catalog ...
hadoop ha集群搭建
集群配置: jdk1.8.0_161 hadoop-2.6.1 zookeeper-3.4.8 linux系统环境:Centos6.5 3台主机:master.slave01.slave02 Hado ...
Hadoop分布式集群搭建hadoop2.6+Ubuntu16.04
前段时间搭建Hadoop分布式集群,踩了不少坑,网上很多资料都写得不够详细,对于新手来说搭建起来会遇到很多问题.以下是自己根据搭建Hadoop分布式集群的经验希望给新手一些帮助.当然,建议先把HDFS ...

随机推荐

<a>标签点击不跳转
HTML中的<a></a>标签点击不跳转的方法一.<a href="####" ></a> 使用这个方法我们会发现<a hr ...
十大监视SQL Server性能的计数器
作为DBA,每个人都会用一系列计数器来监视SQLSERVER的运行环境,使用计数器,既可以衡量当前的数据库的性能,还可以和以前的性能进行对比.我们也可以一直以快速和简单的方法把计数器做了一张图表来 ...
SSIS之序列容器
序列容器是一种十分简单,但使用非常广泛的容器,它可以对控制流的任务流组件进行结构化处理,把一些业务相关的任务组件,放到一个序列容器中,使整个包看起来更加整洁.美观,就如同我们家里的书柜.衣柜似的,把不 ...
getBytes()详解
在java中,getBytes()方法如果不指定字符集,则得到的是一个操作系统默认的编码格式的字节数组:如果指定字符集,则得到的是在指定字符集下的字节数组,如: byte[] b_gbk = &quo ...
vue-cli项目中如何使用锚点
两种方式: 1.使用vue-router实现锚点功能(利用html5的history模式,vue-router的滚动行为) import Vue from 'vue' import VueRouter ...
Pdf 解密后复制文字乱码
1.安装cajviewer 这个工具 2.用CAJviewer打开pdf文档 3.选择图像4.点文字识别,这时候就弹窗一个框,里面是可复制的文本,而且准确率比较高
RabbitMQ学习系列三：.net 环境下 C#代码订阅 RabbitMQ 消息并处理
上一篇已经讲了Rabbitmq如何在Windows平台安装不懂请移步: RabbitMQ学习系列二:.net 环境下 C#代码使用 RabbitMQ 消息队列一.理论 .net环境下,C#代码订阅 ...
New Concept English three （51）
22 76 Predicting the future is notoriously difficult. Who could have imagined, in the mid 1970s, for ...
UVA - 1218 Perfect Service (树形dp)(inf相加溢出)
题目链接题意:给你一个树形图,让你把其中若干个结点染成黑色,其余的染成白色,使得任意一个白色结点都恰好与一个黑色结点相邻. 解法比较容易,和树上的最大独立集类似,取一个结点作为树根,对每个结点分三种 ...
LeetCode Reverse String II
原题链接在这里:https://leetcode.com/problems/reverse-string-ii/#/description 题目: Given a string and an inte ...

hadoop再次集群搭建（4）-Cloudera Manager Installation

hadoop再次集群搭建（4）-Cloudera Manager Installation的更多相关文章

随机推荐

热门专题