决定选择 Cloudera Manager 进行安装,阅读官方文档,掌握大概脉络。

        Cloudera Manager在集群已经实现ssh免秘钥登录,能够访问网络资源和本地资源的情况下,可以自动安装和配置CDH(Cloudera  distributed hadoop),以及管理在这个集群上面的服务。
       Cloudera Manager安装软件包括:
  • A small self-executing Cloudera Manager installation program to install the Cloudera Manager Server and other packages in preparation for host installation.
  • Cloudera Manager wizard for automating CDH and managed service installation and configuration on the cluster hosts. Cloudera Manager provides two methods for installing CDH and managed services: traditional packages (RPMs or
    Debian packages) or parcels. Parcels simplify the installation process, and more importantly allows you to download, distribute, and activate new minor versions of CDH and managed services from within Cloudera Manager.

他的主要功能是:

  1. Automated deployment and configuration.
  2. Customizable Monitoring and reporting.
  3. Effortless, robust troubleshooting.
  4. Zero downtime maintenance.

在安装之前,我们需要执行两个操作,很重要。关闭防火墙是防止出现访问被拒绝, SElinux也是如此。集群之间的通信很重要,确保不会因为任何限制而导致通信失败。

关闭防火墙


在Hadoop安装过程中需要关闭防火墙和SElinux,否则会异常




1.    service iptables status 查看防火墙状态

2.    使用如下命令关闭iptables,执行该命令后重启机器生效

chkconfig iptables off
关闭之后:


关闭SElinux
1.    使用getenforce命令查看是否关闭
2.    修改/etc/selinux/config 文件

将SELINUX=enforcing改为SELINUX=disabled,执行该命令后重启机器生效

SELinux (Security-Enhanced Linux)  是 美国国家安全局(NSA)对于强制访问控制的实现, 是 Linux历史上最杰出的新安全子系统。 NSA 是 在Linux社区的帮助下开发了一种访问控制体系,在这种访问控制体系的限制下,进程只能访问那些在他的任务中所需要文件。  SELinux  默认安装在Fedora 和Red Hat Enterprise Linux 上,也可以作为其他发行版上容易安装的包得到。  SELinux 是 2.6 版本的Linux 内核中提供的强制访问控制(MAC)系统。


在 Cloudera Manager部署官方解答中,有三种部署方式,这里我选择第一种,自动安装

安装路径
A — 通过 Cloudera Manager 自动安装
 - Cloudera Manager 自动安装 Oracle JDK、Cloudera Manager Server、嵌入式 PostgreSQL 数据库、Cloudera Manager Agent、CDH、管理服务软件至群集主机,并为 Cloudera Manager Server 和 Hive Metastore
以及 Cloudera Management Service 角色(可选)配置数据库。建议概念部署演示和证明使用路径,但不建议产品部署使用,因为它不能扩展,随着群集的增长可能需要进行数据库迁移。要使用此方法,服务器和群集主机必须满足以下要求:

  • 可使用根帐户或具有无密码权限的账户登录 Cloudera Manager Server 主机。
  • 允许 Cloudera Manager Server 主机在同一端口具有统一的 SSH 访问,可访问所有主机。更多信息,请参阅 网络和安全要求
  • 所有主机必须具有访问标准软件包存储库以及 archive.cloudera.com 或包含必要安装文件的本地存储库的权限。
对于以上三点要求,我的集群是满足的,之前配置了hadoop用户之间的免秘钥登录,所有主机都可以访问网络。

Pre-requisites: multiple, Internet-connected Linux machines, with SSH access, and significant free space in /var and /opt. 确认之后 三部到位

$ wget http://archive.cloudera.com/cm5/installer/latest/cloudera-manager-installer.bin
$ chmod u+x cloudera-manager-installer.bin
$ sudo ./cloudera-manager-installer.bin

最后一步的时候,报错,hadoop不在superdoers中。进行配置即可。
 vi /etc/sudoers

增加 hadoop ALL=(ALL) ALL
这一步是赋予用户hadoop所有root的权限。
执行第三步:

接下来一些列对话框,跳过即可,接着就是安装jdk

解决:我删除了 /etc/yum.repos.d/下面的几个repo文件:

-rw-r--r--  1 root root  195 Oct 19 14:54 cloudera-manager.repo
-rw-r--r--  1 root root  195 Oct 19 14:54 cloudera-manager.repo.rpmnew
-rw-r--r--  1 root root  290 Dec 10 02:21 cloudera-manager.repo.rpmsave

然后重新安装就回复正常了,可能是之前我独自下载了一个repo文件的问题。

然后怎么知道正在安装呢?我想的是安装流量监控软件看网络是否有下载网速。

iptraf软件是一个监控网络的好工具,安装在这里不在介绍,点击这个链接查看详细步骤。


我得到了我的机器的下载jdk的网速:

可见网速十分缓慢。可能是办公室网络比较慢,用的源是越南的,而我所在地没有源,所以速度也就只能这样了。

到这里想起月凤先生讲过的一些道理。顺势而为,顺其自然是最好的方式,网速既然只有这样,那就这样最好。请耐心等待变盘的时刻。


耐心等待下终于安装好了,接下来安装server,中间等待的时间可能有10多分钟,一定要有耐心,不然中途退出就不好了。这个安装界面因为进度条显示不是实时的,总怀疑是不是出了什么问题,所以在这之前安装一个网络监控软件是一个很不错的选择,对于我这种需要安全感的人而言,看到网络tcp保持连接有网速,就觉得安心,也就不会怀疑停在这个界面是不是出了什么问题。

当然,另外一个好的选择就是 tail -f /var/log/cloudera-manager-installer/3.install-cloudera-manager-server.log 查看日志,不过也不是实时的貌似。

                                         +------------------ Installing ------------------+
                                         | .           Cloudera Manager Server          . |
                                         |                      40%                       |
                                         |            cloudera-manager-server             |
                                         |                                                |
                                         +------------------------------------------------+


这个时候的网速还是很快的:

可能因为cdh太大,还是要等待很长时间才会完成。粗略计算:jdk130MB+server 
Total download size: 481 M 一共需下载600MB,需要二十分钟到三十分钟。



完成安装之后:
+--------------------------------------------------------- Next step ----------------------------------------------------------+  
  | Point your web browser to  http://node1.com:7180/. Log in to Cloudera Manager with username: 'admin' and password: 'admin' to |  
  | continue installation. (Note that the hostname may be incorrect. If the url does not work, try the hostname you use when     |  
  | remotely connecting to this machine.) If you have trouble connecting, make sure you have disabled firewalls, like iptables.  |  
  |------------------------------------------------------------------------------------------------------------------------------|  
  |                                                            < OK >                                                            |  
  +------------------------------------------------------------------------------------------------------------------------------+  

看到node1.com,我们需要在其他机器上打开这个链接,因此在本地计算机配置hosts文件加入:

192.168.122.128    node1.com
192.168.122.129    node2.com
192.168.122.130    node3.com


打开链接,显示登录框,表示我们安装成功:

接下来进行CDH的安装了。


Charles 于2015-12-17 Phnom Penh



版权说明:
本文由Charles Dong原创,本人支持开源以及免费有益的传播,反对商业化谋利。
CSDN博客:http://blog.csdn.net/mrcharles
个人站:http://blog.xingbod.cn
EMAIL:charles@xingbod.cn

hadoop再次集群搭建(4)-Cloudera Manager Installation的更多相关文章

  1. hadoop再次集群搭建(5)-CDH Install

       登录 http://node1.com:7180/.用户名和密码都是admin.启动服务命令是 service  cloudera-scm-server start 最开始两个页面直接conti ...

  2. hadoop再次集群搭建(3)-如何选择相应的hadoop版本

    之前接触过很多很多hadoop版本,现在重新搭建平台,面临选择哪个版本的问题. 当我们决定是否采用某个软件用于开源环境时,通常需要考虑以下几个因素: (1)是否为开源软件,即是否免费. (2) 是否有 ...

  3. hadoop再次集群搭建(1)-安装系统

    从8月份到现在12月份,中间有四个月的时间没有学习hadoop系统了.其实适应新的环境,到现在一切尘埃落定,就应该静下心来,好好学习一下hadoop以及我之前很想学习的mahout.个人对算法比较感兴 ...

  4. hadoop再次集群搭建(2)-配置免秘钥ssh登录

    SSH对于大多程序员都不陌生,目前主流的云服务提供上也是通过SSH来提供链接的安全保障,比如AWS通过使用下载的私钥(private key)实现与EC2实例安全连接.GitHub通过上传的公钥(pu ...

  5. Hadoop+HBase 集群搭建

    Hadoop+HBase 集群搭建 1. 环境准备 说明:本次集群搭建使用系统版本Centos 7.5 ,软件版本 V3.1.1. 1.1 配置说明 本次集群搭建共三台机器,具体说明下: 主机名 IP ...

  6. hadoop+spark集群搭建入门

    忽略元数据末尾 回到原数据开始处 Hadoop+spark集群搭建 说明: 本文档主要讲述hadoop+spark的集群搭建,linux环境是centos,本文档集群搭建使用两个节点作为集群环境:一个 ...

  7. Hadoop分布式集群搭建

    layout: "post" title: "Hadoop分布式集群搭建" date: "2017-08-17 10:23" catalog ...

  8. hadoop ha集群搭建

    集群配置: jdk1.8.0_161 hadoop-2.6.1 zookeeper-3.4.8 linux系统环境:Centos6.5 3台主机:master.slave01.slave02 Hado ...

  9. Hadoop分布式集群搭建hadoop2.6+Ubuntu16.04

    前段时间搭建Hadoop分布式集群,踩了不少坑,网上很多资料都写得不够详细,对于新手来说搭建起来会遇到很多问题.以下是自己根据搭建Hadoop分布式集群的经验希望给新手一些帮助.当然,建议先把HDFS ...

随机推荐

  1. C# 实现WinForm窗口最小化到系统托盘代码

    1.如果不想让程序在任务栏中显示,请把窗体的属性ShowInTaskbar设置为false; 2.如果想让程序启动时就最小化,请设置窗体的属性WindowState设置为Minimized.(Mini ...

  2. review09

    String类在java.lang包中,由于java.lang包中的类被默认引入,所以可以直接使用String类.String对象的创建可以直接使用带字符串参数的构造方法 String s = new ...

  3. SSIS之数据流任务

    数据流任务主要用于运行数据流以提取.转换.加载源数据.一个包中可以有多个数据流任务,也可以包含零个数据流任务.下面关系图显示含有一个数据流任务的包: 了解数据流任务后,我们就简要的学习一下如何创建数据 ...

  4. javascript queue 打字效果

    <!DOCTYPE html> <html lang="en"> <head> <meta charset="UTF-8&quo ...

  5. 打印a*a的乘法表

    /*利用for循环打印 9*9 表? 1*1=1 1*2=2 2*2=4 1*3=3 2*3=6 3*3=9 1*4=4 2*4=8 3*4=12 4*4=16 1*5=5 2*5=10 3*5=15 ...

  6. Gym - 100502G Outing (强连通缩点+树形依赖背包)

    题目链接 问题:有n个人,最多选k个,如果选了某个人就必须选他指定的另一个人,问最多能选多少个人. 将每个人所指定的人向他连一条单向边,则每一个点都有唯一的前驱,形成的图是个基环树森林,在同一个强连通 ...

  7. 用HAWQ轻松取代传统数据仓库(八) —— 大表分区

    一.HAWQ中的分区表        与大多数关系数据库一样,HAWQ也支持分区表.这里所说的分区表是指HAWQ的内部分区表,外部分区表在后面“外部数据”篇讨论.在数据仓库应用中,事 实表通常有非常多 ...

  8. Python 2.7_爬取妹子图网站单页测试图片_20170114

    1.url= http://www.mzitu.com/74100/x,2为1到23的值 2.用到模块 os 创建文件目录; re模块正则匹配目录名 图片下载地址; time模块 限制下载时间;req ...

  9. 西瓜书概念整理(chapter 1-2)熟悉机器学习术语

    括号表示概念出现的其他页码, 如有兴趣协同整理,请到issue中认领章节 完整版见我的github:ahangchen 觉得还不错的话可以点个star ^_^ 第一章 绪论 Page2: 标记(lab ...

  10. bzoj 3887: Grass Cownoisseur Tarjan+Topusort

    题目: 给一个有向图,然后选一条路径起点终点都为1的路径出来,有一次机会可以沿某条边逆方向走,问最多有多少个点可以被经过?(一个点在路径中无论出现多少正整数次对答案的贡献均为1) 题解: 首先考虑简单 ...