一、安装之前

Cloudera管理器的存储空间规划

  ClouderaManager跟踪许多后台流程中的服务、作业和应用程序的指标。所有这些指标都需要存储。根据组织的大小,此存储可以是本地的或远程的,基于磁盘的,也可以是数据库中的,由您或其他团队在另一个位置管理。

  大多数系统管理员都知道常见的位置,如/var/log/这些地点需要有足够的空间。本主题帮助您规划Cloudera Manager Server和Cloudera Management Service用于存储度量和数据的存储需求和数据存储位置。

  未能规划Cloudera Manager Server和Cloudera管理服务的所有组件的存储需求,会以下列方式对集群产生负面影响:

  • 集群可能无法保留历史操作数据以满足内部需求。
  • 集群可能漏掉未收集或保留所需时间的关键审计信息。
  • 管理员可能无法研究过去的事件或健康状况。
  • 管理员可能在以后需要引用或报告历史 MR1、YARN或Impala使用数据时没有这些数据。
  • 在度量收集和图表方面可能存在空白。
  • 由于将存储位置填充到100%的容量,群集可能会出现数据丢失。这种事件的影响可能会影响到许多其他组成部分。

 配置网络名称

  首先,CDH需要IPv 4,不支持IPv 6。

  1、将主机名设置为唯一名称,不是localhost

sudo hostnamectl set-hostname foo-1.example.com

  2、编辑/etc/hosts具有集群中每个主机的IP地址和完全限定域名(FQDN)。您也可以添加非限定名。

1.1.1.1  foo-1.example.com  foo-1 
2.2.2.2 foo-2.example.com foo-2
3.3.3.3 foo-3.example.com foo-3
4.4.4.4 foo-4.example.com foo-4

注意:

  • 每个主机的规范名称。/etc/hosts 必是FQDN(例如myhost-1.example.com),而不是不合格的主机名(例如myhost-1)。
  • 不要使用别名,也不要在/etc/hosts或者配置DNS。
  • 在ClouderaManager实例中,非限定主机名(短名称)必须是唯一的。例如host01.example.com和host01.Standby.example.com由同一个             ClouderaManagerServer管理。

3、编辑/etc/sysconfig/Network仅用于此主机的FQDN:

HOSTNAME=foo-1.example.com

  4、验证每个主机是否一致地标识到网络:

  • 运行uname -a并检查主机名是否与主机名命令相同。
  • 运行/sbin/ifconfig并注意到inet addr在eth0(或bond0)条目,例如:
eth0      Link encap:Ethernet  HWaddr 00:0C:29:A4:E8:97             
inet addr:172.29.82.176 Bcast:172.29.87.255 Mask:255.255.248.0
...
  • 运行host -v -t A $(hostname)并验证输出是否与主机名命令相同。 IP地址应与ifconfig为eth0(或bond0):
Trying "foo-1.example.com"
...
;; ANSWER SECTION:
foo-1.example.com. 60 IN
A
172.29.82.176

 禁用防火墙

  若要在群集中的每个主机上禁用防火墙,请在每个主机上执行以下步骤:

  1、为iptables,保存现有规则集:

sudo iptables-save > ~/firewall.rules

  2、禁用防火墙(RHEL 7兼容):

sudo systemctl disable firewalld
sudo systemctl stop firewalld

设置SELinux模式

  安全增强的linux(SELinux)允许您通过策略设置访问控制。如果您在使用策略部署CDH时遇到问题,请在每个主机上设置SELinux,然后在集群上部署CDH。  若要设置SELinux模式,请在每个主机上执行以下步骤:

  1、检查SELinux状态:

getenforce

  2、如果输出是Permissive 或者 Disabled,您可以跳过此任务并继续执行禁用防火墙..如果输出是(enforcing)强制执行,继续下一步。

  3、打开/etc/selinux/config文件(在某些系统中,/etc/sysconfig/selinux文件)。

  4、将SELINUX=enforcing改为SELINUX=permissive.

  5、保存并关闭文件。

  6、重新启动系统或运行以下命令立即禁用SELinux:

setenforce 0

  安装和部署cdh之后,可以通过更改SELINUX=permissive回到SELINUX=enforcing  。在……里面/etc/selinux/config(或/etc/sysconfig/selinux),然后运行以下命令立即切换到强制执行模式:

setenforce 1

启用NTP服务

    CDH要求您配置网络时间协议(NTP)集群中每台机器上的服务。大多数操作系统包括ntpd用于时间同步的服务。使用ntpd对于时间同步:

  1、安装NTP

yum install ntp

  2、编辑/etc/ntp.conf文件以添加NTP服务器,如下面的示例所示。

server 0.pool.ntp.org
server 1.pool.ntp.org
server 2.pool.ntp.org

  3、启动ntpd服务(RHEL 7兼容):

sudo systemctl start ntpd

  4、配置ntpd在引导时运行的服务(RHEL 7兼容):

sudo systemctl enable ntpd

  5、将系统时钟同步到NTP服务器:

ntpdate -u <ntp_server>

  6、将硬件时钟与系统时钟同步:

hwclock --systohc

在Hue主机上安装Python2.7(RHEL 6版本安装)

  这里以CentOS 6.x为例,如下操作:

  1、启用软件收藏库:

sudo yum install centos-release-scl

  2、安装软件集合实用程序:

sudo yum install scl-utils

  3、安装Python 2.7:

sudo yum install python27

  4、验证是否安装了Python2.7:

source /opt/rh/python27/enable
python --version

Impala Requirements(略)

基于包的cdh安装所需的特权(略)

  

CDH6.3.0 - Cloudera Enterprise 6 Release Guide 安装准备篇的更多相关文章

  1. LINUX:Contos7.0 / 7.2 LAMP+R 下载安装Redis篇

    文章来源:http://www.cnblogs.com/hello-tl/p/7569108.html 更新时间:2017-09-21 16:09 简介 LAMP+R指Linux+Apache+Mys ...

  2. LINUX:Contos7.0 / 7.2 LAMP+R 下载安装Mysql篇

    文章来源:http://www.cnblogs.com/hello-tl/p/7569097.html 更新时间:2017-09-21 16:06 简介 LAMP+R指Linux+Apache+Mys ...

  3. LINUX:Contos7.0 / 7.2 LAMP+R 下载安装Php篇

    文章来源:http://www.cnblogs.com/hello-tl/p/7569071.html 更新时间:2017-09-21 16:03 简介 LAMP+R指Linux+Apache+Mys ...

  4. LINUX:Contos7.0 / 7.2 LAMP+R 下载安装Apache篇

    文章来源:http://www.cnblogs.com/hello-tl/p/7568803.html 更新时间:2017-09-21 15:38 简介 LAMP+R指Linux+Apache+Mys ...

  5. CDH6.1.0离线安装——笔记

    一. 概述 该文档主要记录大数据平台的搭建CDH版的部署过程,以供后续部署环境提供技术参考. 1.1 主流大数据部署方法 目前主流的hadoop平台部署方法主要有以下三种: Apache hadoop ...

  6. Red Hat Enterprise Linux Release Dates

    Red Hat Enterprise Linux Release Dates UpdatedMay 10 2016 at 10:57 PM - English The tables below lis ...

  7. [官网]Red Hat Enterprise Linux Release Dates

    Red Hat Enterprise Linux Release Dates https://access.redhat.com/articles/3078 The tables below list ...

  8. 【异常】ERROR main:com.cloudera.enterprise.dbutil.SqlFileRunner: Exception while executing ddl scripts. com.mysql.jdbc.exceptions.jdbc4.MySQLSyntaxErrorException: Table 'ROLES' already exists

    1 详细异常 2019-10-11 10:33:55,865 INFO main:com.cloudera.server.cmf.Main: ============================= ...

  9. flink编译支持CDH6.2.0(hadoop3.0.0)

    准备工作 因为在编译时需要下载许多依赖包,在执行编译前最好先配置下代理仓库 <mirrors> <mirror> <id>nexus-aliyun</id&g ...

随机推荐

  1. PL/SQL 监听程序当前无法识别连接描述符中请求的服务解决

    PL/SQL 用了几天后再登陆提示监听程序当前无法识别连接描述符中请求的服务,绞尽脑汁各种搜索找到以下解决方案-修改listener.ora文件 一般文件存在:app\Administrator\pr ...

  2. JDBC、Tomcat为什么要破坏双亲委派模型?

    问题一:双亲委派模型是什么 如果一个类加载器收到了加载某个类的请求,则该类加载器并不会去加载该类,而是把这个请求委派给父类加载器,每一个层次的类加载器都是如此,因此所有的类加载请求最终都会传送到顶端的 ...

  3. Codeforces 246C

    题意略. 思路: 我们将数组中的数字从大到小排列,分别考虑取前0 + 1,1 + 1,2 + 1.....个的情况. 所谓i + 1的意思是,取前i个的时候,同时取第[i + 1],[i + 2],. ...

  4. CAD数据分块,偏移校准,加载到百度地图、高德地图、谷歌等地图上

    前面分享过一篇如何将CAD海量数据显示在百度地图上(百度地图Canvas实现十万CAD数据秒级加载),但是很多开发者在CAD数据提取时遇到了问题,所以接下来的文章将介绍如何将CAD数据提取. 准备软件 ...

  5. Delphi - 通过WinAPI GetCursorPos实现鼠标位置的实时显示

    通过WinAPI GetCursorPos实现鼠标位置的实时显示 有时候我们需要将鼠标的位置实时抓取出来,可以通过如下方式实现. 添加一个Timer控件,执行间隔改为100ms,双击控件输入如下代码: ...

  6. 《阿里巴巴Java开发手册1.4.0》阅读总结与心得(四)

    (七)设计规约 1. [强制] 存储方案和底层数据结构的设计获得评审一致通过,并沉淀成为文档. 说明: 有缺陷的底层数据结构容易导致系统风险上升,可扩展性下降,重构成本也会因历史数据迁移和系统平滑过渡 ...

  7. CodeForces 677D. Vanya and Treasure 枚举行列

    677D. Vanya and Treasure 题意: 给定一张n*m的图,图上每个点标有1~p的值,你初始在(1,1)点,你必须按照V:1,2,3...p的顺序走图上的点,问你如何走时间最少. 思 ...

  8. hdu 2767 Proving Equivalences(tarjan缩点)

    题目链接:http://acm.hdu.edu.cn/showproblem.php?pid=2767 题意:问最少加多少边可以让所有点都相互连通. 题解:如果强连通分量就1个直接输出0,否者输出入度 ...

  9. codeforces 749D Leaving Auction(二分)

    题目链接:http://codeforces.com/problemset/problem/749/D 题意:就是类似竞拍,然后报价肯定要比上一个高,然后查询输入k个数表示那些人的竞拍无效, 输出最后 ...

  10. B. Tea Queue codeforces Round.37.div2 队列

    B. Tea Queue time limit per test 1 second memory limit per test 256 megabytes input standard input o ...