一、安装之前

Cloudera管理器的存储空间规划

  ClouderaManager跟踪许多后台流程中的服务、作业和应用程序的指标。所有这些指标都需要存储。根据组织的大小,此存储可以是本地的或远程的,基于磁盘的,也可以是数据库中的,由您或其他团队在另一个位置管理。

  大多数系统管理员都知道常见的位置,如/var/log/这些地点需要有足够的空间。本主题帮助您规划Cloudera Manager Server和Cloudera Management Service用于存储度量和数据的存储需求和数据存储位置。

  未能规划Cloudera Manager Server和Cloudera管理服务的所有组件的存储需求,会以下列方式对集群产生负面影响:

  • 集群可能无法保留历史操作数据以满足内部需求。
  • 集群可能漏掉未收集或保留所需时间的关键审计信息。
  • 管理员可能无法研究过去的事件或健康状况。
  • 管理员可能在以后需要引用或报告历史 MR1、YARN或Impala使用数据时没有这些数据。
  • 在度量收集和图表方面可能存在空白。
  • 由于将存储位置填充到100%的容量,群集可能会出现数据丢失。这种事件的影响可能会影响到许多其他组成部分。

 配置网络名称

  首先,CDH需要IPv 4,不支持IPv 6。

  1、将主机名设置为唯一名称,不是localhost

sudo hostnamectl set-hostname foo-1.example.com

  2、编辑/etc/hosts具有集群中每个主机的IP地址和完全限定域名(FQDN)。您也可以添加非限定名。

1.1.1.1  foo-1.example.com  foo-1 
2.2.2.2 foo-2.example.com foo-2
3.3.3.3 foo-3.example.com foo-3
4.4.4.4 foo-4.example.com foo-4

注意:

  • 每个主机的规范名称。/etc/hosts 必是FQDN(例如myhost-1.example.com),而不是不合格的主机名(例如myhost-1)。
  • 不要使用别名,也不要在/etc/hosts或者配置DNS。
  • 在ClouderaManager实例中,非限定主机名(短名称)必须是唯一的。例如host01.example.com和host01.Standby.example.com由同一个             ClouderaManagerServer管理。

3、编辑/etc/sysconfig/Network仅用于此主机的FQDN:

HOSTNAME=foo-1.example.com

  4、验证每个主机是否一致地标识到网络:

  • 运行uname -a并检查主机名是否与主机名命令相同。
  • 运行/sbin/ifconfig并注意到inet addr在eth0(或bond0)条目,例如:
eth0      Link encap:Ethernet  HWaddr 00:0C:29:A4:E8:97             
inet addr:172.29.82.176 Bcast:172.29.87.255 Mask:255.255.248.0
...
  • 运行host -v -t A $(hostname)并验证输出是否与主机名命令相同。 IP地址应与ifconfig为eth0(或bond0):
Trying "foo-1.example.com"
...
;; ANSWER SECTION:
foo-1.example.com. 60 IN
A
172.29.82.176

 禁用防火墙

  若要在群集中的每个主机上禁用防火墙,请在每个主机上执行以下步骤:

  1、为iptables,保存现有规则集:

sudo iptables-save > ~/firewall.rules

  2、禁用防火墙(RHEL 7兼容):

sudo systemctl disable firewalld
sudo systemctl stop firewalld

设置SELinux模式

  安全增强的linux(SELinux)允许您通过策略设置访问控制。如果您在使用策略部署CDH时遇到问题,请在每个主机上设置SELinux,然后在集群上部署CDH。  若要设置SELinux模式,请在每个主机上执行以下步骤:

  1、检查SELinux状态:

getenforce

  2、如果输出是Permissive 或者 Disabled,您可以跳过此任务并继续执行禁用防火墙..如果输出是(enforcing)强制执行,继续下一步。

  3、打开/etc/selinux/config文件(在某些系统中,/etc/sysconfig/selinux文件)。

  4、将SELINUX=enforcing改为SELINUX=permissive.

  5、保存并关闭文件。

  6、重新启动系统或运行以下命令立即禁用SELinux:

setenforce 0

  安装和部署cdh之后,可以通过更改SELINUX=permissive回到SELINUX=enforcing  。在……里面/etc/selinux/config(或/etc/sysconfig/selinux),然后运行以下命令立即切换到强制执行模式:

setenforce 1

启用NTP服务

    CDH要求您配置网络时间协议(NTP)集群中每台机器上的服务。大多数操作系统包括ntpd用于时间同步的服务。使用ntpd对于时间同步:

  1、安装NTP

yum install ntp

  2、编辑/etc/ntp.conf文件以添加NTP服务器,如下面的示例所示。

server 0.pool.ntp.org
server 1.pool.ntp.org
server 2.pool.ntp.org

  3、启动ntpd服务(RHEL 7兼容):

sudo systemctl start ntpd

  4、配置ntpd在引导时运行的服务(RHEL 7兼容):

sudo systemctl enable ntpd

  5、将系统时钟同步到NTP服务器:

ntpdate -u <ntp_server>

  6、将硬件时钟与系统时钟同步:

hwclock --systohc

在Hue主机上安装Python2.7(RHEL 6版本安装)

  这里以CentOS 6.x为例,如下操作:

  1、启用软件收藏库:

sudo yum install centos-release-scl

  2、安装软件集合实用程序:

sudo yum install scl-utils

  3、安装Python 2.7:

sudo yum install python27

  4、验证是否安装了Python2.7:

source /opt/rh/python27/enable
python --version

Impala Requirements(略)

基于包的cdh安装所需的特权(略)

  

CDH6.3.0 - Cloudera Enterprise 6 Release Guide 安装准备篇的更多相关文章

  1. LINUX:Contos7.0 / 7.2 LAMP+R 下载安装Redis篇

    文章来源:http://www.cnblogs.com/hello-tl/p/7569108.html 更新时间:2017-09-21 16:09 简介 LAMP+R指Linux+Apache+Mys ...

  2. LINUX:Contos7.0 / 7.2 LAMP+R 下载安装Mysql篇

    文章来源:http://www.cnblogs.com/hello-tl/p/7569097.html 更新时间:2017-09-21 16:06 简介 LAMP+R指Linux+Apache+Mys ...

  3. LINUX:Contos7.0 / 7.2 LAMP+R 下载安装Php篇

    文章来源:http://www.cnblogs.com/hello-tl/p/7569071.html 更新时间:2017-09-21 16:03 简介 LAMP+R指Linux+Apache+Mys ...

  4. LINUX:Contos7.0 / 7.2 LAMP+R 下载安装Apache篇

    文章来源:http://www.cnblogs.com/hello-tl/p/7568803.html 更新时间:2017-09-21 15:38 简介 LAMP+R指Linux+Apache+Mys ...

  5. CDH6.1.0离线安装——笔记

    一. 概述 该文档主要记录大数据平台的搭建CDH版的部署过程,以供后续部署环境提供技术参考. 1.1 主流大数据部署方法 目前主流的hadoop平台部署方法主要有以下三种: Apache hadoop ...

  6. Red Hat Enterprise Linux Release Dates

    Red Hat Enterprise Linux Release Dates UpdatedMay 10 2016 at 10:57 PM - English The tables below lis ...

  7. [官网]Red Hat Enterprise Linux Release Dates

    Red Hat Enterprise Linux Release Dates https://access.redhat.com/articles/3078 The tables below list ...

  8. 【异常】ERROR main:com.cloudera.enterprise.dbutil.SqlFileRunner: Exception while executing ddl scripts. com.mysql.jdbc.exceptions.jdbc4.MySQLSyntaxErrorException: Table 'ROLES' already exists

    1 详细异常 2019-10-11 10:33:55,865 INFO main:com.cloudera.server.cmf.Main: ============================= ...

  9. flink编译支持CDH6.2.0(hadoop3.0.0)

    准备工作 因为在编译时需要下载许多依赖包,在执行编译前最好先配置下代理仓库 <mirrors> <mirror> <id>nexus-aliyun</id&g ...

随机推荐

  1. Java 并发编程(一):摩拳擦掌

    这篇文章的标题原本叫做——Java 并发编程(一):简介,作者名叫小二.但我在接到投稿时觉得这标题不够新颖,不够吸引读者的眼球,就在发文的时候强行修改了标题(也不咋滴). 小二是一名 Java 程序员 ...

  2. eclipse中导入外部包却无法查看对应源码或Javadoc的入坑指南

    eclipse中导入外部包却无法查看对应源码或Javadoc的 入坑指南 出现这个错误的原因是,你虽然导入了.jar包,但没有配置对应的Javadoc或源码路径,所以在编辑器中无法查看源 码和对应AP ...

  3. 依赖倒置原则(DIP)、控制反转(IoC)、依赖注入(DI)(C#)

    理解: 依赖倒置原则(DIP)主程序要依赖于抽象接口,不要依赖于具体实现.高层模块不应该依赖底层模块,两个都应该以来抽象.抽象不应该依赖细节,细节应该依赖抽象.(具体看我上一篇贴子) 依赖倒置原则是六 ...

  4. 第10章 文档对象模型DOM 10.1 Node节点类型

    DOM是针对 HTML 和 XML 文档的一个 API(应用程序编程接口) .DOM描绘了一个层次化的节点树,允许开发人员添加.移除和修改页面的某一部分.DOM 脱胎于Netscape 及微软公司创始 ...

  5. PHP文件基础操作

    文件的基本操作:(更多) fopen():文件打开 $file = fopen("file.txt","r+"); fopen()函数的参数是目标文件的路径和文 ...

  6. 牛客小白月赛5 E 面积 计算三角形面积模板 波尔约-格维也纳定理 匹克公式

    链接:https://www.nowcoder.com/acm/contest/135/E来源:牛客网 题目描述 定义“最大生成图”:在M*N的点阵中,连接一些点形成一条经过所有点恰好一次的回路,且连 ...

  7. Codeforces 734D. Anton and Chess(模拟)

    Anton likes to play chess. Also, he likes to do programming. That is why he decided to write the pro ...

  8. codeforces 798 C. Mike and gcd problem(贪心+思维+数论)

    题目链接:http://codeforces.com/contest/798/problem/C 题意:给出一串数字,问如果这串数字的gcd大于1,如果不是那么有这样的操作,删除ai, ai + 1 ...

  9. 深入vue源码,了解vue的双向数据绑定原理

    大家都知道vue是一种MVVM开发模式,数据驱动视图的前端框架,并且内部已经实现了双向数据绑定,那么双向数据绑定是怎么实现的呢? 先手动撸一个最最最简单的双向数据绑定 <div> < ...

  10. solr 的基本用法

    上图为 solr 的搜索页面,常用字段的基本用法如下: 1. q: 查询字符串,过滤条件,不能为空,必须输入,如果查询全部就写 * : * name:“马”  AND age:[0 TO 18]   ...