CDH 6.0.1 集群搭建 「Before install」
从这一篇文章开始会有三篇文章依次介绍集群搭建 「Before install」 「Process」 「After install」
继上一篇使用 docker 部署单机 CDH 的文章,当我们使用 docker 评估完相关组件和一些功能之后,接下来就是使用 CDH express 版本来搭建集群。
搭建之前应该关注一下手册看下还有哪些可以注意的地方参见官方 before your install
https://www.cloudera.com/documentation/enterprise/6/6.0/topics/installation_reqts.html#pre-install
看了一下5.x.x 的最后一个版本是 5.15.x 然后所带的组件如下:
Component | Package Version | Tarball | Release Notes | Changes File |
---|---|---|---|---|
Apache Avro | avro-1.7.6+cdh5.15.1+140 | Tarball | Release notes | Changes |
Apache Crunch | crunch-0.11.0+cdh5.15.1+104 | Tarball | Release notes | Changes |
Apache DataFu | pig-udf-datafu-1.1.0+cdh5.15.1+27 | Tarball | Release notes | Changes |
Apache Flume | flume-ng-1.6.0+cdh5.15.1+189 | Tarball | Release notes | Changes |
Apache Hadoop | hadoop-2.6.0+cdh5.15.1+2822 | Tarball | Release notes | Changes |
Apache Hadoop MRv1 | hadoop-0.20-mapreduce-2.6.0+cdh5.15.1+2822 | (none) | (none) | (none) |
Apache HBase | hbase-1.2.0+cdh5.15.1+470 | Tarball | Release notes | Changes |
Apache HBase-Solr | hbase-solr-1.5+cdh5.15.1+74 | Tarball | Release notes | Changes |
Apache Hive | hive-1.1.0+cdh5.15.1+1395 | Tarball | Release notes | Changes |
Hue | hue-3.9.0+cdh5.15.1+8420 | Tarball | Release notes | Changes |
Apache Impala | impala-2.12.0+cdh5.15.1+0 | (none) | Release notes | Changes |
Kite SDK | kite-1.0.0+cdh5.15.1+147 | Tarball | Release notes | Changes |
Apache Kudu | kudu-1.7.0+cdh5.15.1+0 | (none) | Release notes | Changes |
Llama | llama-1.0.0+cdh5.15.1+0 | Tarball | Release notes | Changes |
Apache Mahout | mahout-0.9+cdh5.15.1+36 | Tarball | Release notes | Changes |
Apache Oozie | oozie-4.1.0+cdh5.15.1+492 | Tarball | Release notes | Changes |
Apache Parquet | parquet-1.5.0+cdh5.15.1+197 | Tarball | Release notes | Changes |
Parquet-format | parquet-format-2.1.0+cdh5.15.1+20 | Tarball | Release notes | Changes |
Apache Pig | pig-0.12.0+cdh5.15.1+114 | Tarball | Release notes | Changes |
Cloudera Search | search-1.0.0+cdh5.15.1+0 | Tarball | Release notes | Changes |
Apache Sentry | sentry-1.5.1+cdh5.15.1+458 | Tarball | Release notes | Changes |
Apache Solr | solr-4.10.3+cdh5.15.1+529 | Tarball | Release notes | Changes |
Apache Spark | spark-1.6.0+cdh5.15.1+569 | Tarball | Release notes | Changes |
Apache Sqoop | sqoop-1.4.6+cdh5.15.1+136 | Tarball | Release notes | Changes |
Apache Sqoop2 | sqoop2-1.99.5+cdh5.15.1+49 | Tarball | Release notes | Changes |
Apache Whirr | whirr-0.9.0+cdh5.15.1+25 | Tarball | Release notes | Changes |
Apache ZooKeeper | zookeeper-3.4.5+cdh5.15.1+149 | Tarball | Release notes | Changes |
这个图很容易看出即使是 5.x 的最新版本使用的 spark 的版本是 1.6.0,这个版本远远滞后了目前的社区 spark 发布的版本。如果要使用更新版本可能需要自己自行安装。
我们从 0 搭建当然愿意使用更新的稳定版本,所以采用 6.0.1 下面是 6.0.1 的一个软件包支持情况:
Component | Component Version | Changes Information |
---|---|---|
Apache Avro | 1.8.2 | Changes |
Apache Flume | 1.8.0 | Changes |
Apache Hadoop | 3.0.0 | Changes |
Apache HBase | 2.0.0 | Changes |
HBase Indexer | 1.5 | Changes |
Apache Hive | 2.1.1 | Changes |
Hue | 4.2.0 | Changes |
Apache Impala | 3.0.0 | Changes |
Apache Kafka | 1.0.1 | Changes |
Kite SDK | 1.0.0 | |
Apache Kudu | 1.6.0 | Changes |
Apache Solr | 7.0.0 | Changes |
Apache Oozie | 5.0.0 | Changes |
Apache Parquet | 1.9.0 | Changes |
Parquet-format | 2.3.1 | Changes |
Apache Pig | 0.17.0 | Changes |
Apache Sentry | 2.0.0 | Changes |
Apache Spark | 2.2.0 | Changes |
Apache Sqoop | 1.4.7 | Changes |
Apache ZooKeeper | 3.4.5 | Changes |
可以很容易看到两个关键地方的更新,一个是从 6.0.x 版本开始之后, hadoop 使用了 3.0.x 版本了。另外一个关键组件 spark 也从之前的 1.6.0 被升级到了 2.2.0。
包括 hadoop 版本和 spark 版本的变动,都可以前往官方网站获得更多的信息。
部署之前除了参看 before install 之外 ,可以仔细阅读一下 「Cloudera Enterprise Reference Architecture for Bare Metal Deployments」 这个文档。他会从物理机器配置,os 需求等部署相关的硬件问题,软件问题,操作系统问题,以及你想要的集群大小给出一些合理建议。
1. 比如推荐你使用 dns 而不要使用 hosts 文件来管理集群。
2. 比如推荐你关闭 iptables 来避免一些不必要的麻烦。
3. 比如推荐你开启 ntp 时间服务器,来同步 master 与各 node 之间的时间。
4. 比如给你硬盘划分资源提出一些合理建议
等等等.参看这个手册,寻找一些我们关心的问题变得很有必要。
关于大礼包吃资源的情况,另外一个文档列出了更详细的信息:
我们关心的 CM(cloudera manager) 吃资源的情况
Cloudera Manager Server Storage Requirements
Component Storage Notes Partition hosting /usr 1 GB Cloudera Manager Database 5 GB If the Cloudera Manager Database shares a host with the Service Monitor and Host Monitor, more storage space is required to meet the requirements for those components. Host Based Cloudera Manager Server Requirements
Number of Cluster Hosts Database Host Configuration Heap Size Logical Processors Cloudera Manager Server Storage Local Directory Very small (≤10) Shared 2 GB 4 5 GB minimum Small (≤20) Shared 4 GB 6 20 GB minimum Medium (≤200) Dedicated 8 GB 6 200 GB minimum Large (≤500) Dedicated 10 GB 8 500 GB minimum Extra Large (>500) Dedicated 16 GB 16 1 TB minimum
可以看到,根据集群大小的不同有一些不同的参数推荐。文档下面还有大礼包里面包含所有组件在什么情况部署下 大概消费的资源的参考。但是最终消耗还是要看我们自己部署的机器数目和开启应用的数量还有我们使用的情况。这些资料可以提供一个合理的参考。
想要了解 CDH 的全局端口使用情况(包含所有的大礼包里面的服务)可以参照
https://www.cloudera.com/documentation/enterprise/6/6.0/topics/cm_ig_ports_cm.html#cm_cn_ports
想要了解 CDH hosts 以及 master 应该如何分配,可以参照
https://www.cloudera.com/documentation/enterprise/6/6.0/topics/cm_ig_host_allocations.html#host_role_assignments
如果想要了解一些自定义安装的详情,例如你不使用 CM 进行安装,想要安装一些老的组件可以参考
https://www.cloudera.com/documentation/enterprise/6/6.0/topics/cm_ig_custom_installation.html
以上就是开始集群搭建之前需要了解的一些情况,在这里做一个简单的纪录。
Reference:
https://www.cloudera.com/documentation/enterprise/6/6.0/topics/installation_reqts.html#pre-install Before You Install
https://techvidvan.com/tutorials/hadoop-2-x-vs-hadoop-3-x/ 20 Notable Difference Between Hadoop 2.x vs Hadoop 3.x
http://www.cloudera.com/documentation/other/reference-architecture/PDF/cloudera_ref_arch_metal.pdf
https://www.cloudera.com/documentation/enterprise/release-notes/topics/hardware_requirements_guide.html
https://www.cloudera.com/documentation/enterprise/6/6.0/topics/cm_ig_ports_cm.html#cm_cn_ports CDH 大礼包的端口使用详情(包含了所有的服务)
https://www.cloudera.com/documentation/enterprise/6/6.0/topics/cm_ig_host_allocations.html#host_role_assignments CDH 角色分配
https://www.cloudera.com/documentation/enterprise/6/6.0/topics/cm_ig_custom_installation.html CDH 自定义安装的一些介绍
CDH 6.0.1 集群搭建 「Before install」的更多相关文章
- CDH 6.0.1 集群搭建 「After install」
集群搭建完成之后其实还有很多配置工作要做,这里我列举一些我去做的一些. 首先是去把 zk 的角色重新分配一下,不知道是不是我在配置的时候遗漏了什么在启动之后就有报警说目前只能检查到一个节点.去将 zk ...
- CDH 6.0.1 集群搭建 「Process」
这次搭建我使用的机器 os 是 Centos7.4 RH 系的下面以流的方式纪录搭建过程以及注意事项 Step1: 配置域名相关,因为只有三台机器组集群,所以直接使用了 hosts 的方法: 修改主机 ...
- Redis 5.0.5集群搭建
Redis 5.0.5集群搭建 一.概述 Redis3.0版本之后支持Cluster. 1.1.redis cluster的现状 目前redis支持的cluster特性: 1):节点自动发现 2):s ...
- java_redis3.0.3集群搭建
redis3.0版本之后支持Cluster,具体介绍redis集群我就不多说,了解请看redis中文简介. 首先,直接访问redis.io官网,下载redis.tar.gz,现在版本3.0.3,我下面 ...
- Redis 3.0.2集群搭建以及相关问题汇总
Redis3 正式支持了 cluster,是为了解决构建redis集群时的诸多不便 (1)像操作单个redis一样操作key,不用操心key在哪个节点上(2)在线动态添加.删除redis节点,不用停止 ...
- Hadoop2.0 HA集群搭建步骤
上一次搭建的Hadoop是一个伪分布式的,这次我们做一个用于个人的Hadoop集群(希望对大家搭建集群有所帮助): 集群节点分配: Park01 Zookeeper NameNode (active) ...
- redis4.0.6集群搭建
文件环境:CentOS7 + redis4.0.6 先去官网下载redis:https://redis.io/,然后上传到你的虚拟机,我上传到了/mysoft 先解压->然后进入主目录-> ...
- redis3.0.3集群搭建
redis3.0版本之后支持Cluster,具体介绍redis集群我就不多说,了解请看redis中文简介. 首先,直接访问redis.io官网,下载redis.tar.gz,现在版本3.0.3,我下面 ...
- ubuntu18.04 flink-1.9.0 Standalone集群搭建
集群规划 Master JobManager Standby JobManager Task Manager Zookeeper flink01 √ √ flink02 √ √ flink03 √ √ ...
随机推荐
- vue 数据绑定实现的核心 Object.defineProperty()
vue深入响应式原理 现在是时候深入一下了!Vue 最独特的特性之一,是其非侵入性的响应式系统.数据模型仅仅是普通的 JavaScript 对象.而当你修改它们时,视图会进行更新.这使得状态管理非常简 ...
- 003_webpack 配合babel 将es6转成es5
今天接触了webpack,第一次使用webpack进行转码,竟然稀里糊涂就成功了,哈哈. 下面附上流程 创建个文件夹,初始化一下,首先全局安装webpack npm install webpack - ...
- Python框架学习之Flask中的数据库操作
数据库操作在web开发中扮演着一个很重要的角色,网站中很多重要的信息都需要保存到数据库中.如用户名.密码等等其他信息.Django框架是一个基于MVT思想的框架,也就是说他本身就已经封装了Model类 ...
- Java的错误类型
程序的错误分为:编译期语法错误.运行期异常错误和运行期逻辑错误 (1)编译期语法错误可以借助Eclipse的帮助方便地定位错误,并进行修改 如: (2)运行期异常,即 没有语法错误,编译可以通过,但运 ...
- C语言数组求长度
1.创建数组 ,,,,};/*创建一个int型数组,数组的长度为5*/ 2.利用sizeof求一维数组长度 int len; len = sizeof(a)/sizeof(int); Δ以上求数组长度 ...
- Clustering[Evaluation]
0. 背景 评估(或者说验证)聚类结果就如同聚类本身一样困难.通常的方法有内部评估和外部评估这两种: 内部评估的方法:通过一个单一的量化得分来评估算法好坏:该类型的方法 外部评估的方法:通过将聚类结果 ...
- Fiddler抓包和修改WebSocket数据,支持wss
记录一下用Fiddler对WebSocket收发的数据进行抓包分析和篡改数据,只找到这么一个方法,能用就行吧. 时间:2019-3-29 环境: win7 + Fiddler 5.0 Fiddler抓 ...
- CF892/problem/C
题目传送门: [http://codeforces.com/contest/892/problem/C] 题意: 给你一个长度为n的数组,相邻两个元素的GCD(最大公约数)可以取代二者的任意一个,问你 ...
- p201 谱集是闭集 有界集
1 是如何来的? 由1 如何推出 2 2 是如何来的?谢谢 1.σ是的补集 入属于ρ 稠密是因为 T有定义的地方,λI-T都有定义,有界是因为 所以 然后 ρ是σ的补集 模比||T||大的数都 ...
- mysql_查的小理解
show create table employee; 对这个语句的小理解: 顿悟呀,之前一直不太理解这条语句,现在忽然觉得明朗起来.他就是展示创建这个表格时的SQL语句.执行上述代码之后结果如下: ...