一、什么是CDH

  CDH是Cloudera's Distribution Including Apache Hadoop的缩写,即Cloudera公司发布的Hadoop发行版。它是一个为Hadoop构建的企业级数据平台,提供了Hadoop核心组件的预编译、测试和优化的版本,以及管理这些组件的工具和附加功能。Cloudera提供了易于安装、配置和管理的Hadoop解决方案,使得企业能够更轻松地集成和使用Hadoop进行大数据分析和处理。集成了Zookeeper、HDFS、Yarn...等大数据服务。

二、为什么使用CDH

  • 原生Hadoop版本很多,兼容性需要自己调研,成本高。
  • 缺乏边界的管理工具或者平台,运维效率低,成本高。
  • Hadoop相关组件发行商也比较多。
  • CDH比较友好,使用者多。

二、CDH和TDH的区别?

共同点:

  1、两者都是基于Apache Hadoop开发的大数据集成平台,集成了大数据各个服务

  2、都有manager节点对集群agent节点的大数据服务进行可视化监控,并可以对集群节点进行可视化扩容缩容操作。

不同点:

  1、Cloudera作为Hadoop领域的领先企业,拥有广泛的社区和强大的技术支持。提供有免费版CDH以供下载安装使用,在某种程度上,能够有利于对市场的推广。毕竟在当下,IT领域的开源是很重要的,有前人开拓,有后人继往开来,才能让IT技术与时俱进。

  2、TDH(Transwarp Data Hub)依赖于其背后的公司进行支持,并且TDH只有短暂的试用期,后续使用需要联系其厂商,购买相关许可证。并且其并没有广泛的社区,客户在遇到问题时,还是需要联系厂商以提供对应的技术支持以及维护。

三、CM的作用?

 CM是Cloudera Manager的缩写,它是Cloudera提供的用于管理Hadoop集群的工具。

 CM的主要作用包括:

 1、集群部署和配置

  通过CM,用户可以更轻松地部署和配置Hadoop集群,包括添加或删除节点、配置组件参数等。

 2、监控和诊断

  CM提供了强大的监控功能,可以实时查看集群的运行状态、性能指标等。同时,它还提供了诊断工具,帮助用户快速定位和解决问题。

 3、安全和管理

  CM支持多种安全特性,如Kerberos认证、访问控制等,确保集群的安全性。此外,它还提供了集群管理的功能,如资源调度、作业管理等。

四、CDH相对开源的Hadoop,有哪些差异?

1、易用性和管理性:CDH提供了预编译、测试和优化的Hadoop组件版本,以及强大的管理工具(如CM),使得用户可以更轻松地安装、配置和管理Hadoop集群。而开源的Hadoop则需要用户自行处理这些繁琐的工作。

2、稳定性和可靠性:Cloudera对Hadoop组件进行了深入的测试和优化,以确保CDH的稳定性和可靠性。这有助于减少用户在生产环境中可能遇到的问题。

3、安全性和合规性:CDH可能包含更多的安全特性和合规性支持,以满足企业级应用的需求。这些特性可能包括Kerberos认证、审计日志、数据加密等。

4、支持和维护:作为商业产品,CDH提供了专业的技术支持和维护服务,可以帮助用户解决在使用过程中遇到的问题。而开源的Hadoop则主要依赖于社区的支持。

— 要养成终生学习的习惯 —

CDH - [01] 概述的更多相关文章

  1. kafka详解(01) - 概述

    kafka详解(01) - 概述 定义:Kafka是一个分布式的基于发布/订阅模式的消息队列(Message Queue),主要应用于大数据实时处理领域. 消息队列 MQ传统应用场景之异步处理 使用消 ...

  2. Zookeeper详解(01) -概述

    Zookeeper详解(01) -概述 概念 Zookeeper是一个开源的分布式的,为分布式应用提供协调服务的Apache项目. Zookeeper从设计模式角度来理解,是一个基于观察者模式设计的分 ...

  3. 01 - 概述 VTK 6.0 迁移

    摘要 对vtk版本4和5的管道机制重新架架构的主要目的是:迁移数据对象和算法对象中的管道执行逻辑到一个新集合的类中,我们称这个集合类叫executives.分离数据和执行模型的代码后,可以双双简化修改 ...

  4. Redis数据库 01概述| 五大数据类型

    1.NoSQL数据库简介 解决应用服务器的CPU和内存压力:解决数据库服务的IO压力: ----->>> ① session存在缓存数据库(完全在内存里),速度快且数据结构简单: 打 ...

  5. Hive 01 概述、安装配置

    概述 数据仓库:是一个面向主题的.集成的.不可更新的.随时间不变化的数据集合,它用于支持企业或组织的决策分析处理. 数据仓库的结构和建立过程: 数据源 数据存储及管理 ETL Extract 提取 T ...

  6. 【OracleDB】 01 概述和基本操作

    实例概念: Oracle有一个特殊的概念 Oracle数据库 = 数据库 + Oracle文件系统 + Oracle实例 实例处理Oracle的请求,调用文件系统 然后返回结果响应给客户端 单实例和多 ...

  7. 【大数据面试】Flink 01 概述:包含内容、层次架构、运行组件、部署模式、任务提交流程、任务调度概念、编程模型组成

    一.概述 1.介绍 对无界和有界数据流进行有状态计算的分布式引擎和框架,并可以使用高层API编写分布式任务,主要包括: DataSet API(批处理):静态数据抽象为分布式数据集,方便使用操作符进行 ...

  8. Headfirst JSP 01 (概述)

    HTTP 协议 http 是tcp/ip上层协议, 如果你对这些网络协议还不是太熟悉, 下面提供一个非常简单的解释, tcp负责确保从一个网络节点向另一个网络节点发送文件能作为一个完整的文件到达目的地 ...

  9. Python学习笔记 :01概述

    Python基础 首先推荐学习Python基础的教程和书籍 视频教程推荐南京大学张莉老师在cousera上的教程用Python玩转数据 入门教程<Python基础教程> 数据挖掘教程< ...

  10. 重学C语言---01概述

    1.什么是C语言 C语言是一种计算机程序设计语言,它既具有高级语言的特点,又具有汇编语言的特点.计算机语言是从第二次世界大战以后,经历了戏剧性的发展过程.从机器语言到汇编语言和高级语言.C语言是与硬件 ...

随机推荐

  1. LeetCode题集-7 - 整数反转

    题目:给你一个 32 位的有符号整数 x ,返回将 x 中的数字部分反转后的结果.如果反转后整数超过 32 位的有符号整数的范围 [−231,  231 − 1] ,就返回 0. 假设环境不允许存储 ...

  2. openEuler欧拉设置git pull免密

    使用git config命令在本地全局设置用户名和邮箱 git config --global user.name "username":全局添加用户名 git config -- ...

  3. Esxi缩小硬盘大小的办法

    ​进虚拟机,把要缩减硬盘的那个系统,磁盘管理,收缩卷收缩了.然后关机. 本例:调整800G到350G. Esxi打开ssh,进去. cd /vmfs/volumes// datastorename,完 ...

  4. Qt/C++开发经验小技巧296-300

    使用QDir::setCurrent设置当前目录后,会影响程序中的所有相对目录的执行,导致可能的意外发生,一般相对目录都默认是可执行文件所在目录,所以如果程序中为了特殊处理临时调用了QDir::set ...

  5. Qt/C++编写onvif工具(搜索/云台/预置位/OSD/录像存储)

    一.前言 从最初编写这个工具开始的时间算起来,至少5年多,一直持续完善到今天,这个工具看起来小也不小大也不大,但是也是经历过无数个现场的洗礼,毫不夸张的说,市面上能够遇到的主流的厂商的设备,都测试过, ...

  6. Qt开发经验小技巧236-240

    关于在头文件中定义函数使用static关键字的血的教训. 有时候我们需要将一些常用函数写在一个文件中供很多地方调用,如果写的是 int doxxx{} 这种,在你多个地方引用的时候,肯定会编译报错提示 ...

  7. Qt音视频开发39-人脸识别在线版

    一.前言 关于人脸识别这块,前些年不要太火,哪怕是到了今天依然火的一塌糊涂,什么玩意都要跟人脸识别搭个边,这东西应该只是人工智能的一个很小的部分,人脸识别光从字面上理解就是识别出人脸区域,其实背后真正 ...

  8. 11.14javaweb学习

  9. 昔日移动端IM明星 “米聊” 即将停止服务

    2021年1月19日,小米旗下米聊宣布,将于2021年2月19日12点停止米聊的服务. 1.以下消息来自米聊官网   2.关于米聊 米聊是小米科技出品的一款免费即时通讯工具,推出时间为:2010年12 ...

  10. vs2017 iisexpress 绑定自定义域名

    1.项目根目录找到 项目/.vs/config/applicationhost.config 2.添加绑定域名 <site name="demo" id="2&qu ...