概述

上一篇文章分析了cloudera manager中监控数据、中心数据的存储方式,如何配置外部表等。这一篇文章进一步分析监控数据的存储,配置,调优等。

Service Monitor 和 Host Monitor 角色在cloudera
manager中存储了时间序列、健康数据、Impla查询和Yarn应用的元数据。经过查看对应的Cloudera Manager的存储连接,发现Service
Monitor和Host Monitor的存储使用的是levelDB的解析类,由此能够判断出本地存储使用的是levelDB。LevelDB能够说是key-value的数据库的鼻祖。读写效率特别高,并发也非常大。而Cloudera
Manager的监控的读写数据特别多、频繁。这也可能是Cloudera Manager5选择使用levelDB替换关系数据库的原因。

监控数据在Cloudera Manager升级中的迁移

Cloudera Manager 5 存储Host Monitor 和 Service
Monitor数据到本地数据库。假设使用自己主动化升级配置从Cloudera Manager 4 升级到 5。数据会从Cloudera manager 4 中的内嵌数据库或者外部数据库中自己主动迁移到Cloudera
Manger5中的本地数据库中。

这是一个自己主动化运行的过程中,中间能够查看迁移过程的日志等。

Service Monitor 数据存储的配置

Service Monitor存储了时间序列和健康数据。Impla查询的元数据,Yarn应用的元数据。默认情况下,数据时存储在/var/lib/cloudera-service-monitor/文件夹下,你也能够改动Service
Monitor Storage Directory 配置firehose.storage.base.directory。

You can control how much disk space to reserve for the different classes of data the Service Monitor stores by changing the following
configuration options:

Time-series metrics and health data - Time-Series Storage (firehose_time_series_storage_bytes - 10 GB default)

Impala query metadata - Impala Storage (firehose_impala_storage_bytes - 1 GB default)

YARN application metadata - YARN Storage (firehose_yarn_storage_bytes - 1 GB default)

Host Monitor 数据存储的配置

Host Monitor存储了时间序列和健康数据。默认情况下,数据存储在/var/lib/cloudera-host-monitor/文件夹下。你也能够改动Host
Monitor Storage Directory 配置。

You can control how much disk space to reserve for Host Monitor data by changing the following configuration option:

Time-series metrics and health data: Time Series Storage (firehose_time_series_storage_bytes - 10 GB default)

数据粒度和时间序列指标数据

Service Monitor 和 Host Monitor使用非常多方式存储时间序列指标数据。数据会不断的被汇总成不同的粒度。比方每个小时,会把数据的平均值,最小值。最大值汇总成一个小时为粒度的数据,每6个小时。会汇总成6个小时的数据。每天、每个星期等。这样的方式仅仅会汇总指标数据。Impla的查询和Yarn应用的监控数据当接近限制时,会删除旧的数据。

当存储快达到限制时。会先删除粒度最细的数据。保证存储空间的释放。比方会先删除小时为粒度的数据,其次是以天微粒度的数据。

Moving
Monitoring Data on an Active Cluster

Host
Monitor and Service Monitor Memory Configuration

原创文章,欢迎转载。转载请标明出处  http://blog.csdn.net/shifenglov/article/details/41281399

版权声明:本文博客原创文章,博客,未经同意,不得转载。

CDH秘籍(两):cloudera Manager存储监控数据的更多相关文章

  1. CDH 2、Cloudera Manager的安装

    1.Cloudera Manager • Cloudera Manager是一个管理CDH的端到端的应用. • 作用: – 管理 – 监控 – 诊断 – 集成 • 架构 • Server – 管理控制 ...

  2. 小记--------CDH版本启动cloudera manager UI界面

    首先需要启动mysql源数据库 server所在服务器的路径:/opt/cm-5.14.0/etc/cloudera-scm-server 下 查看配置文件: db.properties   查看my ...

  3. CDH构建大数据平台-使用自建的镜像地址安装Cloudera Manager

    CDH构建大数据平台-使用自建的镜像地址安装Cloudera Manager 作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任.   一.搭建CM私有仓库 详情请参考我的笔记: http ...

  4. Cloudera Manager及CDH最新版本安装全程记录

    大家都知道,Apache Hadoop的配置很繁琐,而且很零散,为此Cloudera公司提供了Clouder Manager工具,而且还封装了Apache Hadoop,flume,spark,hiv ...

  5. cloudera manager 及CDH卸载

    记录用户数据路径 删除用户数据 中列出的用户数据路径 /var/lib/flume-ng /var/lib/hadoop* /var/lib/hue /var/lib/navigator /var/l ...

  6. Cloudera Manager和CDH版本的对应关系

    来源:https://www.cloudera.com/documentation/enterprise/release-notes/topics/rn_consolidated_pcm.html#c ...

  7. 卸载 Cloudera Manager 5.1.x.和 相关软件【官网翻译】

    问题导读: 1.不同的安装方式,卸载方法存在什么区别?2.不同的操作系统,卸载 Cloudera Manager Server and 数据库有什么区别? 重新安装不完整如果你来到这里,因为你的安装没 ...

  8. 安装cloudermanager时如何正确Configuring TLS Security for Cloudera Manager

    不多说,直接上干货! 参考官网 https://www.cloudera.com/documentation/enterprise/5-2-x/topics/cm_sg_config_tls_secu ...

  9. 大数据 -- Cloudera Manager(简称CM)+CDH构建大数据平台

    一.Cloudera Manager介绍 Cloudera Manager(简称CM)是Cloudera公司开发的一款大数据集群安装部署利器,这款利器具有集群自动化安装.中心化管理.集群监控.报警等功 ...

随机推荐

  1. BZOJ 1109 POI2007 堆积木Klo LIS

    题目大意:给定一个序列,能够多次将某个位置的数删掉并将后面全部数向左串一位,要求操作后a[i]=i的数最多 首先我们如果最后a[i]=i的数的序列为S 那么S满足随着i递增,a[i]递增(相对位置不变 ...

  2. boost事件处理

    尽管这个库的名字乍一看好象有点误导,但实际上并不是如此. Boost.Signals 所实现的模式被命名为 '信号至插槽' (signal to slot).它基于下面概念:当相应的信号被发出时.相关 ...

  3. UML 之 序列图和协作图

    序列图(Sequence Diagram)     亦称为时序图或循序图,是一种UML行为图.它通过描写叙述对象之间发送消息的时间顺序显示多个对象之间的动态协作.它能够表示用例的行为顺序,当运行一个用 ...

  4. [状压dp] hdu 4064 Carcassonne

    题目链接: http://acm.hdu.edu.cn/showproblem.php?pid=4064 Carcassonne Time Limit: 3000/1000 MS (Java/Othe ...

  5. Eclipse+Maven创建webapp项目<一> (转)

    Eclipse+Maven创建webapp项目<一> 1.开启eclipse,右键new——>other,如下图找到maven project 2.选择maven project,显 ...

  6. ubuntu下安装wine

    直接在终端里面输入“sudo apt-get install wine”不要引号,即可安装wine.至于使用它,终端命令就是“wine ....”举个例子,你现在要运行魔兽, 然后你的魔兽的文件夹的位 ...

  7. Java二叉排序树(转)

    一.二叉排序树定义 1.二叉排序树的定义 二叉排序树(Binary Sort Tree)又称二叉查找(搜索)树(Binary Search Tree).其定义为:二叉排序树或者是空树,或者是满足如下性 ...

  8. CSS: 解决Div float后,父Div无法高度自适应的问题

    在用CSS+DIV的布局中,常常会发现,当一个DIV float之后,假设他的高度超过了其父DIV的高度时,其父DIV的高度并不会对应的进行调整.要解决问题(也叫做闭合(清除)浮动),我们有四种办法: ...

  9. JS 查找遍历子节点元素

    function nextChildNode(node,clazz,tagName){ var count= node.childElementCount; for(var i=0;i<coun ...

  10. HDU 4508 沼泽湿地系列故事——记住减肥I (2013腾讯编程马拉松预赛第一)

    pid=4508">http://acm.hdu.edu.cn/showproblem.php?pid=4508 题目大意: 给定一些数据. 每组数据以一个整数n開始,表示每天的食物清 ...