Hbase集群监控

Hbase Jmx监控

监控每个regionServer的总请求数,readRequestsCount,writeRequestCount,region分裂,region合并,Store

数据来源:

/jmx?qry=Hadoop:service=HBase,name=RegionServer,sub=Server

设计:

  • 1.定时调度Hbase Jmx去捞取数据,数据存放在Mysql,最新的一条数据存放到redis缓存中查(设置过期时间5分钟)并插入数据库中(定时每五分钟调度一次)
  • 2.每次获取Jmx数据后,从redis中获取5分钟前的数据,进行计算获取5分钟内的数据并保存到数据库中

查看详细图片:





Hbase对每张表的读写监控

数据来源:

通过Hbase Java Api

  • 连接HBASEorg.apache.hadoop.hbase.client.Connection connection
  • 然后获取org.apache.hadoop.hbase.client.Admin admin = connection.getAdmin();
  • 得到HBASE中的regionServer集合,
  • 获取每个regionServer中RegionsLoad();
  • 遍历RegionLoad获取每张表的Table Region

查看详细图片:





jmx常用监控指标

监控指标 范围 指标含义
OpenFileDescriptorCount Regionserver本机 当前机器打开文件数
FreePhysicalMemorySize Regionserver本机 空虚物理内存大小
AvailableProcessors Regionserver本机 可用cpu个数
Region前缀--storeCount 单个region Store个数
Region前缀--storeFileCount 单个region Storefile个数
Region前缀--memStoreSize 单个region Memstore大小
Region前缀--storeFileSize 单个region Storefile大小
Region前缀--compactionsCompletedCount 单个region 合并完成次数
Region前缀--numBytesCompactedCount 单个region 合并文件总大小
Region前缀-- numFilesCompactedCount 单个region 合并完成文件个数
totalRequestCount Regionserver 总请求数
readRequestCount Regionserver 读请求数
writeRequestCount Regionserver 写请求数
compactedCellsCount Regionserver 合并cell个数
majorCompactedCellsCount Regionserver 大合并cell个数
flushedCellsSize Regionserver flush到磁盘的大小
blockedRequestCount Regionserver 因memstore大于阈值而引发flush的次数
splitRequestCount Regionserver region分裂请求次数
splitSuccessCounnt Regionserver region分裂成功次数
slowGetCount Regionserver 请求完成时间超过1000ms的次数
numOpenConnections Regionserver 该regionserver打开的连接数
numActiveHandler Regionserver rpc handler数
receivedBytes Regionserver 收到数据量
sentBytes Regionserver 发出数据量
HeapMemoryUsage --->>>used Regionserver 堆内存使用量
SyncTime_mean Regionserver WAL写hdfs的平均时间
regionCount Regionserver Regionserver管理region数量
memStoreSize Regionserver Regionserver管理的总memstoresize
storeFileSize Regionserver 该Regionserver管理的storefile大小
staticIndexSize Regionserver 该regionserver所管理的表索引大小
storeFileCount Regionserver 该regionserver所管理的storefile个数
hlogFileSize Regionserver WAL文件大小
hlogFileCount Regionserver WAL文件个数
storeCount Regionserver 该regionserver所管理的store个数
Name: java.lang:type=MemoryPool,name=Par Eden Space CollectionUsage—>>used Regionserver Eden区使用空间大小
Name: java.lang:type=MemoryPool,name=CMS Old Gen Regionserver 老年代内存大小
Name: java.lang:type=MemoryPool,name=Par Survivor Space CollectionUsageà> used Regionserver Survivor内存大小
GcTimeMillis Regionserver GC总时间
GcTimeMillisParNew Regionserver ParNew GC时间
GcCount Regionserver GC总次数
GcCountConcurrentMarkSweep Regionserver ConcurrentMarkSweep总次数
GcTimeMillisConcurrentMarkSweep Regionserver ConcurrentMarkSweep GC时间
ThreadsBlocked Regionserver Block线程数
ThreadsWaiting Regionserver 等待线程数

原文链接:http://blogxinxiucan.sh1.newtouch.com/2017/08/10/Hbase集群监控/


公众号:it全能程序猿


Hbase集群监控的更多相关文章

  1. HBase 集群监控系统构建

    HBase 集群监控系统构建 标签(空格分隔): Hbase 一, 集群为什么需要监控系统 总的来说是为了保证系统的稳定性,可靠性,可运维性.具体来说我认为有以下几点: 掌控集群的核心性能指标,了解集 ...

  2. dfs.datanode.max.xcievers参数导致hbase集群报错

    2013/08/09 转发自http://bkeep.blog.163.com/blog/static/123414290201272644422987/ [案例]dfs.datanode.max.x ...

  3. Hadoop hbase集群断电数据块被破坏无法启动

    集群机器意外断电重启,导致hbase 无法正常启动,抛出reflect invocation异常,可能是正在执行的插入或合并等操作进行到一半时中断,导致部分数据文件不完整格式不正确或在hdfs上blo ...

  4. Kubernetes+Flannel 环境中部署HBase集群

    2015-12-14注:加入新节点不更改运行节点参数需求已满足,将在后续文章中陆续总结. 注:目前方案不满足加入新节点(master节点或regionserver节点)而不更改已运行节点的参数的需求, ...

  5. Zookeeper Monitor集群监控开发

    随着线上越来越多的系统依赖Zookeeper集群.以至于Zookeeper集群的执行状况越来越重要.可是眼下还没有什么好用的Zookeeper集群监控系统(淘宝开源了一个Zookeeper监控系统,可 ...

  6. 「从零单排HBase 10」HBase集群多租户实践

    在HBase1.1.0发布之前,HBase同一集群上的用户.表都是平等的,大家平等共用集群资源.容易碰到两个问题: 一是某些业务较其他业务重要,需要在资源有限的情况下优先保证核心重要业务的正常运行 二 ...

  7. 基于docker快速搭建hbase集群

    一.概述 HBase是一个分布式的.面向列的开源数据库,该技术来源于 Fay Chang 所撰写的Google论文"Bigtable:一个结构化数据的分布式存储系统".就像Bigt ...

  8. 使用 Ansible 快速部署 HBase 集群

    背景 出于数据安全的考虑,自研了一个低成本的时序数据存储系统,用于存储历史行情数据. 系统借鉴了 InfluxDB 的列存与压缩策略,并基于 HBase 实现了海量存储能力. 由于运维同事缺乏 Had ...

  9. hbase集群安装与部署

    1.相关环境 centos7 hadoop2.6.5 zookeeper3.4.9 jdk1.8 hbase1.2.4 本篇文章仅涉及hbase集群的搭建,关于hadoop与zookeeper的相关部 ...

随机推荐

  1. Angular4 后台管理系统搭建(2) - flexgrid 单元格模板 wjFlexGridCellTemplate 的坑

    这几天中了很多坑,尤其是两个大坑.先是运行环境的坑,在是flexgrid单元格内部模板的坑.这里记录下. 一开始我遇见一些很奇怪的问题,按网上的说法,别人这么写代码都正常,就在我机器上不正常.按以前的 ...

  2. 【WPF】在新线程上打开窗口

    当WPF应用程序运行时,默认会创建一个UI主线程(因为至少需要一个),并在该UI线程上启动消息循环.直到消息循环结束,应用程序就随即退出.那么,问题就来了,能不能创建新线程,然后在新线程上打开一个新窗 ...

  3. Java学习笔记之集合

    集合(Collection)(掌握) (1)集合的由来? 我们学习的是Java -- 面向对象 -- 操作很多对象 -- 存储 -- 容器(数组和StringBuffer) -- 数组而数组的长度固定 ...

  4. Java通过Axis2发布WebService

    参考文档: http://blog.csdn.net/ghsau/article/details/12714965 http://www.iteye.com/topic/1135747 http:// ...

  5. Educational Codeforces Round 21 A-E题题解

    A题      ............太水就不说了,贴下代码 #include<string> #include<iostream> #include<cstring& ...

  6. ORM的概念, ORM到底是什么

    一.ORM简介         对象关系映射(Object Relational Mapping,简称ORM)模式是一种为了解决面向对象与关系数据库存在的互不匹配的现象的技术.简单的说,ORM是通过使 ...

  7. Iterator对对象遍历

    //实例对象tables List<Table> tables = new TableManager(getApplicationContext()).queryTables();  sp ...

  8. JavaScript+svg绘制的一个饼状图

    结果: svg参考:https://www.w3.org/TR/SVG/<body onload='document.body.appendChild( pieChart([12,23,34,4 ...

  9. 8位基本定时器(TIM4)

    简介:该定时器由一个带可编程预分频器的8位自动重载的向上计数器所组成,它可以用来作为时基发生器,具有溢出中断功能. 主要功能: (1)8位向上计数的自动重载计数器: (2)3位可编程的预分配器(可在运 ...

  10. 分享网上搜到的Oracle中对判定条件where 1=1的正解

    今天在网上找到了Oracle中对判定条件where 1=1的正解,粘贴出来和大家分享下 1=1 是永恒成立的,意思无条件的,也就是说在SQL语句里有没有这个1=1都可以. 这个1=1常用于应用程序根据 ...