Hbase集群监控

Hbase Jmx监控

监控每个regionServer的总请求数,readRequestsCount,writeRequestCount,region分裂,region合并,Store

数据来源:

/jmx?qry=Hadoop:service=HBase,name=RegionServer,sub=Server

设计:

  • 1.定时调度Hbase Jmx去捞取数据,数据存放在Mysql,最新的一条数据存放到redis缓存中查(设置过期时间5分钟)并插入数据库中(定时每五分钟调度一次)
  • 2.每次获取Jmx数据后,从redis中获取5分钟前的数据,进行计算获取5分钟内的数据并保存到数据库中

查看详细图片:





Hbase对每张表的读写监控

数据来源:

通过Hbase Java Api

  • 连接HBASEorg.apache.hadoop.hbase.client.Connection connection
  • 然后获取org.apache.hadoop.hbase.client.Admin admin = connection.getAdmin();
  • 得到HBASE中的regionServer集合,
  • 获取每个regionServer中RegionsLoad();
  • 遍历RegionLoad获取每张表的Table Region

查看详细图片:





jmx常用监控指标

监控指标 范围 指标含义
OpenFileDescriptorCount Regionserver本机 当前机器打开文件数
FreePhysicalMemorySize Regionserver本机 空虚物理内存大小
AvailableProcessors Regionserver本机 可用cpu个数
Region前缀--storeCount 单个region Store个数
Region前缀--storeFileCount 单个region Storefile个数
Region前缀--memStoreSize 单个region Memstore大小
Region前缀--storeFileSize 单个region Storefile大小
Region前缀--compactionsCompletedCount 单个region 合并完成次数
Region前缀--numBytesCompactedCount 单个region 合并文件总大小
Region前缀-- numFilesCompactedCount 单个region 合并完成文件个数
totalRequestCount Regionserver 总请求数
readRequestCount Regionserver 读请求数
writeRequestCount Regionserver 写请求数
compactedCellsCount Regionserver 合并cell个数
majorCompactedCellsCount Regionserver 大合并cell个数
flushedCellsSize Regionserver flush到磁盘的大小
blockedRequestCount Regionserver 因memstore大于阈值而引发flush的次数
splitRequestCount Regionserver region分裂请求次数
splitSuccessCounnt Regionserver region分裂成功次数
slowGetCount Regionserver 请求完成时间超过1000ms的次数
numOpenConnections Regionserver 该regionserver打开的连接数
numActiveHandler Regionserver rpc handler数
receivedBytes Regionserver 收到数据量
sentBytes Regionserver 发出数据量
HeapMemoryUsage --->>>used Regionserver 堆内存使用量
SyncTime_mean Regionserver WAL写hdfs的平均时间
regionCount Regionserver Regionserver管理region数量
memStoreSize Regionserver Regionserver管理的总memstoresize
storeFileSize Regionserver 该Regionserver管理的storefile大小
staticIndexSize Regionserver 该regionserver所管理的表索引大小
storeFileCount Regionserver 该regionserver所管理的storefile个数
hlogFileSize Regionserver WAL文件大小
hlogFileCount Regionserver WAL文件个数
storeCount Regionserver 该regionserver所管理的store个数
Name: java.lang:type=MemoryPool,name=Par Eden Space CollectionUsage—>>used Regionserver Eden区使用空间大小
Name: java.lang:type=MemoryPool,name=CMS Old Gen Regionserver 老年代内存大小
Name: java.lang:type=MemoryPool,name=Par Survivor Space CollectionUsageà> used Regionserver Survivor内存大小
GcTimeMillis Regionserver GC总时间
GcTimeMillisParNew Regionserver ParNew GC时间
GcCount Regionserver GC总次数
GcCountConcurrentMarkSweep Regionserver ConcurrentMarkSweep总次数
GcTimeMillisConcurrentMarkSweep Regionserver ConcurrentMarkSweep GC时间
ThreadsBlocked Regionserver Block线程数
ThreadsWaiting Regionserver 等待线程数

原文链接:http://blogxinxiucan.sh1.newtouch.com/2017/08/10/Hbase集群监控/


公众号:it全能程序猿


Hbase集群监控的更多相关文章

  1. HBase 集群监控系统构建

    HBase 集群监控系统构建 标签(空格分隔): Hbase 一, 集群为什么需要监控系统 总的来说是为了保证系统的稳定性,可靠性,可运维性.具体来说我认为有以下几点: 掌控集群的核心性能指标,了解集 ...

  2. dfs.datanode.max.xcievers参数导致hbase集群报错

    2013/08/09 转发自http://bkeep.blog.163.com/blog/static/123414290201272644422987/ [案例]dfs.datanode.max.x ...

  3. Hadoop hbase集群断电数据块被破坏无法启动

    集群机器意外断电重启,导致hbase 无法正常启动,抛出reflect invocation异常,可能是正在执行的插入或合并等操作进行到一半时中断,导致部分数据文件不完整格式不正确或在hdfs上blo ...

  4. Kubernetes+Flannel 环境中部署HBase集群

    2015-12-14注:加入新节点不更改运行节点参数需求已满足,将在后续文章中陆续总结. 注:目前方案不满足加入新节点(master节点或regionserver节点)而不更改已运行节点的参数的需求, ...

  5. Zookeeper Monitor集群监控开发

    随着线上越来越多的系统依赖Zookeeper集群.以至于Zookeeper集群的执行状况越来越重要.可是眼下还没有什么好用的Zookeeper集群监控系统(淘宝开源了一个Zookeeper监控系统,可 ...

  6. 「从零单排HBase 10」HBase集群多租户实践

    在HBase1.1.0发布之前,HBase同一集群上的用户.表都是平等的,大家平等共用集群资源.容易碰到两个问题: 一是某些业务较其他业务重要,需要在资源有限的情况下优先保证核心重要业务的正常运行 二 ...

  7. 基于docker快速搭建hbase集群

    一.概述 HBase是一个分布式的.面向列的开源数据库,该技术来源于 Fay Chang 所撰写的Google论文"Bigtable:一个结构化数据的分布式存储系统".就像Bigt ...

  8. 使用 Ansible 快速部署 HBase 集群

    背景 出于数据安全的考虑,自研了一个低成本的时序数据存储系统,用于存储历史行情数据. 系统借鉴了 InfluxDB 的列存与压缩策略,并基于 HBase 实现了海量存储能力. 由于运维同事缺乏 Had ...

  9. hbase集群安装与部署

    1.相关环境 centos7 hadoop2.6.5 zookeeper3.4.9 jdk1.8 hbase1.2.4 本篇文章仅涉及hbase集群的搭建,关于hadoop与zookeeper的相关部 ...

随机推荐

  1. linux查询进程号,出现两个进程

    [root@ADM01B ~]# ps -ef|grep iesmgr root 5929 5321 0 09:38 pts/7 00:00:00 grep iesmgr root 9798 1 0 ...

  2. smarty获取变量的两种方式

    从上一篇随笔中,我们知道smarty可以通过assign()的方法注册变量,从而在前段读取变量:我们也可以从配置文件中获取变量,来具体看一下: 1.在configs文件夹中建一个test.conf文件 ...

  3. EntityFramework.Extended.Update.Ambiguous column name

    异常描述 c#代码 dbcontext.Table.Where(x => x.B > 0).Update( x => new Table() { A = x.B } )  抛出异常: ...

  4. InstallShield -6109

    背景:C#项目打包生成时一直提示生成失败,消息号-6109, 查找了好多资料均未能解决,有说ActiveX问题,有说注册表问题,作了相应修改依然未果:后来翻来翻去看到有关User32.dll引用时失败 ...

  5. 拥抱.NET Core系列:依赖注入(1)

    依赖注入时编程手段中解耦和封装的一个非常重要的手段,我本人已经到了没有DI无法编写项目的程度了,在.NET Framework中微软并没有在FCL中引入DI,虽然推出了"Unity" ...

  6. 我的学习之路_第二十七章_jQuery

    jQueryjs类库 把常用对象或者方法封装起来,让我们写代码效率更高 1.jQuery 2.extjs [jQuery入门] jQuery的引入: 通过script标签的src属性引入 入门: 获取 ...

  7. c# 中事务处理

    1.在c#中,使用以下语句,就可以不用再数据库中进行事务语句处理了. TransactionOptions transactionOption = new TransactionOptions() ; ...

  8. 利用fputcsv导出数据备份数据

    今天,分享一个利用fputcsv导出数据备份数据的方法,我也时看到些零零散散的代码,想着拼起来,所以我只提供些思路,以及简单的代码,至于怎么组合能够让它更强大,尽情去探索吧 讲之前先上一段获取数据库里 ...

  9. Chrome浏览器扩展开发系列之二:Google Chrome浏览器扩展的调试

    1)      查看扩展程序的详细信息和ID 通过Chrome 浏览器的“ 工具->更多工具->扩展程序”,打开chrome://extensions页面,选中右上角的“开发者模式”,可以 ...

  10. Ambari安装之部署 (Metrics Collector和 Metrics Monitor) Install Pending ...问题

    问题的由来 我这里,是因为,拿这个Ambari Metrics服务在做试验!所以先删除它,再添加它,出现了安装被挂起的问题.... Am bari里如何删除某指定的服务(图文详解) 问题详细描述如下: ...