Hbase集群监控
Hbase集群监控
Hbase Jmx监控
监控每个regionServer的总请求数,readRequestsCount,writeRequestCount,region分裂,region合并,Store
数据来源:
/jmx?qry=Hadoop:service=HBase,name=RegionServer,sub=Server
设计:
- 1.定时调度Hbase Jmx去捞取数据,数据存放在Mysql,最新的一条数据存放到redis缓存中查(设置过期时间5分钟)并插入数据库中(定时每五分钟调度一次)
- 2.每次获取Jmx数据后,从redis中获取5分钟前的数据,进行计算获取5分钟内的数据并保存到数据库中
查看详细图片:




Hbase对每张表的读写监控
数据来源:
通过Hbase Java Api
- 连接HBASE
org.apache.hadoop.hbase.client.Connection connection - 然后获取org.apache.hadoop.hbase.client.Admin admin = connection.getAdmin();
- 得到HBASE中的regionServer集合,
- 获取每个regionServer中RegionsLoad();
- 遍历RegionLoad获取每张表的Table Region
查看详细图片:




jmx常用监控指标
| 监控指标 | 范围 | 指标含义 |
|---|---|---|
| OpenFileDescriptorCount | Regionserver本机 | 当前机器打开文件数 |
| FreePhysicalMemorySize | Regionserver本机 | 空虚物理内存大小 |
| AvailableProcessors | Regionserver本机 | 可用cpu个数 |
| Region前缀--storeCount | 单个region | Store个数 |
| Region前缀--storeFileCount | 单个region | Storefile个数 |
| Region前缀--memStoreSize | 单个region | Memstore大小 |
| Region前缀--storeFileSize | 单个region | Storefile大小 |
| Region前缀--compactionsCompletedCount | 单个region | 合并完成次数 |
| Region前缀--numBytesCompactedCount | 单个region | 合并文件总大小 |
| Region前缀-- numFilesCompactedCount | 单个region | 合并完成文件个数 |
| totalRequestCount | Regionserver | 总请求数 |
| readRequestCount | Regionserver | 读请求数 |
| writeRequestCount | Regionserver | 写请求数 |
| compactedCellsCount | Regionserver | 合并cell个数 |
| majorCompactedCellsCount | Regionserver | 大合并cell个数 |
| flushedCellsSize | Regionserver | flush到磁盘的大小 |
| blockedRequestCount | Regionserver | 因memstore大于阈值而引发flush的次数 |
| splitRequestCount | Regionserver | region分裂请求次数 |
| splitSuccessCounnt | Regionserver | region分裂成功次数 |
| slowGetCount | Regionserver | 请求完成时间超过1000ms的次数 |
| numOpenConnections | Regionserver | 该regionserver打开的连接数 |
| numActiveHandler | Regionserver | rpc handler数 |
| receivedBytes | Regionserver | 收到数据量 |
| sentBytes | Regionserver | 发出数据量 |
| HeapMemoryUsage --->>>used | Regionserver | 堆内存使用量 |
| SyncTime_mean | Regionserver | WAL写hdfs的平均时间 |
| regionCount | Regionserver | Regionserver管理region数量 |
| memStoreSize | Regionserver | Regionserver管理的总memstoresize |
| storeFileSize | Regionserver | 该Regionserver管理的storefile大小 |
| staticIndexSize | Regionserver | 该regionserver所管理的表索引大小 |
| storeFileCount | Regionserver | 该regionserver所管理的storefile个数 |
| hlogFileSize | Regionserver | WAL文件大小 |
| hlogFileCount | Regionserver | WAL文件个数 |
| storeCount | Regionserver | 该regionserver所管理的store个数 |
| Name: java.lang:type=MemoryPool,name=Par Eden Space CollectionUsage—>>used | Regionserver | Eden区使用空间大小 |
| Name: java.lang:type=MemoryPool,name=CMS Old Gen | Regionserver | 老年代内存大小 |
| Name: java.lang:type=MemoryPool,name=Par Survivor Space CollectionUsageà> used | Regionserver | Survivor内存大小 |
| GcTimeMillis | Regionserver | GC总时间 |
| GcTimeMillisParNew | Regionserver | ParNew GC时间 |
| GcCount | Regionserver | GC总次数 |
| GcCountConcurrentMarkSweep | Regionserver | ConcurrentMarkSweep总次数 |
| GcTimeMillisConcurrentMarkSweep | Regionserver | ConcurrentMarkSweep GC时间 |
| ThreadsBlocked | Regionserver | Block线程数 |
| ThreadsWaiting | Regionserver | 等待线程数 |
原文链接:http://blogxinxiucan.sh1.newtouch.com/2017/08/10/Hbase集群监控/
公众号:it全能程序猿

Hbase集群监控的更多相关文章
- HBase 集群监控系统构建
HBase 集群监控系统构建 标签(空格分隔): Hbase 一, 集群为什么需要监控系统 总的来说是为了保证系统的稳定性,可靠性,可运维性.具体来说我认为有以下几点: 掌控集群的核心性能指标,了解集 ...
- dfs.datanode.max.xcievers参数导致hbase集群报错
2013/08/09 转发自http://bkeep.blog.163.com/blog/static/123414290201272644422987/ [案例]dfs.datanode.max.x ...
- Hadoop hbase集群断电数据块被破坏无法启动
集群机器意外断电重启,导致hbase 无法正常启动,抛出reflect invocation异常,可能是正在执行的插入或合并等操作进行到一半时中断,导致部分数据文件不完整格式不正确或在hdfs上blo ...
- Kubernetes+Flannel 环境中部署HBase集群
2015-12-14注:加入新节点不更改运行节点参数需求已满足,将在后续文章中陆续总结. 注:目前方案不满足加入新节点(master节点或regionserver节点)而不更改已运行节点的参数的需求, ...
- Zookeeper Monitor集群监控开发
随着线上越来越多的系统依赖Zookeeper集群.以至于Zookeeper集群的执行状况越来越重要.可是眼下还没有什么好用的Zookeeper集群监控系统(淘宝开源了一个Zookeeper监控系统,可 ...
- 「从零单排HBase 10」HBase集群多租户实践
在HBase1.1.0发布之前,HBase同一集群上的用户.表都是平等的,大家平等共用集群资源.容易碰到两个问题: 一是某些业务较其他业务重要,需要在资源有限的情况下优先保证核心重要业务的正常运行 二 ...
- 基于docker快速搭建hbase集群
一.概述 HBase是一个分布式的.面向列的开源数据库,该技术来源于 Fay Chang 所撰写的Google论文"Bigtable:一个结构化数据的分布式存储系统".就像Bigt ...
- 使用 Ansible 快速部署 HBase 集群
背景 出于数据安全的考虑,自研了一个低成本的时序数据存储系统,用于存储历史行情数据. 系统借鉴了 InfluxDB 的列存与压缩策略,并基于 HBase 实现了海量存储能力. 由于运维同事缺乏 Had ...
- hbase集群安装与部署
1.相关环境 centos7 hadoop2.6.5 zookeeper3.4.9 jdk1.8 hbase1.2.4 本篇文章仅涉及hbase集群的搭建,关于hadoop与zookeeper的相关部 ...
随机推荐
- php产生随机字符串
/** * 产生随机字符串 * * @param int $length 输出长度 * @param string $chars 可选的 ,默认为 0123456789 * @return strin ...
- VMware中Linux系统时间与主机同步以及时区设置
网络上有各种资料,但最简单的一种方法就是修改虚拟机的配置文件 *.vmx .修改 tools.syncTime = "FALSE" 为 tools.syncTime = " ...
- jquery滚动条事件
<!DOCTYPE HTML> <html lang="en-US"> <head> <meta charset="UTF-8& ...
- JAX-RS REST 服务结果的自动封装
如转发请注明: 原文luyiisme博客 当使用遵循 JAX-RS 标准的框架开发REST 服务时,我们倾向于定义个(含有JAX-RS)注解接口. 服务器端负责实现该接口,而客户端是该接口的代理进行远 ...
- Gradle学习笔记之Groovy
[TOC] Gradle 的核心功能是由Java实现. 在这些功能之上, 有一个使用动态编程语言Groovy编写的领域特定语言(DSL). Gradle的构建脚本build.gradle和settin ...
- python实现希尔排序(已编程实现)
希尔排序: 观察一下”插入排序“:其实不难发现她有个缺点: 如果当数据是”5, 4, 3, 2, 1“的时候,此时我们将“无序块”中的记录插入到“有序块”时,估计俺们要崩盘, 每次插入都要移动位置,此 ...
- Java程序设计模式系列之适配器模式
理解适配器设计模式需要从生活中的场景进行联系,在生活当中有那些东西能够称为适配器呢?从字面上理解,"适配"的意思就是让一个东西和另一个东西配对,能够让他们一起工作,比如大家用的笔记 ...
- Go学习笔记(一)Let's 干吧
加 Golang学习 QQ群共同学习进步成家立业 ^-^ 群号:96933959 简介 Go是Google开发的一种 静态强类型.编译型,并发型,并具有垃圾回收功能的编程语言.为了方便搜索和识 ...
- Linux 学习记录 四(Bash 和 Shell scirpt)
一.什么是 Shell? 狭义的shell指的是指令列方面的软件,包括基本的Linux操作窗口Bash等,广义的shell则包括 图形接口的软件,因为图形接口其实也可以操作各种驱动程序来呼叫核心进行工 ...
- (cljs/run-at (JSVM. :all) "Metadata就这样哦")
前言 动态类型语言,少了静态类型语言必须声明变量类型的累赘,但也缺失了编译时类型检查和编译时优化的好处.cljs虽然作为动态类型语言,但其提供Metadata让我们在必要的时候可选择地补充类型提示, ...