HBase 查询导致RegionServer OOM故障复盘

背景：我司作为某运营商公司的技术咨询公司，发现有第三方开发公司在使用HBase 1.1.2 （HDP 2.4.2.258版本）一段时间使用正常后，从某一天开始报OOM，从而导致RegionServer宕机。

故障排查步骤

查看 regionserver的log和stdout。由于是突然宕机，log没有任何error信息，stdout 因为自动拉起以及默认启动脚本是重定向覆盖，所以被洗掉了；而oom dump当时还没开启，无任何明显提示信息。
regionserver的log中尽管没有发现error信息，但发现了许多warning，BucketCache: Failed allocation for ${block_id}，org.apache.hadoop.hbase.io.hfile.bucket.BucketAllocatorException: Allocation too big size=21342038。这虽然不是错误，但其实是个很有用的提示信息，说明可能存在着有许多大的block，无法写入bucketcache读缓存中。
尝试重新拉起regionserver，但由于业务方疏忽，他们表示已停了所有程序，但却依然没完全停止读取hbase程序，因此反复拉起regionserver失败，此时可看到日志 java.lang.OutOfMemoryError: Requested array size exceeds VM limit。
根据stacktrace进去读源码，发现是在做rpc fetch data的时候，ByteBufferOutputStream对象时用一个数组cache数据，bytes超过capacity上限后会把当前的capacity乘以2，new一个新的byte数组，把旧的数组内容copy到新的去。这种底层的类似c的写法可以减少对象和随机读内存的开销。但是源码很蠢，分配的上限是Integer.MAX_VALUE，而众所周知，Oracle/OpenJDK 7的数组只允许开到 Integer.MAX_VALUE - 2 ，因为用户一个查询过大，即使内存和网络足够好也会OOM导致RegionServer宕机，这明显是个bug。[HBase 14978] [HBase 14946] 从issue看应该是在1.2.0以后加了对multi的限制，尝试从服务前端避免这种问题发生，但本人尚未仔细阅读1.2.0的源码去确认是否真的修复。
由于业务方不知是对自己的数据不熟悉还是其他原因，一直不承认有大数据，于是我们通过反复实验定位找回了查询挂的语句，开了oom dump 获取了宕机前的内存快照。通过对ByteBuffer对象的分析和反二进制化，发现了挂机时其内存吃到了1g，按照capacity翻倍，再翻倍就是2g超出了数组上限，完全符合错误栈信息。
从快照里获取了一个看起来比较大的rowkey，get出来整个row有38m。而后我们又写了个scan程序对全表scan并统计size，发现整体几百k以上的数据也不少，还有少部分是10m以上的。在他们的20000/batch 的multi-get的场景，基本很容易挂。拿出数据与业务方对峙后，业务方承认数据可能是存在脏数据，他们之前实际遇到过类似问题。在写入时报了 keyvalue size too large 的问题，但他们毫不在意，把配置的size改成了512m就写入算了。

至此，故障已被成功排查。对于咨询团队来说，主要的任务已经完成了。

附：OOM错误完整 stacktrace

FATAL [IndexRpcServer.handler=5,queue=0,port=60020J regionserver.HRegionServer： Run out of memory； HRegionServer will abort itself immediately

java.lang.OutOfMemoryError： Requested array size exceeds VM limit

    at  java.nio.HeapByteBuffer.<init>(HeapByteBuffer.java:57)

    at  java.nio.ByteBuffer.allocate(ByteBuffer.java：331)

    at org.apache.hadoop.hbase.io.ByteBufferOutputStream.checkSizeAnd6row(ByteBufferOutputStream.java：74)

    at org.apache.hadoop.hbase.io.ByteBufferOutputStream.write(ByteBufferOutputStream.java：112) at org.apache.hadoop.hbase.KeyValue.oswrite{KeyVdlue.java：2881)

    at org.apache.hadoop.hbase.codec.KeyValueCodec^KeyVdlueEncoder.writetKeyVdlueCodec.java：60)

    at  org.apache.hadoop.hbase.ipc.IPCUtil.buildCeilBlock(IPCUti1.java：120)    at org.apache.hadoop.hbase.ipc.RpcServer$Call.setResponse(RpcServer.java：384)

    at org.apache.hadoop.hbase.ipc.CallRunner.run(CallRunner.java：128)

    at org.apache.hadoop.hbase.ipc.RpcExecutor.consumerLoop(RpcExecutor.java：112)

    at org.apache.hadoop.hbase.ipc.RpcExecutor$l.run(RpcExecutor.java：92)

    at java.lang.Th read.run(Th read.java:745)

Best Practice

避免此类问题，须注意如下HBase使用技巧：

负责入库的需做好数据限制，谨慎修改 keyvalue max size 限制，脏数据或不重要的数据可适当裁剪或丢弃，实在较大的数据考虑存hdfs，hbase存路径去指向文件。
读取时需大致估算平均每行数据大小，并适当留出冗余的内存，来决定一个multi get的batch大小。不需要的列字段就尽量不要读，避免oom也可以节省性能。
column family和qualifier尽可能短而精确，因为每一个keyvalue都会存qualifier。
如无必要，表的字段尽量不太太多。
动态qualifier慎用，除非你对你自己的数据有足够清楚的上限了解。
（其他）索引表和数据表尽量分离，不然scan会带来额外不必要的开销。

HBase 查询导致RegionServer OOM故障复盘的更多相关文章

公司内部一次关于OOM故障复盘分享
最近笔者有点忙,这次OOM事故发生过去两周前,记得笔者那天正带着家人在外地玩,正中午跟友人吃饭的时候,钉钉连续告警爆表,接着就是钉钉电话(显示广东抬头)一看就知道BBQ了,又一次故障发生了,今天把那次 ...
执行SQL查询导致磁盘耗尽故障演示
a fellow in IMG wechat group 2 met an error about running out of disk space when using MySQL ...
《MySQL》一次MySQL慢查询导致的故障
本文转载自 http://www.jb51.net/article/70955.htm 我们知道分析MySQL语句查询性能的方法除了使用EXPLAIN 输出执行计划,还可以让MySQL记录下查询超过指 ...
一次bug死磕经历之Hbase堆内存小导致regionserver频繁挂掉
环境如下: Centos6.5 Apache Hadoop2.7.1 Apache Hbase0.98.12 Apache Zookeeper3.4.6 JDK1.7 Ant1.9.5 Maven3. ...
HBASE 优化之REGIONSERVER
HBASE 优化之REGIONSERVER 一,概述本人在使用优化regionserver的过程有些心得,借此随笔的机会,向大家介绍我的心得,有些是网上拿来的有些是自己在使用过程自己的经验,希望对大 ...
一次线上OOM故障排查经过
转贴:http://my.oschina.net/flashsword/blog/205266 本文是一次线上OOM故障排查的经过,内容比较基础但是真实,主要是记录一下,没有OOM排查经验的同学也可以 ...
hbase查询基于标准sql规范中间件Phoenix
Phoenix是个很好的hbase 查询工具,在hbase中安装也很简单,可以按照 http://www.cnblogs.com/laov/p/4137136.html 这个连接中进行配置客户端和服务 ...
关于运维之故障复盘篇-Case Study
关于故障的事后复盘,英文名 Case Study是非常有必要做的,当然是根据故障的级别,不可能做到每个故障都Case Study,除非人员和时间充足: 文档能力也是能力的一种,一般工程师的文档能力比较 ...
Android中解决图像解码导致的OOM问题
Android中解决图像解码导致的OOM问题原文链接:http://blog.csdn.net/zjl5211314/article/details/7042017

随机推荐

F. 数学上来先打表
题解: 搞这题搞了一天思维不是很难就是暴力压位bitset 分块做法速度更快但是stl里的不能实现这个功能所以手动实现 64位压一位到65535跑一下1的个数然后(x>>16) ...
Ubuntu下使用Evernote
Ubuntu下安装使用Evernote http://blog.csdn.net/yangzhuoluo/article/details/8118996 http://blog.csdn.net/ya ...
C# 之向服务器上传资源
首先写客服端,winform 应用或者 WPF 应用模拟一个post提交: /// <summary> /// 将本地文件上传到指定的服务器(HttpWebRequest方法) /// ...
ORM框架之------Dapper，Net下无敌的ORM
一,介绍:Dapper是一款轻量级ORM工具.如果你在小的项目中,使用Entity Framework.NHibernate 来处理大数据访问及关系映射,未免有点杀鸡用牛刀.你又觉得ORM省时省力,这 ...
python全栈开发day51-jquery插件、@media媒体查询、移动端单位、Bootstrap框架
一.昨日内容回顾技术行业 (1)ajax技术 XMLHttpRequest() <1>创建XMLHttpRequest()对象 <2>检测状态(通过readyState的改变 ...
Kudu-压缩
随着时间的推移,tablet会积累许多DiskRowSets,并且会在行更新时累积很多增量重做(REDO)文件.当插入一个关键字时,为了强制执行主关键字唯一性,Kudu会针对RowSets查询一组布隆 ...
Thinkphp3.1 php 链接SqlServer
ThinkPHP链接 M("lk_employeeInfo","Null/表前缀","sqlsrv://账号:密码@服务器:端口/数据库") ...
学习Spring必须了解的基础知识——回调机制
上面这张图如果能看得懂就能理解什么是回调机制: A对象在调用a()方法时会调用B对象的b()方法,b()方法必须能调用A对象的callback()方法. 谁白了:a()方法有B对象b()方法的引用,b ...
SPOJ RPLN (模板题)(ST算法)【RMQ】
<题目链接> 题目大意:给你一段序列,进行q次区间查询,每次都输出询问区间内的最小值. 解题分析: RMQ模板题,下面用在线算法——ST算法求解.不懂ST算法的可以看这篇博客 >& ...
POJ 2352 Stars【树状数组】
<题目链接> 题目大意: 题目给出n个点,这些点按照y坐标的升序,若y相同,则按照x的升序顺序输入,问,在这些点中,左下角的点的数量分别在0~n-1的点分别有多少个,写出它们的对应点数. ...

HBase 查询导致RegionServer OOM故障复盘

故障排查步骤

附：OOM错误完整 stacktrace

相关原理简要分析

bucketcache

Best Practice

HBase 查询导致RegionServer OOM故障复盘的更多相关文章

随机推荐

热门专题