hbase最近的一些实践

有一段实践没有写东西了，最近组里面来了两个新的小伙伴，并且一起针对目前的hbase集群做了一些运维和优化实践，比较零散，记录下来供以后以及和大家参考。

1，hbase regionserver宕机导致集群状态不一致问题处理和原因调研

问题：region server因oom被kill后，通过hack检查，发现集群中某些表出现不一致，不一致信息如下：

Region XXX not in Meta, but deployed on XXXX。

诊断：正常情况下regionserver宕机系统不应该出现状态不一致，查看不一致region对应的hdfs目录，发现对应region的目录大小为空，也就说对应region不在meta表中，但是在某台机器上deploy了，而且没有数据。怀疑是master中内存中保存的region状态和其他表不一致，导致在regionserver宕机时，region转移到其他机器的时候，使用了脏的master内存信息。重启master以后，删除对应的hdfs目录。问题得以修复。

2，jruby脚本运维hbase

问题：业务线将日志明细塞入hbase，以便查询最近系统状态的详情，在hbase中该表设置一个TTL，但是写入量巨大。hbase在做major compaction的时候会将过期的数据删除，但是自动split的region信息去没有自动删除。

诊断：通过写jruby脚本，类似在hbase shell中调用merge_region函数来定时合并region。脚本部分代码如下：

require 'java'

require 'date'

import org.apache.hadoop.hbase.HBaseConfiguration

import org.apache.hadoop.hbase.client.HBaseAdmin

config = HBaseConfiguration.create

admin = HBaseAdmin.new config

regionsInfo = admin.getTableRegions(‘xxxx'.to_java_bytes)

preRegionInfo = nil

sixDaysAgo = (Date.today - 6).strftime("%Y%m%d").to_s

#puts sixDaysAgo

maxMergeNum = 200

mergedNum = 0

grap = 3

for regionInfo in regionsInfo:

    #puts regionInfo

    curStartKey = java.lang.String.new(regionInfo.getStartKey())

    curEndKey = java.lang.String.new(regionInfo.getEndKey())

    # puts curEndKey

    if not curEndKey.equals("") and not curStartKey.equals("")

        # not the last regionInfo

        regionEndTime = curEndKey.split("_")[2].to_java

        regionStartTime = curStartKey.split("_")[2].to_java

        if regionStartTime.compareTo(sixDaysAgo) < 0 and regionEndTime.compareTo(sixDaysAgo) < 0 and grap > 2:

            preRegionEncodeName = preRegionInfo.getEncodedName()

            curRegionEncodeName = regionInfo.getEncodedName()

            puts preRegionEncodeName

            puts curRegionEncodeName, java.lang.String.new(regionInfo.getStartKey()), java.lang.String.new(regionInfo.getEndKey())

            puts "******************"

            mergedNum = mergedNum + 1

            admin.mergeRegions(preRegionEncodeName.to_java_bytes, curRegionEncodeName.to_java_bytes, false)

            grap = 0

            sleep 10

        end

    end

    grap = grap + 1

    preRegionInfo = regionInfo

    #if java.lang.String.new(regionInfo.getStartKey()).equals("")

    #    preRegionInfo = regionInfo

    #end

    #break

    if mergedNum >= maxMergeNum

        break

    end

end

3，是用jsp动态获取集群信息以及操控

可以利用jps页面直接获取master或者regionserver实时信息，具体操作如下：

a, copy zk.jsp文件到hbase-webapps/master, 保存文件为xx.jsp

b, 重启master

c, 访问master：16010/xx.jsp, 可以获取zookeeper的相关信息。

4，DIFF编码和压缩

问题：hbase中表占用的存储空间越来越来，希望减少hbase表占用空间。

方案：表级别enable DATA_BLOCK_ENCODING => 'DIFF', COMPRESSION => ‘LZO’ 属性，通过测试发现添加这个两个选项以后，空间能够减少9倍左右。

小结

本文主要记录下最近hbase的一些实践，另外基于opentsdb的hbase监控系列，打算有空再开篇描述下。

hbase最近的一些实践的更多相关文章

阿里HBase的数据管道设施实践与演进
摘要:第九届中国数据库技术大会,阿里巴巴技术专家孟庆义对阿里HBase的数据管道设施实践与演进进行了讲解.主要从数据导入场景. HBase Bulkload功能.HImporter系统.数据导出场景. ...
Bulk Load－HBase数据导入最佳实践
一.概述 HBase本身提供了非常多种数据导入的方式,通常有两种经常使用方式: 1.使用HBase提供的TableOutputFormat,原理是通过一个Mapreduce作业将数据导入HBase 2 ...
大数据查询——HBase读写设计与实践
导语:本文介绍的项目主要解决 check 和 opinion2 张历史数据表(历史数据是指当业务发生过程中的完整中间流程和结果数据)的在线查询.原实现基于 Oracle 提供存储查询服务,随着数据量的 ...
如何降低90%Java垃圾回收时间？以阿里HBase的GC优化实践为例
过去的一年里,我们准备在Ali-HBase上突破这个被普遍认知的痛点,为此进行了深度分析及全面创新的工作,获得了一些比较好的效果.以蚂蚁风控场景为例,HBase的线上young GC时间从120ms减 ...
大数据查询——HBase读写设计与实践--转
背景介绍本项目主要解决 check 和 opinion2 张历史数据表(历史数据是指当业务发生过程中的完整中间流程和结果数据)的在线查询.原实现基于 Oracle 提供存储查询服务,随着数据量的不断 ...
暑假第六周总结（对HBASE进行编程实践并且安装Redis）
本周主要是根据教程对HBASE进行了编程实践,对于hadoop的编程来说需要用到很多的.jar 包,在进行编程实践的时候需要参照相关的教程将jar包添加至程序当中去.教程上给的代码还是比较详细的,加上 ...
[平台建设] HBase平台建设实践
背景由于公司业务场景的需要,我们需要开发HBase平台,主要需要以下功能: 建表管理授权管理 SDK实现与公司内部系统打通我们使用的HBase 版本: HBase 1.2.0-cdh5.16. ...
Hadoop安全（1）——————美团Hadoop安全实践
http://tech.meituan.com/hadoop-security-practice.html 前言在2014年初,我们将线上使用的 Hadoop 1.0 集群切换到 Hadoop 2. ...
HBase全网最佳学习资料汇总
HBase全网最佳学习资料汇总摘要: HBase这几年在国内使用的越来越广泛,在一定规模的企业中几乎是必备存储引擎,互联网企业阿里巴巴.百度.腾讯.京东.小米都有数千台的HBase集群,中国电信的话 ...

随机推荐

我所写的CNN框架 VS caffe
我所写的CNN框架 VS caffe 一个月前.自己模仿caffe实现了一个卷积神经网络的框架. 同样点 1无缝支持CPU和GPU模式,GPU模式使用cuda实现. 不同点 1我的CNN不依赖与不论什 ...
Linux下kill命令的学习，（主要根据man手册进行的翻译）
名字 kill -终止一个进程格式 kill [-s signal | -p] [--] pid .. ...
Spring MVC @ResponseBody响应中文乱码
问题:在前端通过get请求服务端返回String类型的服务时,会出现中文乱码问题原因:由于spring默认对String类型的返回的编码采用的是 StringHttpMessageConverter ...
base64和图片互转
pom.xml添加  <dependen ...
web 开发之js---页面缓存, jsp 缓存， html 缓存， ajax缓存,解决方法
有关页面缓存问题．这个问题上网找了好多．但发觉各种解决方法,都彼此分离,没有一篇统一的解决方法,本人近日,也遇到了页面缓存的问题,根据网上各页面缓存的解答,做了一个总结. 1.服务器端缓存的问题, 防 ...
JavaScript学习14：表单处理
什么是表单? 在HTML中,表单是由<form>元素来表示的.而在JavaScript中,表单相应的则是HTMLFormElement类型.HTMLFormElement继承了HTMLEl ...
P1439 排列LCS问题
P1439 排列LCS问题 56通过 220提交题目提供者yeszy 标签二分动态规划难度普及+/提高提交该题讨论题解记录最新讨论暂时没有讨论题目描述给出1-n的两个排列P1和P2 ...
关于前端js拼接字符串的一点小经验
1.今天在做项目的时候遇到一个问题,就是使用onclick="xxx()" 点击事件的时候,参数如果为全数字就会出现点击无反应的问题.但是当参数为字符串或者动态内容的时候就会出现 ...
ABAP JSON
1 DATA: lv_em TYPE string, lv_em1 TYPE string. DATA: lt_but021 TYPE TABLE OF but021, lt_but0211 TYPE ...
[IMX6DL][Android4.4] 电池低电量告警提示【转】
本文转载自:http://blog.csdn.net/kris_fei/article/details/51789964 之前版本的电池电量低是通过发送 intent ACTION_BATTERY_L ...

hbase最近的一些实践

hbase最近的一些实践的更多相关文章

随机推荐

热门专题