HBase Region Assign流程详解
Hbase是kv存储,但是逻辑上我们可以把存储在hbase上的kv数据当成表,rowkey可以认为是表的主键。为了便于分布式操作,hbase会把表横向切分成一块一块的数据,而每块就是一个Region。为了提供在线服务,我们必须把Region加载到集群中的某台机器上,这个加载的过程正是region assign要做的。顺便说一句,hbase中把表切分region和HDFS中文件切分成block,Spark中RDD切分成partitions的思想都是一样的。
region assgin的流程
region assgin涉及到client,master,regionserver以及zk之间的交互。主要步骤如下:
1,client向master发送AssignRegion的RPC请求后(如当在hbase shell中运行assign命令),master响应该服务的入口函数为:
public AssignRegionResponse assignRegion(RpcController controller,
AssignRegionRequest req) throws ServiceException {
...
//检查master端服务是否启动以及已经初始化
master.checkInitialized();
//协处理器preAssign
... //核心,使用AssignmentManager做region assignment
master.assignmentManager.assign(regionInfo, true, true);
//协处理器postAssign
...
}
入口函数调用的assgin函数主要实现如下:
public void assign(HRegionInfo region,
boolean setOfflineInZK, boolean forceNewPlan) {
//检查该table是否处于disable或者disabling状态
//如果是,则忽略此次assign操作,并且如果该region处于RS_ZK_REGION_CLOSED,
//M_ZK_REGION_OFFLINE状态,则删除RIT下该节点
//另外,还会将master中该region相关的数据结构(RegionStates)的状态做相应设置
if (isDisabledorDisablingRegionInRIT(region)) {
return;
}
String encodedName = region.getEncodedName();
//貌似主要是锁住该region对应的状态
Lock lock = locker.acquireLock(encodedName);
try {
//根据该region当前的状态,进行相关预操作和过滤,
//比如,如果region处于FAILED_CLOSE和FAILD_OPEN状态会先进行unassign操作
//最终使得region处于offline状态
forceRegionStateToOffline(region, forceNewPlan); //尝试maximumAttempts(默认10次),首先获取RegionPlan,
//然后设置zk下RIT对应region的状态为M_ZK_REGION_OFFLINE
//一切准备就绪后,master会设置regionStates为PENDING_OPEN状态,并且
//向RegionServer发送OpenRegion请求
assign(state, ...);
}
} finally {
lock.unlock();
}
}
2,ReionServer响应OpenRegion的请求函数如下:
public OpenRegionResponse openRegion(final RpcController controller,
final OpenRegionRequest request) throws ServiceException {
...
//正常情况下,会交由OpenRegionHanlder来处理
regionServer.service.submit(new OpenRegionHandler(
regionServer, regionServer, region, htd, masterSystemTime, coordination, ord));
...
//打开后设置状态返回
builder.addOpeningState(RegionOpeningState.OPENED);
}
而OpenRegionHandler中open region的核心代码process函数中:
public void process() throws IOException {
...
//transitionFromOfflineToOpening会将zk中该region的状态从M_ZK_REGION_OFFLINE状态设置成RS_ZK_REGION_OPENING状态
if (useZKForAssignment
&& !coordination.transitionFromOfflineToOpening(reg...)
//打开open region,细节暂时忽略
openRegion()
//transitionToOpened将zk中该region的状态从RS_ZK_REGION_OPENING设置成
//RS_ZK_REGION_OPENED
if (!isRegionStillOpening() ||
(useZKForAssignment && !coordination.transitionToOpened(region, ord))) {
}
3,接下来,再看看Master监控到zk中region状态变化的相应情况:
void handleRegion(final RegionTransition rt, OpenRegionCoordination coordination,
OpenRegionCoordination.OpenRegionDetails ord) {
//当zk的状态变成RS_ZK_REGION_OPENING,设置regionStates的状态为OPENING
case RS_ZK_REGION_OPENING:
regionStates.updateRegionState(rt, State.OPENING); //正如注释所言,剔除中间状态,删除zk RIT结点,RegionStates设置为OPEN
case RS_ZK_REGION_OPENED:
// Handle OPENED by removing from transition and deleted zk node
regionStates.transitionOpenFromPendingOpenOrOpeningOnServer(...); }
小结
通过上面的分析,Region Assgin过程中主要的状态和步骤,大概可以用下图来概括。

未来
从上面的分析可知,当前region assgin的流程还是非常复杂的,所有很容易就造成Meta表和master,zk中的状态不一致,从而使Region处于RIT状态。社区正在做这方面的优化,主要思想就是去掉zk依赖,从而只依赖master和regionserver。具体详情可参看: https://blogs.apache.org/hbase/entry/hbase_zk_less_region_assignment 。 预计在hbase 2.0中将包含该功能。
HBase Region Assign流程详解的更多相关文章
- 大数据Hadoop核心架构HDFS+MapReduce+Hbase+Hive内部机理详解
微信公众号[程序员江湖] 作者黄小斜,斜杠青年,某985硕士,阿里 Java 研发工程师,于 2018 年秋招拿到 BAT 头条.网易.滴滴等 8 个大厂 offer,目前致力于分享这几年的学习经验. ...
- Hadoop核心架构HDFS+MapReduce+Hbase+Hive内部机理详解
转自:http://blog.csdn.net/iamdll/article/details/20998035 分类: 分布式 2014-03-11 10:31 156人阅读 评论(0) 收藏 举报 ...
- tp6源码解析-第二天,ThinkPHP6编译模板流程详解,ThinkPHP6模板源码详解
TP6源码解析,ThinkPHP6模板编译流程详解 前言:刚开始写博客.如果觉得本篇文章对您有所帮助.点个赞再走也不迟 模板编译流程,大概是: 先获取到View类实例(依赖注入也好,通过助手函数也好) ...
- C++的性能C#的产能?! - .Net Native 系列《二》:.NET Native开发流程详解
之前一文<c++的性能, c#的产能?!鱼和熊掌可以兼得,.NET NATIVE初窥> 获得很多朋友支持和鼓励,也更让我坚定做这项技术的推广者,希望能让更多的朋友了解这项技术,于是先从官方 ...
- [nRF51822] 5、 霸屏了——详解nRF51 SDK中的GPIOTE(从GPIO电平变化到产生中断事件的流程详解)
:由于在大多数情况下GPIO的状态变化都会触发应用程序执行一些动作.为了方便nRF51官方把该流程封装成了GPIOTE,全称:The GPIO Tasks and Events (GPIOTE) . ...
- 迅为4412开发板Linux驱动教程——总线_设备_驱动注册流程详解
本文转自:http://www.topeetboard.com 视频下载地址: 驱动注册:http://pan.baidu.com/s/1i34HcDB 设备注册:http://pan.baidu.c ...
- Linux启动流程详解【转载】
在BIOS阶段,计算机的行为基本上被写死了,可以做的事情并不多:一般就是通电.BIOS.主引导记录.操作系统这四步.所以我们一般认为加载内核是linux启动流程的第一步. 第一步.加载内核 操作系统接 ...
- Faster RCNN原理分析(二):Region Proposal Networks详解
Faster RCNN原理分析(二):Region Proposal Networks详解 http://lib.csdn.net/article/deeplearning/61641 0814: A ...
- iOS 组件化流程详解(git创建流程)
[链接]组件化流程详解(一)https://www.jianshu.com/p/2deca619ff7e
随机推荐
- Memcache应用场景介绍
面临的问题 对于高并发高訪问的Web应用程序来说,数据库存取瓶颈一直是个令人头疼的问题.特别当你的程序架构还是建立在单数据库模式,而一个数据池连接数峰 值已经达到500的时候,那你的程序执行离崩溃的边 ...
- 当你使用LINQ做底层时,最好设计一个工厂,不要把LINQ的动作暴露给业务层
1: using System; 2: using System.Collections.Generic; 3: using System.Linq; 4: using System.Text; 5: ...
- 刚刚做了个文件上传功能,拿来分享一下!(MVC架构及传统架构通用)
文件上传无论在软件还是在网站上都十分常见,我今天再把它拿出来,讲一下,主要讲一下它的设计思想和实现技术,为了它的通用性,我把它做在了WEB.Service项目里,即它是针对服务器的,它的结构是关联UI ...
- MVC优缺点
1.通过把项目分成model view和controller,使得复杂项目更加容易维护. 2.没有使用view state和服务器表单控件,可以更方便的控制应用程序的行为 3.应用程序通过contro ...
- vs2010中设置qt环境的智能识别方案
Qt搭建请参考:Win7系统VS2010下搭建qt开发环境 搭建好之后,虽然可以编译过去,但是写代码时,编辑器无法识别,也没有智能提示,并且代码中都是红色的提示如下: 此时需要设置一下include路 ...
- 超过经理收入的员工 表的自JOIN
https://leetcode-cn.com/problems/employees-earning-more-than-their-managers/description/ The Employe ...
- linux 监控进程所消耗的资源(内存),达到阈值(绝对值、相对值)后,将其杀死
监控某个python进程是否存在,如不存在则启动 #!/bin/bashwhile [ 1 ]do #打印出当前的jboss进程:grep jboss查询的jboss进程,grep -v " ...
- zTree 基本用法
[简介] zTree 是利用 JQuery 的核心代码,实现一套能完成大部分常用功能的 Tree 插件 兼容 IE.FireFox.Chrome 等浏览器 在一个页面内可同时生成多个 Tree 实例 ...
- Js_闭包详解
http://blog.csdn.net/chenglc1612/article/details/53413318 一.变量的作用域 要理解闭包,首先必须理解Javascript特殊的变量作用域. 变 ...
- Android无法自动创建USB打印机节点/dev/usb/lp0【转】
本文转载自:http://blog.csdn.net/u013686019/article/details/50165059 Android: 4.4.4 一.问题分析 当把USB打印机插入Andro ...