hbase的Region分裂代码分析

region分裂有2种触发情景：1是用户手动触发(参见HRegionServer的splitRegion方法)，2是后台flush线程flush完一个region的memstore时，会去检查这个region是否需要分裂(参见MemStoreFlushe的flushRegion方法)。这两种情景在代码实现上并无多大差异。

, firstKey.length) < 0) {

, lastKey.length) > 0) {

return null;

}

/*生成类型为reference的storefile文件,比如encode name为a，column family为cf(该cf下有名为hfile的storefile)的region分裂后会形成名为b和c的引用文件，此时在hdfs中该region下的目录结构为

/hbase/tableName/a/cf/hfile

/hbase/tableName/b/.splits/cf/hfile.a

/hbase/tableName/c/.splits/cf/hfile.a

这两个引用文件的storefile的内容由原storefile的中间rowkey和range组成，reference文件的个数与原split region的storefile文件个数相同

Reference r = new Reference(splitRow, range);

String parentRegionName = f.getPath().getParent().getParent().getName();

Path p = new Path(splitDir, f.getPath().getName() + "." + parentRegionName);

return r.write(fs, p);

}

再来看一下openDaughters

void openDaughters(final Server server,
final RegionServerServices services, HRegion a, HRegion b)
throws IOException {
//并行打开两个daughters
DaughterOpener aOpener = new DaughterOpener(server, a);
DaughterOpener bOpener = new DaughterOpener(server, b);
aOpener.start();
bOpener.start();
if (services != null) {
try {
services.postOpenDeployTasks(b, server.getCatalogTracker(), true); // compact有references的storefile，compact操作最终清理掉这些reference文件，并把实际文件的内容写到region中去。将regioninfo信息和location的位置信息put到.META.表中
services.addToOnlineRegions(b); //添加region对象到regionserver的online列表中，终于可以对外提供服务了
services.postOpenDeployTasks(a, server.getCatalogTracker(), true);
services.addToOnlineRegions(a);
} catch (KeeperException ke) {
throw new IOException(ke);
}
}
}

最后梳理下整个流程：

检查该region是否需要分裂，如果满足分裂条件，则通过region.checkSplit()拿到midkey，并把该分裂请求SplitRequest提交给后台的CompactSplitThread线程池去执行，SplitRequest内部会创建SplitTransaction来实现分裂，其过程如下：

* 根据该region和midkey创建两个新的region对象HRegionInfo，代表分裂后的两个dautghter region

* 在zk上创建一个临时节点(名称为“/hbase/region-in-transition/region-name”的znode)，以防regionserver在分裂过程中down掉，保存split状态为RS_ZK_REGION_SPLITTING，表示开始region分裂。同时因为master一直watch znode(/hbase/region-in-transition),所以master会知道这个region的变化，以防master对其进行move等操作

* 在该region所在的hdfs路径下创建.splits文件夹

* 关闭该region，关闭前会等待region的flush和compact都完成(通过writestate同步实现)，还会判断如果memstore的size小于5m(默认)时，会preFlush,然后关闭该region,region停止读写,并从regionserver的online服务中移除

* 通过创建与该region下storefile个数相同的线程池子进行storefile的并行分裂,见StoreFileSplitter的splitStoreFile方法,其核心走StoreFile.split方法，其生成类型为reference的storefile文件,比如encode name为a，column family为cf(该cf下有名为hfile的storefile)的region分裂后会形成名为b和c的引用文件，此时在hdfs中该region下的目录结构为

/hbase/tableName/a/cf/hfile
/hbase/tableName/b/.splits/cf/hfile.a
/hbase/tableName/c/.splits/cf/hfile.a
这两个引用文件的storefile的内容由原storefile的中间rowkey和range组成，reference文件的个数与原split region的storefile文件个数相同

* 在.META.表中下线split的region，修改.META.表的该region信息，把offline split设置为true，添加列：splitA和splitB

* 并行打开两个daughters region，CompactSplitThread后台线程会compact有references的storefile，compact操作最终清理掉这些reference文件，把实际文件的内容写到daughters region中去。并将daughter region的regioninfo信息和location的位置信息put到.META.表中

* 添加region对象到regionserver的online列表中，终于可以对外提供服务了

转载请注明出处：http://blog.csdn.net/odailidong/article/details/42217439

参考文章：

http://blog.csdn.net/c77_cn/article/details/38758545

http://www.cnblogs.com/foxmailed/p/3970050.html

hbase的Region分裂代码分析的更多相关文章

HBase之五：hbase的region分区
一.Region 概念 Region是表获取和分布的基本元素,由每个列族的一个Store组成.对象层级图如下: Table (HBase table) Region (Regions for the ...
【转帖】HBase之五：hbase的region分区
HBase之五:hbase的region分区 https://www.cnblogs.com/duanxz/p/3154487.html 一.Region 概念 Region是表获取和分布的基本元素, ...
hbase的region
一.Region 概念 Region是表获取和分布的基本元素,由每个列族的一个Store组成.对象层级图如下: Table (HBase table) Region (Regions for the ...
region split流程分析
region split流程分析 splitregion的发起主要通过client端调用regionserver.splitRegion或memstore.flsuh时检查并发起. Client通过r ...
HBase 与 Cassandra 架构对比分析的经验分享
架构对比 HBase和Cassandra几乎是一个年份发起,又都是在2010年成为Apache的顶级项目,不过如果我们去细品其内部机制,我们会发现其实两者是完全不同的架构风格. HBASE起源于Goo ...
STM32启动代码分析 IAR 比较好
stm32启动代码分析 (2012-06-12 09:43:31) 转载▼ 最近开始使用ST的stm32w108芯片(也是一款zigbee芯片).开始看他的启动代码看的晕晕呼呼呼的. 还好在c ...
hbase删除region块的脚本
删除hbase表region块脚本文件hua.txt格式: CHAT_INFO,1318153079100530000314050,1318173760068.991ca04ff164c3f7987 ...
Hive metastore整体代码分析及详解
从上一篇对Hive metastore表结构的简要分析中,我再根据数据设计的实体对象,再进行整个代码结构的总结.那么我们先打开metadata的目录,其目录结构: 可以看到,整个hivemeta的目录 ...
微信公众号抢现金红包活动的核心代码分析(asp.net C#)
今年春节微信抢红包,我想各位都还记得.最近很多商家也在使用公众号给粉丝发红包,做营销活动.吸粉活动或者是反馈老用户等. 我们作为第3方开发者,就义不容辞的来给这些商家服务了.首先我们得会使用程序来写抢 ...

随机推荐

Java中定时器相关实现的介绍与对比之：Timer和TimerTask
Timer和TimerTask JDK自带,具体的定时任务由TimerTask指定,定时任务的执行调度由Timer设定.Timer和TimerTask均在包java.util里实现. 本文基于java ...
UML类图(Class Diagram)中类与类之间的关系及表示方式(转)
源地址:https://blog.csdn.net/a19881029/article/details/8957441 ======================================== ...
Ubuntu—截屏与截取选定区域
截屏:PrScrn(打印键) 截取选定区域:shift + PrScrn(打印键) # 截取选定区域时,先按下组合键后,鼠标的形状就会变成十字架形状,这时候再截取想要截取的区域就可以了-
vue 与jq 的对比
vue.react和angular,众所周知,他们是前端框架的3个大佬.这篇主要想对比一下用vue和用jq的区别,至于和其他框架的对比,我想vue的官网说的更为详细. 我算是独自用vue写过一个小型项 ...
Discover the Web(栈模拟)
Description Standard web browsers contain features to move backward and forward among the pages rece ...
Java学习个人备忘录之关键字static
被static标记的东西会放在内存中被共享的,对象用到时,就会来取的. class Person { String name; //成员变量,实例变量 static String country = ...
lintcode-153-数字组合 II
153-数字组合 II 给出一组候选数字(C)和目标数字(T),找出C中所有的组合,使组合中数字的和为T.C中每个数字在每个组合中只能使用一次. 注意事项所有的数字(包括目标数字)均为正整数. 元素 ...
iOS开发JOSNModel<optional>,<convertondemand>,<index>
指定定义的key的类型 <optional>表示字段可选,例如 //链接字段是可选的,转换的时候允许link未空 @property (nonatomic,strong) NSString ...
sublime Text3 如何自动排版代码
安装 html beautiful 然后按ctrl+shift+alt+f
dedecms添加新模型
dedecms虽然预设了一些常见网页的功能模型,但是如果需要新的功能则需要自己创建,dedecms也提供了创建新模型的功能,如下: 1.打开后台首页=>核心=>内容模型管理 2.添加新模型 ...

hbase的Region分裂代码分析

hbase的Region分裂代码分析的更多相关文章

随机推荐

热门专题