region分裂有2种触发情景:1是用户手动触发(参见HRegionServer的splitRegion方法),2是后台flush线程flush完一个region的memstore时,会去检查这个region是否需要分裂(参见MemStoreFlushe的flushRegion方法)。这两种情景在代码实现上并无多大差异。

, firstKey.length) < 0) {

  • , lastKey.length) > 0) {
  • return null;
  • }
  • }
  • /*生成类型为reference的storefile文件,比如encode name为a,column family为cf(该cf下有名为hfile的storefile)的region分裂后会形成名为b和c的引用文件,此时在hdfs中该region下的目录结构为
  • /hbase/tableName/a/cf/hfile
  • /hbase/tableName/b/.splits/cf/hfile.a
  • /hbase/tableName/c/.splits/cf/hfile.a
  • 这两个引用文件的storefile的内容由原storefile的中间rowkey和range组成,reference文件的个数与原split region的storefile文件个数相同
  • */
  • Reference r = new Reference(splitRow, range);
  • String parentRegionName = f.getPath().getParent().getParent().getName();
  • Path p = new Path(splitDir, f.getPath().getName() + "." + parentRegionName);
  • return r.write(fs, p);
  • }
  • 再来看一下openDaughters

    1. void openDaughters(final Server server,
    2. final RegionServerServices services, HRegion a, HRegion b)
    3. throws IOException {
    4. //并行打开两个daughters
    5. DaughterOpener aOpener = new DaughterOpener(server, a);
    6. DaughterOpener bOpener = new DaughterOpener(server, b);
    7. aOpener.start();
    8. bOpener.start();
    9. if (services != null) {
    10. try {
    11. services.postOpenDeployTasks(b, server.getCatalogTracker(), true); // compact有references的storefile,compact操作最终清理掉这些reference文件,并把实际文件的内容写到region中去。将regioninfo信息和location的位置信息put到.META.表中
    12. services.addToOnlineRegions(b);  //添加region对象到regionserver的online列表中,终于可以对外提供服务了
    13. services.postOpenDeployTasks(a, server.getCatalogTracker(), true);
    14. services.addToOnlineRegions(a);
    15. } catch (KeeperException ke) {
    16. throw new IOException(ke);
    17. }
    18. }
    19. }

    最后梳理下整个流程:

    检查该region是否需要分裂,如果满足分裂条件,则通过region.checkSplit()拿到midkey,并把该分裂请求SplitRequest提交给后台的CompactSplitThread线程池去执行,SplitRequest内部会创建SplitTransaction来实现分裂,其过程如下:

    * 根据该region和midkey创建两个新的region对象HRegionInfo,代表分裂后的两个dautghter region

    * 在zk上创建一个临时节点(名称为“/hbase/region-in-transition/region-name”的znode),以防regionserver在分裂过程中down掉,保存split状态为RS_ZK_REGION_SPLITTING,表示开始region分裂。同时因为master一直watch znode(/hbase/region-in-transition),所以master会知道这个region的变化,以防master对其进行move等操作

    * 在该region所在的hdfs路径下创建.splits文件夹

    * 关闭该region,关闭前会等待region的flush和compact都完成(通过writestate同步实现),还会判断如果memstore的size小于5m(默认)时,会preFlush,然后关闭该region,region停止读写,并从regionserver的online服务中移除

    * 通过创建与该region下storefile个数相同的线程池子进行storefile的并行分裂,见StoreFileSplitter的splitStoreFile方法,其核心走StoreFile.split方法,其生成类型为reference的storefile文件,比如encode name为a,column family为cf(该cf下有名为hfile的storefile)的region分裂后会形成名为b和c的引用文件,此时在hdfs中该region下的目录结构为

    /hbase/tableName/a/cf/hfile 
    /hbase/tableName/b/.splits/cf/hfile.a 
    /hbase/tableName/c/.splits/cf/hfile.a 
    这两个引用文件的storefile的内容由原storefile的中间rowkey和range组成,reference文件的个数与原split region的storefile文件个数相同

    * 在.META.表中下线split的region,修改.META.表的该region信息,把offline split设置为true,添加列:splitA和splitB

    *  并行打开两个daughters region,CompactSplitThread后台线程会compact有references的storefile,compact操作最终清理掉这些reference文件,把实际文件的内容写到daughters region中去。并将daughter region的regioninfo信息和location的位置信息put到.META.表中

    * 添加region对象到regionserver的online列表中,终于可以对外提供服务了

    转载请注明出处:http://blog.csdn.net/odailidong/article/details/42217439

    参考文章:

    http://blog.csdn.net/c77_cn/article/details/38758545

    http://www.cnblogs.com/foxmailed/p/3970050.html

    hbase的Region分裂代码分析的更多相关文章

    1. HBase之五:hbase的region分区

      一.Region 概念 Region是表获取和分布的基本元素,由每个列族的一个Store组成.对象层级图如下: Table (HBase table) Region (Regions for the ...

    2. 【转帖】HBase之五:hbase的region分区

      HBase之五:hbase的region分区 https://www.cnblogs.com/duanxz/p/3154487.html 一.Region 概念 Region是表获取和分布的基本元素, ...

    3. hbase的region

      一.Region 概念 Region是表获取和分布的基本元素,由每个列族的一个Store组成.对象层级图如下: Table (HBase table) Region (Regions for the ...

    4. region split流程分析

      region split流程分析 splitregion的发起主要通过client端调用regionserver.splitRegion或memstore.flsuh时检查并发起. Client通过r ...

    5. HBase 与 Cassandra 架构对比分析的经验分享

      架构对比 HBase和Cassandra几乎是一个年份发起,又都是在2010年成为Apache的顶级项目,不过如果我们去细品其内部机制,我们会发现其实两者是完全不同的架构风格. HBASE起源于Goo ...

    6. STM32启动代码分析 IAR 比较好

      stm32启动代码分析 (2012-06-12 09:43:31) 转载▼     最近开始使用ST的stm32w108芯片(也是一款zigbee芯片).开始看他的启动代码看的晕晕呼呼呼的. 还好在c ...

    7. hbase删除region块的脚本

      删除hbase表region块脚本 文件hua.txt格式: CHAT_INFO,1318153079100530000314050,1318173760068.991ca04ff164c3f7987 ...

    8. Hive metastore整体代码分析及详解

      从上一篇对Hive metastore表结构的简要分析中,我再根据数据设计的实体对象,再进行整个代码结构的总结.那么我们先打开metadata的目录,其目录结构: 可以看到,整个hivemeta的目录 ...

    9. 微信公众号抢现金红包活动的核心代码分析(asp.net C#)

      今年春节微信抢红包,我想各位都还记得.最近很多商家也在使用公众号给粉丝发红包,做营销活动.吸粉活动或者是反馈老用户等. 我们作为第3方开发者,就义不容辞的来给这些商家服务了.首先我们得会使用程序来写抢 ...

    随机推荐

    1. Java基础知识:Java实现Map集合二级联动3

      * Returns an image stored in the file at the specified path * @param path String The path to the ima ...

    2. vim常用命令—撤销与反撤销

      命令模式下(即按ESC后的模式) u 撤销 Ctrl r (组合键) 反撤销<后悔撤销>

    3. [精通Python自然语言处理] Ch1 - 将句子切分为单词

      实验对比了一下三种切分方式: 1,2 : nltk.word_tokenize :  分离缩略词,(“Don't” =>'Do', "n't") 表句子切分的“,” &quo ...

    4. js经典试题之闭包

      js经典试题之闭包 1:以下代码输出的结果是? function Foo(){ var i=0; return function(){ document.write(i++); } } var f1= ...

    5. 20172330 2017-2018-1 《Java程序设计》第五周学习总结

      20172330 2017-2018-1 <Java程序设计>第五周学习总结 教材学习内容总结 第五章 首先是对各种各种运算符的了解:刚开始以为相等就是=,还有其他一些符号都挺简单的,然后 ...

    6. Python实现XML的操作

      本文从以下两个方面, 用Python实现XML的操作: 一. minidom写入XML示例1 二. minidom写入XML示例2 三. ElementTree写入/修改示例 四. ElementTr ...

    7. [剑指Offer] 66.机器人的运动范围

      题目描述 地上有一个m行和n列的方格.一个机器人从坐标0,0的格子开始移动,每一次只能向左,右,上,下四个方向移动一格,但是不能进入行坐标和列坐标的数位之和大于k的格子. 例如,当k为18时,机器人能 ...

    8. 青花瓷运用->下载历史版本App

      1.软件准备 [必备]Charles4.0.1 下载密码: jfnk [不需要,配合Charles食用效果更佳]Paw2.3.1 下载密码: t3my 2.正式开始 2.1 打开Charles青花瓷 ...

    9. BZOJ 1797 最小割(最小割割边唯一性判定)

      问题一:是否存在一个最小代价路径切断方案,其中该道路被切断? 问题二:是否对任何一个最小代价路径切断方案,都有该道路被切断? 现在请你回答这两个问题. 最小割唯一性判定 jcvb: 在残余网络上跑ta ...

    10. BZOJ 1095 捉迷藏(线段树维护括号序列)

      对于树的一个括号序列,树上两点的距离就是在括号序列中两点之间的括号匹配完之后的括号数... 由此可以得出线段树的做法.. #include<cstdio> #include<iost ...