hbase replication原理分析

本文只是从总体流程来分析replication过程，很多细节没有提及，下一篇文章准备多分析分析细节。

replicationSource启动过程

org.apache.hadoop.hbase.regionserver.HRegionServer#startServiceThreads ->

org.apache.hadoop.hbase.replication.regionserver.Replication#startReplicationService ->

//初始化replicationManager

org.apache.hadoop.hbase.replication.regionserver.ReplicationSourceManager#init ->

//在init阶段for循环把所有的replicationPeers添加到source里，即每个replicationPeer对应一个source，也就是可以添加多个slave cluster，replicationPeers从zookeeper /hbase/replication/peers目录取

org.apache.hadoop.hbase.replication.regionserver.ReplicationSourceManager#addSource ->

//在addSource阶段生成ReplicationSource并启动ReplicationSource，ReplicationSource本身是一个线程

org.apache.hadoop.hbase.replication.regionserver.ReplicationSource#startup

//ReplicationSource线程启动，进入while循环工作

replicationSource大致工作流程

while(isAlive())进行主体循环
从WAL文件获取List<WAL.Entry>
通过调用shipEdits方法发送数据
调用replicationEndpoint replicate方法发送数据
最终调用admin.replicateWALEntry通过rpc发送数据

regionserver如何从slave cluster中选取regionserver当做复制节点

replication过程需要连接peer（slave cluster），首先要获取这个peer所有活着的regionservers
拿到所有regionservers信息之后，开始选择哪些regionservers作为replication的对象
选哪些regionservers当做sink由peer活着的regionserver个数*ratio（默认值0.1）决定，regionservers先shuffle打乱顺序后再截取
如果选择的sink（regionserver）个数为0，一直等待peer上线，也就是slave cluster没有启动的情况
下面源码可以解释如何选择regionserver当做sink

  private void connectToPeers() {

    getRegionServers();

    int sleepMultiplier = 1;

    // Connect to peer cluster first, unless we have to stop

    while (this.isRunning() && replicationSinkMgr.getSinks().size() == 0) {

      replicationSinkMgr.chooseSinks();

      if (this.isRunning() && replicationSinkMgr.getSinks().size() == 0) {

        if (sleepForRetries("Waiting for peers", sleepMultiplier)) {

          sleepMultiplier++;     //倍数最多为默认配置的300倍，也就是每次sleep最长间隔是300秒

        }

      }

    }

  }

  void chooseSinks() {

    List<ServerName> slaveAddresses = endpoint.getRegionServers();

    Collections.shuffle(slaveAddresses, random);

    int numSinks = (int) Math.ceil(slaveAddresses.size() * ratio);

    sinks = slaveAddresses.subList(0, numSinks);

    lastUpdateToPeers = System.currentTimeMillis();

    badReportCounts.clear();

  }

  /**

   * Do the sleeping logic

   * @param msg Why we sleep

   * @param sleepMultiplier by how many times the default sleeping time is augmented

   * @return True if <code>sleepMultiplier</code> is &lt; <code>maxRetriesMultiplier</code>

   */

  protected boolean sleepForRetries(String msg, int sleepMultiplier) {

    try {

      if (LOG.isTraceEnabled()) {

        LOG.trace(msg + ", sleeping " + sleepForRetries + " times " + sleepMultiplier);

      }

      Thread.sleep(this.sleepForRetries * sleepMultiplier);

    } catch (InterruptedException e) {

      LOG.debug("Interrupted while sleeping between retries");

    }

    return sleepMultiplier < maxRetriesMultiplier;

  }

this.maxRetriesMultiplier = this.conf.getInt("replication.source.maxretriesmultiplier", 300);

this.ratio = conf.getFloat("replication.source.ratio", DEFAULT_REPLICATION_SOURCE_RATIO);

总结

每个slave cluster对应一个replicationSource线程，各个slave复制互不干扰
每个replicationSource是单线程进行传输数据，改成多线程并发传可能更好
数据是通过rpc发送过去，调用slave cluster regionserver RSRpcServices的replicateWALEntry方法

hbase replication原理分析的更多相关文章

HBase的replication原理及部署
一.hbase replication原理 hbase 的复制方式是 master-push 方式,即主集群推的方式,主要是因为每个rs都有自己的WAL. 一个master集群可以复制给多个从集群,复 ...
1、Hbase原理分析
一.Hbase介绍 1.1.对Hbase的认识 HBase作为面向列的数据库运行在HDFS之上,HDFS缺乏随机读写操作,HBase正是为此而出现. HBase参考 Google 的 Bigtable ...
flink-----实时项目---day07-----1.Flink的checkpoint原理分析 2. 自定义两阶段提交sink（MySQL） 3 将数据写入Hbase（使用幂等性结合at least Once实现精确一次性语义） 4 ProtoBuf
1.Flink中exactly once实现原理分析生产者从kafka拉取数据以及消费者往kafka写数据都需要保证exactly once.目前flink中支持exactly once的sourc ...
HBase replication
Hbase Replication 介绍现状 Hbase 的replication目前在业界使用并不多见,原因有很多方面,比如说HDFS目前已经有多份备份在某种程度上帮助HBASE底层数据的安全性, ...
Hadoop 综合揭秘——HBase的原理与应用
前言现今互联网科技发展日新月异,大数据.云计算.人工智能等技术已经成为前瞻性产品,海量数据和超高并发让传统的 Web2.0 网站有点力不从心,暴露了很多难以克服的问题.为此,Google.Amazo ...
Hadoop生态圈-Zookeeper的工作原理分析
Hadoop生态圈-Zookeeper的工作原理分析作者:尹正杰版权声明:原创作品,谢绝转载!否则将追究法律责任. 无论是是Kafka集群,还是producer和consumer都依赖于Zoo ...
HBase Scan流程分析
HBase Scan流程分析 HBase的读流程目前看来比较复杂,主要由于: HBase的表数据分为多个层次,HRegion->HStore->[HFile,HFile,...,MemSt ...
Redis数据持久化机制AOF原理分析一---转
http://blog.csdn.net/acceptedxukai/article/details/18136903 http://blog.csdn.net/acceptedxukai/artic ...
Hadoop数据管理介绍及原理分析
Hadoop数据管理介绍及原理分析最近2014大数据会议正如火如荼的进行着,Hadoop之父Doug Cutting也被邀参加,我有幸听了他的演讲并获得亲笔签名书一本,发现他竟然是左手写字,当然这个 ...

随机推荐

【java】【多线程】等待开启的多个线程都执行完成，再做事情，怎么实现
今天在controller中写一个接口用来测试模拟多个请求同时到达下订单的情况, 怎么能有效保证高并发下的库存和销量的一致性呢?[具体实现方法:https://www.cnblogs.com/sxd ...
Git系列一之安装管理
1.Git安装部署 Git是分布式的版本控制系统,我们只要有了一个原始Git版本仓库,就可以让其他主机克隆走这个原始版本仓库,从而使得一个Git版本仓库可以被同时分布到不同的主机之上,并且每台主机的版 ...
Jupyter Notebook 快捷键
Jupyter Notebook 快捷键从命令模式进入编辑模式需按 Enter 键,从编辑模式切换到命令模式需按Esc 键. Jupyter Notebook 是一个交互式笔记本程序, 其有丰富的快 ...
Newtonsoft.Json.4.5.11使用方法总结---反序列化json字符串
写在开头: 最近项目需求,需要在C#中处理json字符串,毫不犹豫的下载了Newtonsoft.Json 4.5.11(2012.12.17)http://json.codeplex.com/,然后百 ...
ZOJ3622 Magic Number(水题)
分析: 举个样例xxx(三位数)为魔力数,则xxx|(xxx+1000*y),那么xxx|1000,这个就是结论同理:四位数xxxx|10000,五位数xxxxx|100000 代码: #inclu ...
Spark Streaming数据清理内幕彻底解密
本讲从二个方面阐述: 数据清理原因和现象数据清理代码解析 Spark Core从技术研究的角度讲对Spark Streaming研究的彻底,没有你搞不定的Spark应用程序. Spark Stre ...
安装Tomcat指定JDK ——转
转自:http://www.cnblogs.com/lioillioil/archive/2011/10/08/2202169.html 一.应用实例一般情况下一台服务器只跑一个业务,那么就直接配置 ...
倍福TwinCAT(贝福Beckhoff)常见问题(FAQ)-为什么没有自动识别成标准FBD功能块
新建一个项目,是不会自动把FBD对应名称的模块识别成标准功能块的你需要引入相应的类库重新输入FBD 然后才会自动生成更多教学视频和资料下载,欢迎关注以下信息: 我的优酷空间: ht ...
win7之64位下安装oracle11g遇到问题和不能删除干净的问题
今天在win7下装了oracle11g 删了又卸来来回回重启了4.5次,结合网上是解释归纳下几点: 一.win64_11gR2_database_1of2.zip和win64_11gR2_datab ...
Hadoop-2.4.1学习之Streaming编程
在之前的文章曾提到Hadoop不仅支持用Java编写的job,也支持其他语言编写的作业,比方Hadoop Streaming(shell.python)和Hadoop Pipes(c++),本篇文章将 ...

hbase replication原理分析

hbase replication原理分析的更多相关文章

随机推荐

热门专题