[Hbase]Hbase容灾方案

　　介绍两种HBase的数据备份或者容灾方案：Snapshot，Replication；

一、Snapshot

开启快照功能，在hbase-site.xml文件中添加如下配置项：

<name>hbase.snapshot.enabled</name>

</property>

在hbase shell中使用clone_snapshot, delete_snapshot, list_snapshots, restore_snapshot, snapshot命令可是是想创建快照，查看快照，通过快照恢复表，通过快照创建一个新的表等功能，需要注意的是：如果该表开启了replication功能实现主从同步则在使用restore_snapshot功能对主表进行恢复时，必须先停止replication功能并且redo the bootstrap，因为replication是基于WAL日志实现的，而snapshot是直接在hdfs层面不是基于hbase的put、delete等API进行的，不会写WAL日志。

二、Replication

可以通过replication机制实现hbase集群的主从模式，具体步骤如下：

1、 zookeeper不能被hbase托管，如果主从hbase集群共用一个zk集群，则zookeeper.znode.parent不能都是默认的hbase，可以配置为hbase-master和hbase-slave

2、在主hbase集群的hbase-site.xml中添加配置项：

<name>hbase.replication</name>

</property>

<name>replication.source.nb.capacity</name>

<description>主集群每次向从集群发送的entry最大的个数，默认值25000，可根据集群规模做出适当调整</description>

</property>

<name>replication.source.size.capacity</name>

<description>主集群每次向从集群发送的entry的包的最大值大小，默认为64M</description>

</property>

<name>replication.source.ratio</name>

<description>主集群使用的从集群的RS的数据百分比，默认为0.1，需调整为1，充分利用从集群的RS</description>

</property>

<name>replication.sleep.before.failover</name>

<description>主集群在RS宕机多长时间后进行failover，默认为2秒，具体的sleep时间是： sleepBeforeFailover + (long) (new Random().nextFloat() * sleepBeforeFailover) </description>

</property>

<name>replication.executor.workers</name>

<description>从事replication的线程数，默认为1，如果写入量大，可以适当调大</description>

</property>

3、在从hbase集群的hbase-site.xml中添加：

<name>hbase.replication</name>

</property>

4、进入主集群的shell，执行：

add_peer 'ID' 'CLUSTER_KEY'

The ID must be a short integer. To compose the CLUSTER_KEY, use the following template:

hbase.zookeeper.quorum:hbase.zookeeper.property.clientPort:zookeeper.znode.parent

This will show you the help to setup the replication stream between both clusters. If both clusters use the same Zookeeper cluster, you have to use a different zookeeper.znode.parent since they can't write in the same folder.

5、在从集群中创建一个与master集群相同的表

6、修改表定义，开启复制功能

disable 'your_table'

alter 'your_table', {NAME => 'family_name', REPLICATION_SCOPE => '1'}

enable 'your_table

此处的REPLICATION_SCOPE => '1'中的1，与第3步中设置到“ID”相同

提示：

1、 hbase的replication，如果是在建立主表和从表的关系前，主表已经有数据则该部分数据不会被同步到从表中，因为replication是依赖WAL日志进行的同步，可以通过如下步骤实现：

a) 通过snapshot把历史数据导入到从集群；

b) 开启replication；

c) 通过Export工具把快照和开启replication之间的数据导入到从表；

d) 通过VerifyReplication工具校验数据的一致性。

2、如果客户端在写入数据时设置不写WAL日志，则会导致从集群不会同步数据；

3、主从同步是异步的，因此数据不一定会立即同步到从表；

4、创建主、从表后，在向主表写入数据时，停止从集群，写完后再开启从集群，这时如果主集群的WAL日志还在则会同步到从表中；

　　由于不写WAL日志的数据不会被同步到从集群，因此对于重要的数据建议再通过snapshot进行定期的备份。

[Hbase]Hbase容灾方案的更多相关文章

hbase数据备份或者容灾方案
HBase的数据备份或者容灾方案有这几种:Distcp,CopyTable,Export/Import,Snapshot,Replication,以下分别介绍(以下描述的内容均是基于0.94.20版本 ...
Hbase数据备份&&容灾方案
Hbase数据备份&&容灾方案标签(空格分隔): Hbase 一.Distcp 在使用distcp命令copy hdfs文件的方式实现备份时,需要禁用备份表确保copy时该表没有数据 ...
利用HDFS实现ElasticSearch7.2容灾方案
利用HDFS实现ElasticSearch7.2容灾方案目录利用HDFS实现ElasticSearch7.2容灾方案前言快照版本兼容备份集群 HDFS文件系统软件下载 JDK环境配置系统 ...
MongDB集群容灾方案步骤
MongoDB复制集优/特点支持大数据量.高扩展性.高性能.灵活数据模型.高可用性.同步机制数据复制的目的是使数据得到最大的可用性,避免单点故障引起的整站不能访问的情况的发生,Mongodb的副本集在 ...
【亲述】Uber容错设计与多机房容灾方案 - 高可用架构系列
此文是根据赵磊在[QCON高可用架构群]中的分享内容整理而成.转载请事先联系赵磊及相关编辑. 赵磊,Uber高级工程师,08年上海交通大学毕业,曾就职于微软,后加入Facebook主要负责Messen ...
keepalived容灾方案，实现nginx负载均衡主从架构（1）
一:环境准备:4台nginx服务器,两台用yum安装,两台使用源码安装第一步:使用yum安装nginx服务器,在浏览器输入ip,可以显示以下内容,这步比较简单,安装好修改/usr/share/ngi ...
QQ 相册后台存储架构重构与跨 IDC 容灾实践
欢迎大家前往云加社区,获取更多腾讯海量技术实践干货哦~ 作者简介:xianmau,2015 年加入腾讯 TEG 架构平台部,一直负责 QQ 相册平台的维护和建设,主导相册上传架构重构和容灾优化等工作. ...
传统业务上云：跨AZ容灾架构解析
本文由网易云发布. 数字化转型浪潮之下,采用云计算服务提升业务敏捷性.降低运维成本,成为了传统企业的优选方案.网易云资深解决方案架构师张亮通过某物流企业客户的实际案例,分享了传统业务系统在云上的架 ...
华为云计算IE面试笔记-请描述华为容灾解决方案全景图，并解释双活数据中心需要从哪些角度着手考虑双活设计
容灾全景图: 按照距离划分:分为本地容灾同城容灾异地容灾本地容灾包括本地高可用和本地主备.(本数据中心的两机房.机柜) 本地高可用这个方案为了保持业务的连续性,从两个层面来考虑: ①一个是从主 ...

随机推荐

HTTP 协议详解
一.HTTP简介 1.HTTP协议,即超文本传输协议(Hypertext transfer protocol).是一种详细规定了浏览器和万维网(WWW = World Wide Web)服务器之间互相 ...
安装好kali要做的事
更换更新源 vim /etc/apt/sources.list #中科大deb http://mirrors.ustc.edu.cn/kali kali-rolling main non-free c ...
jdbctemplate 批量插入
public void batchImport(List<Map<String, Object>> list) { String sql = "insert into ...
修改.net反编译的dll
用.Net reflector 打开,配合reflexil工具. 有两种修改方法. 1.重写,试过,但不好用. 2.修改IL指令一般只需修改简单的if判断. 方法:找到需要修改的行,把brfalse ...
数据库表字段，DEFAULT NULL与NOT NULL DEFAULT
为什么要把字段设置成not null 呢? 1.空值是不占用空间的 2.mysql中的NULL其实是占用空间的,下面是来自于MYSQL官方的解释 “NULL columns require addit ...
matomo 开源网站分析平台
1.安装PHP https://www.jianshu.com/p/8d54a401ec06 yum remove php* yum -y install epel-release rpm -Uvh ...
awk技巧 nginx access.log
1.1 介绍 awk其名称得自于它的创始人 Alfred Aho .Peter Weinberger 和 Brian Kernighan 姓氏的首个字母.实际上 AWK 的确拥有自己的语言: AWK ...
Codeforces Round #541 (Div. 2)
Codeforces Round #541 (Div. 2) http://codeforces.com/contest/1131 A #include<bits/stdc++.h> us ...
SDK和API
软件开发工具包(缩写:SDK.外语全称:Software Development Kit)一般都是一些软件工程师为特定的软件包.软件框架.硬件平台.操作系统等建立应用软件时的开发工具的集合. 笔记:开 ...
RxJS之AsyncSubject
AsyncSubject 是另一个 Subject 变体,只有当 Observable 执行完成时(执行 complete()),它才会将执行的最后一个值发送给观察者. import { Compon ...

[Hbase]Hbase容灾方案

[Hbase]Hbase容灾方案的更多相关文章

随机推荐

热门专题