(1)     什么是快照

    快照就是一份元信息的合集,允许管理员恢复到表的先前状态,快照不是表的复制而是一个文件名称列表,因而不会复制数据。

    完全快照恢复是指恢复到之前的表结构以及当时的数据快照之后发生的数据不会恢复。

(2)     快照的作用

    Hbase中存在的备份或克隆表的方法就是使用复制/导出表或者在关闭表之后拷贝hdfs中的所有的hfile。复制/导出时通过一些列工具调用mapreduce来扫描并复制表,这样子会对regionserver有直    接的影响,关闭表会停止所有的读写操作,实际环境中往往无法接受。

    相比之下,hbase的快照允许管理员不拷贝数据直接克隆一张表,这对服务器产生的影响最小。将快照导出至其他集群不会直接影响到任何服务器,导出只是带有一些额外逻辑的群间数据同步。

(3)     快照操作

      a)       生成快照:本操作尝试对指定表生成快照。如果集群在执行数据均衡、分割或合并等操作时,可能会一起操作失败,可以现对该表进行快照操作。

          snapshot  ‘tablename’ , ‘table-snapshot’   -->生成表的快照

          list_snapshots   --à查看所有的快照

      b)       克隆快照:本操作使用与指定快照相同的结构数据构建一张新表。操作结果会生成一张有完整功能的表,对该表的任意修改不会对元彪或者快照产生影响。

          clone_snapshot  ‘table-snapshot’ ,’ new-tablename’  --->克隆快照,并生成一张新表,修改新表不会影响原表

      c)        还原快照:本操作将表结构和数据恢复到生成快照时的状态。

          restore_snapshot ‘snapshot-name’

          说明:snapshot-name是对应表的快照,在还原之前请将原表disable。还原之后再enable原表。

      d)       删除快照:本操作将系统中的快照删除,释放未共享的磁盘空间,而且不会影响其他克隆或者快照。

          delete_snapshot  ‘snapshotname’

      e)       导出快照:本操作将快照数据和元数据复制到其他集群。操作只会涉及hdfs,不会与master或者服务器产生任何联系,因此hbase集群可以关闭。

          Hbase  org.apache.hadoop.hbase.snapshot.ExportSnapshot  -snapshot  snapshotname  -copy-to  hdfs:///server2:8082/hbase

(4)     快照的优势

    导出快照与复制/导出表除了更好保持一致性外,主要的不同在于导出快照是在hdfs的层面操作。这意味着Master和服务器与操作无关。因此不需要为不必要的数据创建缓存空间,也不会有扫描过     程,因为大量对象创建引起的GC暂停。对于hbase来说主要性能影响就是datanode额外的网络和磁盘负载。

HBase的快照技术的更多相关文章

  1. 利用HBase的快照功能来修改表名

    hbase的快照功能常常被用来做数据的恢复的,但是由于项目的特殊需求需要改hbase表的表名.在官网上通过快照功能来修改hbase表名的用法: 下面展示用shell命令的和Java api两种方式: ...

  2. vmware vSphere克隆与快照技术

    通过Web vCenter我们可以很容易的对虚拟机进行管理,通过克隆技术或创建模板,我们可以迅速的创建虚拟机,我们也可以通过快照技术去捕获虚拟机的一些状态,比如说虚拟机的内存.设置或者虚拟磁盘的情况等 ...

  3. 再谈 COW、ROW 快照技术

    目录 目录 前言 快照与备份的区别 快照技术 增量快照之 COW 增量快照之 row 前言 在经过了一段时间的实践之后,再次回顾 COW/ROW 快照技术的实现原理,温故而知新. 快照与备份的区别 传 ...

  4. ROW/COW 快照技术原理解析

    NOTE:ROW/COW 最新更新请跳转<再谈 COW.ROW 快照技术> 目录 目录 快照与备份的区别 Snapshot 快照技术 全量快照 增量快照 COW 写时拷贝快照技术 ROW ...

  5. hbase读取快照数据-lzo压缩遇到的问题

    1.读取hbase快照数据时报UnsatisfiedLinkError: no gplcompression in java.library.path错: 2019-09-04 17:36:07,44 ...

  6. HDFS的快照原理和Hbase基于快照的表修复

    前一篇文章<HDFS和Hbase误删数据恢复>主要讲了hdfs的回收站机制和Hbase的删除策略.根据hbase的删除策略进行hbase的数据表恢复.本文主要介绍了hdfs的快照原理和根据 ...

  7. hbase迁移快照ExportSnapshot时遇到的错

    1.Cannot allocate memory 报错信息: Java HotSpot(TM) 64-Bit Server VM warning: INFO: os::commit_memory(0x ...

  8. centos6.5虚拟机快照技术

    一.查看现有磁盘镜像格式与转换 查看磁盘格式 [root@localhost ~]# qemu-img info /var/lib/libvirt/images/centos7.img image: ...

  9. Hadoop生态上几个技术的关系与区别:hive、pig、hbase 关系与区别

    初接触Hadoop技术的朋友肯定会对它体系下寄生的个个开源项目糊涂了,我敢保证Hive,Pig,HBase这些开源技术会把你搞的有些糊涂,不要紧糊涂的不止你一个,如某个菜鸟的帖子的疑问,when to ...

随机推荐

  1. Python—模块

    一.模块 模块,是用一堆代码实现了某个功能的代码集合,模块分为三种:自定义模块(自己定义).内置模块(python自带).开源模块 导入模块 (1).导入一个py文件,解释器解释该py文件 (2).导 ...

  2. [充电][库]Zlib文件压缩和解压

    原文链接: http://www.cnblogs.com/fairycao/archive/2009/12/09/1620414.html 开源代码:http://www.zlib.net/zlib使 ...

  3. Iptables防火墙

    1 位置 使用vim /usr/sysconfig/iptables 2 启动.关闭.保存 service iptables stop service iptables start service i ...

  4. sprint2 项目的粗略展示

  5. 2015弱校联盟(1) - C. Censor

    C. Censor Time Limit: 2000ms Memory Limit: 65536KB frog is now a editor to censor so-called sensitiv ...

  6. Android中的动态加载机制

    在目前的软硬件环境下,Native App与Web App在用户体验上有着明显的优势,但在实际项目中有些会因为业务的频繁变更而频繁的升级客户端,造成较差的用户体验,而这也恰恰是Web App的优势.本 ...

  7. python 学习笔记九 队列,异步IO

    queue (队列) 队列是为线程安全使用的. 1.先入先出 import queue #测试定义类传入队列 class Foo(object): def __init__(self,n): self ...

  8. SQL2008游标

    最近让写一个自动生成数据的存储过程,其中会遍历表中数据并做出相应处理,因为数据量不算太大所以使用到了游标,初识游标遇到几个小问题,所以来和大家一起分享一下: 使用游标的五个步骤: 1.声明游标 语法: ...

  9. 20个Linux服务器安全强化建议(三)

    #11.配置iptables和TCPWrappers.   iptables 是一个Linux内核提供的,运行在用户空间的程序,它允许用户配置自己的防火墙策略.我们可以使用防火墙将不必要的流量过滤出去 ...

  10. End Routine

    声明:原创作品,转载时请注明文章来自SAP师太技术博客( 博/客/园www.cnblogs.com):www.cnblogs.com/jiangzhengjun,并以超链接形式标明文章原始出处,否则将 ...