场景

HBase表TaskLog中有20.55G数据(20553078551Byte),目前存放在热存储中,现在要移至冷热储,并进行还原。

HBase目录:hbase/data/default

冷目录:Cold_Tasklog/TaskLog_20170817

其它:冷热两个存储账号的AccountName、AccountKey、ContainerName都已经准备好。

备份还原过程

1、  在Hot上

a)         disable ‘TaskLog’:执行hbase命令

b)         创建Container:backup

c)         将’TaskLog’目录下的文件复制到backup/ TaskLog_20170817下:Azcopy命令

AzCopy /Source:https://hotaccountname.blob.core.chinacloudapi.cn/hdptestjn/hbase/data/default/TaskLog /Dest:https://coldaccountname.blob.core.chinacloudapi.cn/backup/TaskLog_20170817 /SourceKey:hotaccountkey /DestKey:coldaccountkey /S

操作结束 后,TaskLog_20170817目录大小为20553078551Byte,同源文件

d)         将’TaskLog’文件复制到backup/下,进行备份(防止操作不成功):Azcopy命令

AzCopy /Source:https://hotaccountname.blob.core.chinacloudapi.cn/hdptestjn/hbase/data/default /Dest:https://hotaccountname.blob.core.chinacloudapi.cn/backup /SourceKey:hotaccountkey /DestKey:hotaccountkey /Pattern:TaskLog

2、  将Hot存储上的TaskLog目录,迁移到Cold存储上:Azcopy命令

AzCopy /Source:https://hotaccountname.blob.core.chinacloudapi.cn/hdptestjn/hbase/data/default/TaskLog /Dest:https://coldaccountname.blob.core.chinacloudapi.cn/hbasecold/Cold_Tasklog/TaskLog_20170817 /SourceKey:hotaccountkey /DestKey:coldaccountkey /S

3、  在Hot清空TaskLog:执行Hbase命令

Enable ‘TaskLog’

Truncate ‘TaskLog’

Disable ‘TaskLog’

此时数据清空,大小为0

4、  从Cold中还原:Azcopy命令

AzCopy /Source:https://coldaccountname.blob.core.chinacloudapi.cn/hbasecold/Cold_Tasklog/TaskLog_20170817 /Dest:https://hotaccountname.blob.core.chinacloudapi.cn/hdptestjn/hbase/data/default/TaskLog /SourceKey:coldaccountkey /DestKey:hotaccountkey /S

还原后的TaskLog数据量统计:20553078551Byte,同原始大小

5、  在Hot,启用TaskLog,检查数据:Hbase命令

Enable ‘TaskLog’

Scan ‘TaskLog’ ----0行

修复元数据:

hbase hbck -repair 'TaskLog'  -ignorePreCheckPermission  -fixMeta

时间较长。。。。。

修复后,数据可以查询了。

使用Azcopy在Azure上进行HBase的冷热备份还原的更多相关文章

  1. 如何在云端部署SAP HANA实战, Azure 上的 SAP HANA(大型实例)概述和体系结构

    什么是 Azure 上的 SAP HANA(大型实例)? Azure 上的 SAP HANA(大型实例)是一种针对 Azure 的独特解决方案. 除了提供 Azure 虚拟机以用于部署和运行 SAP ...

  2. Azure上的几个坑

    此文用于记录在使用Azure中国版时遇到的一些“坑”. 1.虚拟机备份/还原 在某些场景中,使用备份/还原功能来创建(克隆)虚拟机比使用capture的image要方便很多.虚拟机备份后,执行还原操作 ...

  3. Azure上A/D系列虚拟机到DS系列迁移(1)

    有一些用户在刚开始的时候创建了A7,D14等虚拟机来跑一些IO要求比较高的应用,比如Oracle数据库,MySQL数据库,等到用户量上来之后,性能不够,需要升级数据磁盘到SSD固态硬盘,但是问题是: ...

  4. 统计Azure存储的HBase各表数据量

    场景:HBase存储在Azure上,现在通过访问Azure Storage的接口,获取HBase中各个表的数据量. 注意: 1.Azure存储,默认的副本数为2,即共存3份,但只收1份的费用,取到的s ...

  5. Azure 上通过 SendGrid 发送邮件

    SendGrid 是什么? SendGrid 是架构在云端的电子邮件服务,它能提供基于事务的可靠的电子邮件传递. 并且具有可扩充性和实时分析的能力.常见的用例有: 自动回复用户的邮件 定期发送信息给用 ...

  6. 在公有云AZURE上部署私有云AZUREPACK以及WEBSITE CLOUD(二)

    前言 (二)建立虚拟网络环境,以及域控和DNS服务器   1搭建虚拟网络环境 在Azure上创建虚拟网络.本例选择的是东南亚数据中心.后面在创建虚机的时候,也选择这个数据中心. VNet Name: ...

  7. 在Azure上的VM镜像库中找到想要的镜像

    Azure上的虚机镜像库中, 有很多的镜像,其中当然也包括了用户自定义上传的镜像. 在Powershell中如果想使用这些镜像的话, 则需要知道其名称 下面这条命令,可以获得所有的镜像信息 $imag ...

  8. 在Azure上部署Windows Server Core

    作为服务器操作系统,图形界面真心有些多余了,这也是很多人喜欢Linux服务器的原因之一.从Windows Server 2008开始,微软提供了Server Core版本,其实就是一个没有图形界面的服 ...

  9. 在 Azure 上使用 Docker运行 Mono

    Docker 是最近相当热门的一个名词,它是一个基于 Linux Container 的轻量化的虚拟技术,而微软也相当积极与 Docker 合作,在 Azure 上支持这个火热的技术,并且提供简单的方 ...

随机推荐

  1. Spring 创建 IOC 容器时加载配置文件的几种方式

    一.ClassPathXmlApplicationContext 类路径加载 1. 使用 classpath 路径,classpath 前缀加不加都可以. ApplicationContext act ...

  2. Elasticsearch数据类型

    Elasticsearch自带的数据类型是Lucene索引的依据,也是做手动映射调整的依据.映射中主要就是针对字段设置类型以及类型相关参数.1.JSON基础类型如下:字符串:string数字:byte ...

  3. Algorithm——整数反转

    一.问题 给出一个 32 位的有符号整数,你需要将这个整数中每位上的数字进行反转. 示例 1: 输入: 123 输出: 321 示例 2: 输入: -123 输出: -321 示例 3: 输入: 12 ...

  4. BZOJP1096[ZJOI2007]仓库建设——solution

    Description L公司有N个工厂,由高到底分布在一座山上.如图所示,工厂1在山顶,工厂N在山脚.由于这座山处于高原内陆地区(干燥少雨),L公司一般把产品直接堆放在露天,以节省费用.突然有一天, ...

  5. axios中设置post请求,后台却无法识别参数

    场景:在使用iview时,定义api请求时,代码如下 export const delWord = (data) => { return axios.request({ url: '/words ...

  6. AJAX 概念 优势 发展前景 工作原理 底层技术 状态 缺点 框架

    1. 概念 Ajax asynchronous JavaScript and XML , 异步js和xml. 这种解释已经过时了, 现在ajax就是, 允许浏览器和服务器通信, 而无需刷新当前页面的技 ...

  7. Flutter知识点:数据存储之sqflite

    sqflite是一款轻量级的关系型数据库,类似SQLite. 在Flutter平台我们使用sqflite库来同时支持Android 和iOS. 使用介绍 1.首选需要在pubspec.yaml 导入库 ...

  8. eclipse调试 10个技巧

    先提三点 不要使用System.out.println作为调试工具 启用所有组件的详细的日志记录级别 使用一个日志分析器来阅读日志 1.条件断点 想象一下我们平时如何添加断点,通常的做法是双击行号的左 ...

  9. 【转】PHP如何快速读取大文件

    在PHP中,对于文件的读取时,最快捷的方式莫过于使用一些诸如file.file_get_contents之类的函数,简简单单的几行代码就能 很漂亮的完成我们所需要的功能.但当所操作的文件是一个比较大的 ...

  10. SSM 框架-04-使用maven创建web项目

    SSM 框架-04-使用maven创建web项目 本篇介绍使用MAVEN来管理jar包,就不用一个一个去添加和下载jar包了,直接在maven配置文件中配置就可以了,maven可以帮助我们自动下载.本 ...