场景

HBase表TaskLog中有20.55G数据(20553078551Byte),目前存放在热存储中,现在要移至冷热储,并进行还原。

HBase目录:hbase/data/default

冷目录:Cold_Tasklog/TaskLog_20170817

其它:冷热两个存储账号的AccountName、AccountKey、ContainerName都已经准备好。

备份还原过程

1、  在Hot上

a)         disable ‘TaskLog’:执行hbase命令

b)         创建Container:backup

c)         将’TaskLog’目录下的文件复制到backup/ TaskLog_20170817下:Azcopy命令

AzCopy /Source:https://hotaccountname.blob.core.chinacloudapi.cn/hdptestjn/hbase/data/default/TaskLog /Dest:https://coldaccountname.blob.core.chinacloudapi.cn/backup/TaskLog_20170817 /SourceKey:hotaccountkey /DestKey:coldaccountkey /S

操作结束 后,TaskLog_20170817目录大小为20553078551Byte,同源文件

d)         将’TaskLog’文件复制到backup/下,进行备份(防止操作不成功):Azcopy命令

AzCopy /Source:https://hotaccountname.blob.core.chinacloudapi.cn/hdptestjn/hbase/data/default /Dest:https://hotaccountname.blob.core.chinacloudapi.cn/backup /SourceKey:hotaccountkey /DestKey:hotaccountkey /Pattern:TaskLog

2、  将Hot存储上的TaskLog目录,迁移到Cold存储上:Azcopy命令

AzCopy /Source:https://hotaccountname.blob.core.chinacloudapi.cn/hdptestjn/hbase/data/default/TaskLog /Dest:https://coldaccountname.blob.core.chinacloudapi.cn/hbasecold/Cold_Tasklog/TaskLog_20170817 /SourceKey:hotaccountkey /DestKey:coldaccountkey /S

3、  在Hot清空TaskLog:执行Hbase命令

Enable ‘TaskLog’

Truncate ‘TaskLog’

Disable ‘TaskLog’

此时数据清空,大小为0

4、  从Cold中还原:Azcopy命令

AzCopy /Source:https://coldaccountname.blob.core.chinacloudapi.cn/hbasecold/Cold_Tasklog/TaskLog_20170817 /Dest:https://hotaccountname.blob.core.chinacloudapi.cn/hdptestjn/hbase/data/default/TaskLog /SourceKey:coldaccountkey /DestKey:hotaccountkey /S

还原后的TaskLog数据量统计:20553078551Byte,同原始大小

5、  在Hot,启用TaskLog,检查数据:Hbase命令

Enable ‘TaskLog’

Scan ‘TaskLog’ ----0行

修复元数据:

hbase hbck -repair 'TaskLog'  -ignorePreCheckPermission  -fixMeta

时间较长。。。。。

修复后,数据可以查询了。

使用Azcopy在Azure上进行HBase的冷热备份还原的更多相关文章

  1. 如何在云端部署SAP HANA实战, Azure 上的 SAP HANA(大型实例)概述和体系结构

    什么是 Azure 上的 SAP HANA(大型实例)? Azure 上的 SAP HANA(大型实例)是一种针对 Azure 的独特解决方案. 除了提供 Azure 虚拟机以用于部署和运行 SAP ...

  2. Azure上的几个坑

    此文用于记录在使用Azure中国版时遇到的一些“坑”. 1.虚拟机备份/还原 在某些场景中,使用备份/还原功能来创建(克隆)虚拟机比使用capture的image要方便很多.虚拟机备份后,执行还原操作 ...

  3. Azure上A/D系列虚拟机到DS系列迁移(1)

    有一些用户在刚开始的时候创建了A7,D14等虚拟机来跑一些IO要求比较高的应用,比如Oracle数据库,MySQL数据库,等到用户量上来之后,性能不够,需要升级数据磁盘到SSD固态硬盘,但是问题是: ...

  4. 统计Azure存储的HBase各表数据量

    场景:HBase存储在Azure上,现在通过访问Azure Storage的接口,获取HBase中各个表的数据量. 注意: 1.Azure存储,默认的副本数为2,即共存3份,但只收1份的费用,取到的s ...

  5. Azure 上通过 SendGrid 发送邮件

    SendGrid 是什么? SendGrid 是架构在云端的电子邮件服务,它能提供基于事务的可靠的电子邮件传递. 并且具有可扩充性和实时分析的能力.常见的用例有: 自动回复用户的邮件 定期发送信息给用 ...

  6. 在公有云AZURE上部署私有云AZUREPACK以及WEBSITE CLOUD(二)

    前言 (二)建立虚拟网络环境,以及域控和DNS服务器   1搭建虚拟网络环境 在Azure上创建虚拟网络.本例选择的是东南亚数据中心.后面在创建虚机的时候,也选择这个数据中心. VNet Name: ...

  7. 在Azure上的VM镜像库中找到想要的镜像

    Azure上的虚机镜像库中, 有很多的镜像,其中当然也包括了用户自定义上传的镜像. 在Powershell中如果想使用这些镜像的话, 则需要知道其名称 下面这条命令,可以获得所有的镜像信息 $imag ...

  8. 在Azure上部署Windows Server Core

    作为服务器操作系统,图形界面真心有些多余了,这也是很多人喜欢Linux服务器的原因之一.从Windows Server 2008开始,微软提供了Server Core版本,其实就是一个没有图形界面的服 ...

  9. 在 Azure 上使用 Docker运行 Mono

    Docker 是最近相当热门的一个名词,它是一个基于 Linux Container 的轻量化的虚拟技术,而微软也相当积极与 Docker 合作,在 Azure 上支持这个火热的技术,并且提供简单的方 ...

随机推荐

  1. layui使用 ——父,子页面传值

    页面传值是非常常用的,layui自带弹窗功能,但是内置使用的是location.href 暂时没找到方法条件请求头,所以在后台需要放开拦截器, layer.open({ type : 2, title ...

  2. golang 的 sync.WaitGroup

    WaitGroup的用途:它能够一直等到所有的goroutine执行完成,并且阻塞主线程的执行,直到所有的goroutine执行完成. 官方对它的说明如下: A WaitGroup waits for ...

  3. KaTeX.js

    KaTeX.js 官网:https://khan.github.io/KaTeX/

  4. 安装使用jupyter

    介绍 jupyter是IPython剥离出来成为一个语言无关的独立软件包. jupyter已经支持50多种语言的内核,包括Lisp.R.F#.Perl.Ruby.Scala等.事实上即使IPython ...

  5. 什么是J2EE

    什么是J2EE 一.准备篇 1 什么是J2EE?它和普通的Java有什么不同? 答:J2EE全称为Java2 Platform Enterprise Edition. "J2EE平台本质上是 ...

  6. selenium元素定位方法

    一.如何找到页面元素 Webdriver的findElement方法可以用来找到页面的某个元素,最常用的方法是用id和name查找.下面介绍几种比较常用的方法. 1.1By ID 假设页面写成这样:i ...

  7. IEC62304-2006解读

    IEC62304强调医疗软件在明确和满足其预期用途的前提下,不能引发不可接受的风险 62304提供一个医疗软件开发的框架,并指出框架下每个过程的要求,62304将过程分解为若干活动,活动分解为若干任务 ...

  8. Redis Windows环境启动

    1.找到redis安装目录 2.cmd 目录 3.输入redis-server.exe redis.windows.conf 启动成功

  9. google学习

    https://developers.google.com/machine-learning/crash-course/ https://developers.google.com/machine-l ...

  10. ProxySQL读写分离

    我们首先看一下自己的环境: MHA已经搭建: master: slave: slave: MHA manager在172.16.16.34,配置文件如下: [root@localhost bin]# ...