一、 Hive数据迁移

　　场景：两个Hadoop平台集群之间Hive表迁移。

　　基本思路：Hive表元数据和文件数据export到HDFS文件，通过Distcp将HDFS迁移到另一个集群的HDFS文件，再通过import在新Hive中建表；

　　1.Hive数据导出

　　　　此步骤在原平台执行将Hive表元数据和文件数据export到平台HDFS文件

　　　　1）获得hive表的元数据信息

　　　　　　ret=$(hive -e 'show tables;' | grep -v _es | grep -v _hb | grep -v importinfo)

　　　　　　ret中存放hive所有表的表名。

　　　　2）导出hive表元数据和hive管理hdfs数据

　　　　　　hive -e "export table $tem to '/tmp/hive-export/$tem';"

　　　　　　执行此命令后可以看到hdfs输出目录下有元数据和文件数据

　　　　　　查看hadoop fs -cat /tmp/hive-export/[table_name]/_metadata元文件

　　2. Hive数据迁移

　　　　用distcp从原平台将/tmp/hive-export/下数据迁移到新平台。

　　　　　　hadoop distcp hdfs://10.0.11.205:8020/tmp/hive-export hdfs://10.0.11.91:8020/tmp

　　　　执行成功后新平台tmp目录下会多出拷贝的数据文件。

　　3.新集群数据导入

　　　　1）获得hive表名

　　　　　　Hive表名为/tmp/hive-export/下的路径名

　　　　　　使用hadoop fs -ls获得所有的表名

　　　　2）执行导入命令

　　　　　　hive -e "import table [table_name] from '/tmp/hive-export/[table_name]’;"

　　　　　　可以看到hive上新生成了表,自此跨平台Hive表迁移完成。

二、 Hbase数据迁移

　　1.Hbase数据导出

　　　　在原平台上使用org.apache.hadoop.hbase.mapreduce.Export命令导出hbase数据到原平台的HDFS上

　　　　　　hbase org.apache.hadoop.hbase.mapreduce.Export [table_name] [hdfs_directory]

　　2.Hbase数据迁移

　　　　此步骤将导出的数据文件拷贝到新集群

　　　　　　hadoop distcp hdfs://10.0.11.205:8020[hdfs_directory] hdfs://10.0.11.91:8020/tmp

　　3.Hbase数据导入

　　　　hbase org.apache.hadoop.hbase.mapreduce.Import [table_name] [hdfs_directory]

　　　　注：1）使用全路径，不能使用相对路径

　　　　　 2）在执行import之前，需要将hbase表在新集群建好。

Hive及HBase数据迁移的更多相关文章

HBase 数据迁移方案介绍
一.前言 HBase数据迁移是很常见的操作,目前业界主要的迁移方式主要分为以下几类: 图1.HBase数据迁移方案从上面图中可看出,目前的方案主要有四类,Hadoop层有一类,HBase层有三类.下 ...
HBase 数据迁移方案介绍 (转载)
原文地址:https://www.cnblogs.com/ballwql/p/hbase_data_transfer.html 一.前言 HBase数据迁移是很常见的操作,目前业界主要的迁移方式主要分 ...
4.HBASE数据迁移方案（之snapshot）：
4.HBASE数据迁移方案: 4.1 Import/Export 4.2 distcp 4.3 CopyTable 4.4 snapshot 快照方式迁移(以USER_info:user_lo ...
HBase 数据迁移
最近两年负责 HBase,经常被问到一些问题, 本着吸引一些粉丝.普及一点HBase 知识.服务一点阅读人群的目的,就先从 HBase 日常使用写起,后续逐渐深入数据设计.集群规划.性能调优.内核源码 ...
HBase 数据迁移方案介绍（转载）
原文链接:https://www.cnblogs.com/ballwql/p/hbase_data_transfer.html 一.前言 HBase数据迁移是很常见的操作,目前业界主要的迁移方式主要分 ...
HBase数据迁移至Hive
背景:需要将HBase中表xyz(列簇cf1,列val)迁移至Hive 1. 建立Hive和HBase的映射关系 1.1 运行hive shell进入hive命令行模式,运行如下脚本 CREA ...
HBase数据迁移到Kafka实战
1.概述在实际的应用场景中,数据存储在HBase集群中,但是由于一些特殊的原因,需要将数据从HBase迁移到Kafka.正常情况下,一般都是源数据到Kafka,再有消费者处理数据,将数据写入HBas ...
Hive 实现HBase 数据批量插入
HBase 数据的插入可以使用Java API 来写Java 程序逐条倒入,但是不是很方便.利用Hive自带的一个Jar包,可以建立Hive和HBase的映射关系利用Hive 的insert可以将批 ...
伪分布式hbase数据迁移汇总
https://www.jianshu.com/p/990bb550be3b hbase0.94.11(hadoop为1.1.2,此电脑ip为172.19.32.128)向hbase1.1.2 (ha ...

随机推荐

Atlassian官方合作伙伴
Atlassian官方合作伙伴 http://atlassian.csdn.net/m/btc/atlassian/index
RS导出Excel交叉表角对应的列占用多列问题
在Cognos报表展示的时候,很多用户为了计算会把数据报表导出成excel然后再做统计,于是乎我做的一张报表导出成Excel的时候就出现了这样的问题从上图可以看出交叉表角对应的列 ‘一级手术’和‘二 ...
Kettle中txt类型数据源作为输入需要注意的地方
文本类型在kettle中作为数据源的时候,需要注意的几点,ktr的机构如下图 1:txt文本的格式 2:文本输入控件的设置 --2.1:选择文件所在物理位置 --2.2:设置分隔符,注意头部数量去掉, ...
linux apache服务器优化建议整理(很实用)
转载:http://www.cnblogs.com/zhongbin/archive/2013/06/11/3131865.html 1.apache服务器的time_wait过多 fin_wait1 ...
Burning widget
This is a widget that we can see in Nero, K3B, or other CD/DVD burning software. #!/usr/bin/python # ...
No implementation found for long com.baidu.platform.comjni.map.commonmemcache.JNICommonMemCache.Create()
3-21 10:14:20.833 2892-2892/? E/art: No implementation found for long com.baidu.platform.comjni.map. ...
UML学习（二）- 用例图
UML用例图用例图主要用来图示化系统的主事件流程,它主要用来描述客户的需求,即用户希望系统具备的完成一定功能的动作,通俗地理解用例就是软件的功能模块,所以是设计系统分析阶段的起点,设计人员 ...
POJ 2112 Optimal Milking（最大流）
题目链接:http://poj.org/problem?id=2112 Description FJ has moved his K (1 <= K <= 30) milking mach ...
vcs github gitlab git名词解释
vcs:version control system git:一个版本管理工具,从git上clone,除了代码,还会把版本信息也给你clone下来. github:一个基于git的代码管理网站,支持公 ...
nginx配置静态文件过期时间
1. 编辑虚拟主机配置文件/usr/local/nginx/conf/vhosts/huangzhenping.conf 说明:采用location方式 1 2 3 4 5 6 7 8 9 10 l ...

Hive及HBase数据迁移

一、 Hive数据迁移

1.Hive数据导出

2. Hive数据迁移

3.新集群数据导入

二、 Hbase数据迁移

1.Hbase数据导出

2.Hbase数据迁移

3.Hbase数据导入

Hive及HBase数据迁移的更多相关文章

随机推荐

热门专题

　　1.Hive数据导出

　　2. Hive数据迁移

　　3.新集群数据导入

　　1.Hbase数据导出

　　2.Hbase数据迁移

　　3.Hbase数据导入