Hive 复制分区表和数据

　　1. 非分区表:

　　　　复制表结构： create table new_table as select * from exists_table where 1=0;

　　　　复制表结构和数据： create table new_table as select * from exists_table;

　　2. 分区表:

-- 创建一个分区表

drop table if exists kimbo_test;

create table kimbo_test

(

order_id int,

system_flag string

)

PARTITIONED BY(dt string )

ROW FORMAT DELIMITED FIELDS TERMINATED BY '\001' LINES TERMINATED BY '\n'

STORED AS TEXTFILE

;

-- 插入数据

insert overwrite table kimbo_test partition(dt='')

values (186000983,'A'),(286000983,'B') ;

insert overwrite table kimbo_test partition(dt='')

values (386000983,'F'),(486000983,'W') ;

create table test_par like kimbo_test;

-- 用 as select 复制一个新表

create table test_par2 as select * from kimbo_test where dt='' limit 0;

-- 用 like 复制一个新表

create table test_par3 like kimbo_test;

-- 注意差异： as select 复制的是一个非分区表， like 复制的是一个分区表。

　　表结构截图：

　　3. 将原表的数据复制到新表（test_par3）

　　　　1. 创建新表: create table test_par3 like kimbo_test;

　　　　2. 将HDFS的数据文件复制一份到新表目录，hive cmd模式下： dfs -cp -f /user/hive/warehouse/kimbo_test/* /user/hive/warehouse/test_par3/

　　　　3. 修复分区元数据信息，hive cmd模式下： MSCK REPAIR TABLE test_par3;

　　结果查询：

Hive 复制分区表和数据的更多相关文章

Hive复制分区表和数据
1. 非分区表: 复制表结构: create table new_table as select * from exists_table where 1=0; 复制表结构和数据: create tab ...
一起学Hive——总结复制Hive表结构和数据的方法
在使用Hive的过程中,复制表结构和数据是很常用的操作,本文介绍两种复制表结构和数据的方法. 1.复制非分区表表结构和数据 Hive集群中原本有一张bigdata17_old表,通过下面的SQL语句可 ...
hive 修复元数据命令 & 如何快速复制一张hive的分区表
hive 元数据修复命令 msck repair table xxx; 也可以用于分区表的快速复制例如你需要从线上往线下导一张分区表,但是网又没有连通,你需要如何操作呢? 1.复制建表语句 2.从线 ...
hive（在大数据集合上的类SQL查询和表）学习
1.jdbc:mysql://localhost:3306/hive?createDatabaseIfNotExist=true&characterEncoding=UTF-8&use ...
hive加载json数据解决方案
hive官方并不支持json格式的数据加载,默认支持csv格式文件加载,如何在不依赖外部jar包的情况下实现json数据格式解析,本编博客着重介绍此问题解决方案首先创建元数据表: create EX ...
Hive数据导入——数据存储在Hadoop分布式文件系统中，往Hive表里面导入数据只是简单的将数据移动到表所在的目录中！
转自:http://blog.csdn.net/lifuxiangcaohui/article/details/40588929 Hive是基于Hadoop分布式文件系统的,它的数据存储在Hadoop ...
hive建表与数据的导入导出
建表: create EXTERNAL table tabtext(IMSI string,MDN string,MEID string,NAI string,DestinationIP string ...
使用hive访问elasticsearch的数据
使用hive访问elasticsearch的数据 1.配置将elasticsearch-hadoop-2.1.1.jar拷贝到hive/lib hive -hiveconf hive.aux.jar ...
ORACLE+PYTHON实战：复制A表数据到B表
最近在学习python ,看到了pythod的oracle,不仅可以一次fetch多条,也可以一次insert多条,想写一个复制A表数据到B表的程序来看看实际效率能不能提高.写完发现,非常惊艳!效率提 ...

随机推荐

【BZOJ2310】ParkII 插头DP
[BZOJ2310]ParkII Description Hnoi2007-Day1有一道题目 Park:给你一个 m * n 的矩阵,每个矩阵内有个权值V(i,j) (可能为负数),要求找一条回路, ...
Git - 忽略Xcode工程中UserInterfaceState.xcuserstate文件的问题
一.在同 .Git目录下创建.gitignore文件.在文件中加入如下内容: *.xcuserstate project.xcworkspace xcuserdata UserInterfaceSta ...
zookeeper 安装的三种模式
Zookeeper安装 zookeeper的安装分为三种模式:单机模式.集群模式和伪集群模式. 单机模式首先,从Apache官网下载一个Zookeeper稳定版本,本次教程采用的是zookeeper ...
Spark2 jar包运行完成，退出spark，释放资源
import org.apache.spark.sql.SparkSession import org.apache.spark.sql.Dataset import org.apache.spark ...
ubuntu下中文乱码解决方案(全)
转自 http://www.cnblogs.com/end/archive/2011/04/19/2021507.html 1.ibus输入法 Ubuntu 系统安装后已经自带了ibus输入法,在 ...
利用javascript判断文件是否存在
1 判断本地文件是否存在 var fso,s=filespec; // filespec="C:/path/myfile.txt" fso=new ActiveXObject(&q ...
pcl学习笔记（二）：点云类型
不同的点云类型前面所说的,pcl::PointCloud包含一个域,它作为点的容器,这个域是PointT类型的,这个域是PointT类型的是pcl::PointCloud类的模板参数,定义了点云的存 ...
关于matlab小记
目录: 1.函数取整 2.数据显示格式 3.三角函数运算 4.矩阵运算 5.函数句柄 6.二维函数图像绘制 7.符号对象 8.关于微积分 9.关于逻辑语句 10.关于运算符 ───────────── ...
Win_Server_2008 安装 Oracle_11g EM时上载EM资料失败
此问题本人也遇到过.在网上找到了解决方案.下部分引用IT PUB. 安装oracle11g 64位.创建数据库到快结束的时候,报告说EM无法创建.emca_2010_06_13_11_05_36.lo ...
插入排序之python
插入排序( Insert sort) 通过构建有序序列,对于未排序数据,在已排序序列中从后向前扫描,找到相应位置并插入: 由于不需要全部都比较完,所以排序速度优于冒泡和选择排序. #插入排序就像是斗地 ...

Hive 复制分区表和数据

Hive 复制分区表和数据的更多相关文章

随机推荐

热门专题