impala 表迁移方式 partquet数据文件移动方法
1、原表查询:
select count(*) from edm.ucard_wxd0123 where stat_dt = '2024-01-09' and id_no = '110101199003072893'
2、查看数据文件
hadoop fs -ls /user/hive/warehouse/edm.db/ucard_wxd0123/stat_dt=2024-01-09
Found items
-rw-r--r-- impala hive -- : /user/hive/warehouse/edm.db/ucard_wxd0123/stat_dt=--/214b1691c9ed3b01-dfd95f5f00000000_894437036_data..parq
-rw-r--r-- impala hive -- : /user/hive/warehouse/edm.db/ucard_wxd0123/stat_dt=--/214b1691c9ed3b01-dfd95f5f00000001_1509455238_data..parq
3、创建一张表
create table edm.ucard_wxd0123_20191211 like edm.ucard_wxd0123
4、获取parquet 格式文件
hadoop fs -get /user/hive/warehouse/edm.db/ucard_wxd0123/stat_dt=--/214b1691c9ed3b01-dfd95f5f00000000_894437036_data..parq
hadoop fs -get /user/hive/warehouse/edm.db/ucard_wxd0123/stat_dt=--/214b1691c9ed3b01-dfd95f5f00000001_1509455238_data..parq
5、创建分区目录
hadoop fs -mkdir /user/hive/warehouse/edm.db/ucard_wxd0123_20191211/stat_dt=2024-01-09
6、上传partquet文件
hadoop fs -put 214b1691c9ed3b01-dfd95f5f00000000_894437036_data..parq /user/hive/warehouse/edm.db/ucard_wxd0123_20191211/stat_dt=--/
hadoop fs -put 214b1691c9ed3b01-dfd95f5f00000001_1509455238_data..parq /user/hive/warehouse/edm.db/ucard_wxd0123_20191211/stat_dt=--/
7、Hive中修复表信息
msck REPAIR TABLE edm.ucard_wxd0123_20191211;
8、Impala 中刷新元数据
Invalidate metadata edm.ucard_wxd0123_20191211;
9、进行查询
select * from edm.ucard_wxd0123_20191211;
可以显示结果
总结:我们可以迁移partquet 文件到指定分区,然后进行查询数据。
impala 表迁移方式 partquet数据文件移动方法的更多相关文章
- 表空间tablespace,数据文件datafiles,和控制文件control files介绍
https://docs.oracle.com/cd/B19306_01/server.102/b14220/physical.htm#i5919 本文系翻译 表空间tablespace,数据文件da ...
- ORACLE中如何找出大表分布在哪些数据文件中?
ORACLE中如何找出大表分布在哪些数据文件中? 在ORACLE数据中,我们能否找出一个大表的段对象分布在哪些数据文件中呢? 答案是可以,我们可以用下面脚本来找出对应表的区.段分别位于哪些数据文件 ...
- Oracle 12C 新特性之在线重命名、迁移活跃的数据文件
Oracle 数据库 12c 版本中对数据文件的迁移或重命名不再需要太多繁琐的步骤,可以使用 ALTER DATABASE MOVE DATAFILE 这样的 SQL 语句对数据文件进行在线重命名和移 ...
- ORACLE数据库数据文件转移方法(不同于move方法)
1) 手动拷贝要转移的数据数据文件'd:\OracleData\GWTABLE42.DBF'到新的位置'E:\OracleData\GWTABLE42.DBF'. 2) 把数据文件所属的表空间Offl ...
- web 表单方式上传文件方法(不用flash插件)
原理:使用表单的input type="file"标签,通过ajax提交表单请求,后台获取请求中的文件信息,进行文件保存操作 由于我测试用的做了一个上传文件和上传图片方法,所以我有 ...
- c#自带压缩类实现数据库表导出到CSV压缩文件的方法
在导出大量CSV数据的时候,常常体积较大,采用C#自带的压缩类,可以方便的实现该功能,并且压缩比例很高,该方法在我的开源工具DataPie中已经经过实践检验.我的上一篇博客<功能齐全.效率一流的 ...
- sql 用xml方式插入数据乱码问题解决方法
sql 使用存储过程 参数为xml字符串 xml不要写编码,如下 <?xml version=\"1.0\" ?><root>数据字符串</root& ...
- Jquery构建Form表单Post提交数据的简单方法
$.extend({ PostSubmitForm: function (url, args) { var body = $(document.body), form = $("<fo ...
- 表空间与数据文件Offline,online的区别
首先明确,表空间与数据文件的关系:Oracle数据库表空间有两种,一种smallfile小文件表空间(默认),另一种bigfile大文件表空间: 默认表空间与数据文件的关系:允许一对多的处理方式,一个 ...
随机推荐
- TCP和TLS/SSL会话细节
TCP数据段格式说明TCP建立连接和断开连接细节Https如何保证通信安全一次Https网络请求通信细节网络数据包分析工具wireshark的使用问题:SYN.ACK.FIN具体含义是什么?TCP建立 ...
- VS编译出错不自动运行上次的程序
- Linux记录-批量安装软件服务(转载)
#!/bin/bash # 安装函数 install(){ for soft in $* do echo "$soft"安装中... y ...
- expect 实现自动交互脚本
1. 说明 在编写脚本时,可能会遇到需要在另一台主机上执行一个命令,或者在本机拷贝另一台主机内的一个文件.如果两台主机之间没有做互信,就会牵扯到用户输入密码的交互过程,这对编写自动脚本来说, 就行不通 ...
- Linux入门-1
操作系统 列举系统:Windows Mac Linux ios Android 操作系统的定义:操作系统是一个用来协调.管理和控制计算机硬件和软件资源的系统程序,它位于硬件和应用程序之间. ...
- 01. xadmin表单的自定义排版
xadmin表单的自定义布局(重写 get_form_layout()) apps.courses.adminx.py class NewCoursesAdmin(object): list_disp ...
- vue之项目打包部署生产环境前需要注意的问题!
我们在本地写好代码,然后打包上线前需要修改相关的配置文件,否则项目无法正常运行,主要是路径不对,找不到相关文件. 1.修改config > index.js(如下图) 2.在build > ...
- Djang简单使用
用户访问内容 用户能够访问的所有的资源,都是程序猿提前暴露的,如果没有暴露,用户是不能进行访问的. diango重启的问题 当我们更改django中的代码的时候,django内部会检测到我们更 ...
- netty 实现心跳检查--断开重连--通俗易懂
一.心跳介绍 网络中的接收和发送数据都是使用操作系统中的SOCKET进行实现.但是如果此套接字已经断开,那发送数据和接收数据的时候就一定会有问题. 1.心跳机制: 是服务端和客户端定时的发送一个心跳包 ...
- Java线程同步synchronized的理解
JVM中(留神:马上讲到的这两个存储区只在JVM内部与物理存储区无关)存在一个主内存(Main Memory),Java中所有的变量存储在主内存中,所有实例和实例的字段都在此区域,对于所有的线程是共享 ...