Hive导入导出数据的方法

育良书记 2024-09-01 04:19:58 原文

Hive导入数据的方式

官网文档：

LOAD DATA [LOCAL] INPATH 'filepath' [OVERWRITE] INTO TABLE tablename [PARTITION (partcol1=val1, partcol2=val2 ...)]

local参数为原始文件存储的位置，位置可以是

本地local
hdfs文件系统

overwrite参数

使用时会将表中的数据覆盖
不使用会在表中追加数据

partition参数为分区表加载

eg：

加载本地文件到hive表中

load data local inpath '/opt/datas/emp.txt' into table default.emp;

加载hdfs文件到hive表中

　　load data inpath '/user/user1/hive/datas/emp.txt' into table default.emp;

加载数据覆盖表中已有的数据

　　load data local inpath '/opt/datas/emp.txt' overwrite into table default.emp;

创建表时通过insert加载

　　create table default.emp_ci like emp;

　　insert into table default.emp_ci select * from default.emp;

创建表的时候通过location指定加载

　　...

Hive导出数据的方式

第一种，导出在本地文件中

　　insert overwrite local directory '/opt/datas/hive_exp_emp' select * from default.emp;

直接导出会有乱码，根据原有的表结构进行导出

insert overwrite local directory '/opt/datas/hive_exp_emp'

row format delimited fields terminated by '\t'

collection items terminated by '\n'

select * from default.emp;

注：

row format delimited fields terminated by '\t'

collection items terminated by '\n'

每行中的数据以\t隔开，每行数据以\n结束。

第二种，导出在本地文件中

　　bin/hive -e "select * from default.emp;" > /opt/datas/exp_res.txt

第三种，导出在hdfs文件系统中

　　insert overwrite directory '/user/user1/hive/hive_exp_emp' select * from default.emp;

Hive导入导出数据的方法的更多相关文章

Mysql & Hive 导入导出数据
---王燕行转列sql select split(concat_ws(',',collect_set(cast(smzq as string))),',')[1] ,split(concat_ws(' ...
hive导入导出数据案例
查询数据: use ods;set /user.password=ODS-SH;select * from base_cdma_all limit 10; use tag_bonc;select * ...
[转]mysql导入导出数据中文乱码解决方法小结
本文章总结了mysql导入导出数据中文乱码解决方法,出现中文乱码一般情况是导入导入时编码的设置问题,我们只要把编码调整一致即可解决此方法,下面是搜索到的一些方法总结,方便需要的朋友. linux系统中 ...
PLSQL导入/导出数据方法
PLSQL导入/导出数据方法 PLSQL导入/导出数据方法以前导数据库信息的时候,总是会先开启sql窗口,把自己手写的建表文件复制进去,然后再导入数据信息. 今天突然懒得去找以前的建表文件,而想用S ...
利用sqoop将hive数据导入导出数据到mysql
一.导入导出数据库常用命令语句 1)列出mysql数据库中的所有数据库命令 # sqoop list-databases --connect jdbc:mysql://localhost:3306 ...
mysql导入导出数据中文乱码解决方法小结
linux系统中 linux默认的是utf8编码,而windows是gbk编码,所以会出现上面的乱码问题. 解决mysql导入导出数据乱码问题首先要做的是要确定你导出数据的编码格式,使用mysqld ...
【转】Hive导入10G数据的测试
原博文出自于: http://blog.fens.me/hadoop-hive-10g/ 感谢! Hive导入10G数据的测试让Hadoop跑在云端系列文章,介绍了如何整合虚拟化和Hadoop,让H ...
Hive导入10G数据的测试
Hive导入10G数据的测试让Hadoop跑在云端系列文章,介绍了如何整合虚拟化和Hadoop,让Hadoop集群跑在VPS虚拟主机上,通过云向用户提供存储和计算的服务. 现在硬件越来越便宜,一台非 ...
CRL快速开发框架系列教程九(导入/导出数据)
本系列目录 CRL快速开发框架系列教程一(Code First数据表不需再关心) CRL快速开发框架系列教程二(基于Lambda表达式查询) CRL快速开发框架系列教程三(更新数据) CRL快速开发框 ...

随机推荐

vue key的作用
key的作用是什么? 简单来说: key是给每一个vnode的唯一id,可以依靠key,更准确, 更快的拿到oldVnode中对应的vnode节点. 1. 更准确因为带key就不是就地复用了,在sa ...
mvn deploy上传私服Nexus时遇到的坑--ReasonPhrase: Forbidden.
用maven deploy上传jar包时,遇到了ReasonPhrase: Forbidden 错误,截图如下: 折腾了好久,终于解决,现把步骤简单记录如下: 1.自建仓库eagle-sky: 2.设 ...
Oracle JET 单页面应用程序Router 使用（上）
单页面应用程序:使用一个进加载一次的网页,如果页面由于用户的交互而改变,则仅绘制更改的页面部分. 要创建单页面应用程序需要使用 oj.Router 的虚拟导航来支持,ojModule 用来响应页面的重 ...
webpack安装大于4.x版本(没有配置webpack.config.js)
webpack安装大于4.x版本(没有配置webpack.config.js) webpack 输出参数-o 高版本如果安装的webpack版本大于4+,还需要安装webpack-cli.在没有配 ...
配置 setting镜像在nexus私服上下载
在你的本地仓库上 setting文件中配置,一旦nexus服务关闭是无法下载的 1 配置nexus镜像 <mirror> <id>central1</id> < ...
506C Mr. Kitayuta vs. Bamboos
分析代码 #include<bits/stdc++.h> using namespace std; #define int long long ],h[],now[],cnt[]; in ...
Openstack_通用模块_Oslo_vmware 创建 vSS PortGroup
目录目录 vSS vSSPG vSphere SDK 中相关的网络对象创建 vSS PortGroup vSS & vSSPG vSS(Standard vSwitch 标准交换机) 为在 ...
TFS 删除工作区签出状态
'//找出当前工作组未迁出的文件 delete tbl_pendingchange '
六、Zabbix-自动分组
一.配置Zabbix server 1.创建主机组 (2)配置—>主机群组—>创建主机群组 (2)Next Step (3)可以看到新添加的主机组 2.添加自动分组动作配置—>动作 ...
Java基础语法—流程控制语句
在一个程序执行的过程中,各条语句的执行顺序对程序的结果是有直接影响的.所以,我们必须清楚每条语句的执行流程.而且,很多时候要通过控制语句的执行顺序来实现我们想要的功能. 3.1 流程控制语句分类 ...