Hive 导入、导出数据

<------ 导入 ------>

　　　　语法：LOAD DATA [LOCAL] INPATH 'filepath' [OVERWRITE] INTO TABLE tablename [PARTITION (partcol1=val1, partcol2=val2 ...)]

　　　　　　　　LOCAL : 区分是从本地，还是HDFS 导入

　　　　　　　　OVERWRITE : 表示重写；不加，表示追加写入

　　　　　　　　PARTITION(par1='val1') : 指定分区　　　　　　　　

　　　　步骤：

　　　　　　1. 新建一张Hive表，列分隔符指定是 ”\t“

use default;

drop table if exists kimbo_test;

create table kimbo_test

(

id   int comment '主键ID',

name string comment '名称'

)ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t' LINES TERMINATED BY '\n'

STORED AS TEXTFILE ;

　　　　　　2. 创建文件，并写入内容，列分隔用 ”\t“

　　　　　　　　vi kimbo_test.txt

　　　　　　3. 导入数据

　　　　　　　　Hive 模式： load data local inpath '/home/zhangshaosheng/kimbo_test.txt' overwrite into table default.kimbo_test;

　　　　　　　　命令行模式： hive -S -e "load data local inpath '/home/zhangshaosheng/kimbo_test.txt' overwrite into table default.kimbo_test;"

从已有的表导入数据

-- 创建临时表，只有表结构

use default;

drop table if exists kimbo_test2 ;

create table kimbo_test2 as select * from default.kimbo_test where 1=0;

-- 创建临时表，插入数据

use default;

drop table if exists kimbo_test3 ;

create table kimbo_test3 as select * from default.kimbo_test；

插入单条数据

　　　　Hive 模式： insert into table kimbo_test values (40,'南京');

<------ 导出 ------>

从Hive查询表数据，导出到本地目录文件,跟HDFS的目录结构一致

　　　　Hive 模式： insert overwrite local directory '/home/zhangshaosheng/test3' select * from default.kimbo_test;

从Hive查询表数据，直接导出到文件中(本人常用)

　　　　命令行模式： hive -S -e "select * from default.kimbo_test; " >kimbo_test7.txt

Hive 导入、导出数据的更多相关文章

Mysql & Hive 导入导出数据
---王燕行转列sql select split(concat_ws(',',collect_set(cast(smzq as string))),',')[1] ,split(concat_ws(' ...
hive导入导出数据案例
查询数据: use ods;set /user.password=ODS-SH;select * from base_cdma_all limit 10; use tag_bonc;select * ...
Hive导入导出数据的方法
Hive导入数据的方式官网文档: LOAD DATA [LOCAL] INPATH 'filepath' [OVERWRITE] INTO TABLE tablename [PARTITION (p ...
利用sqoop将hive数据导入导出数据到mysql
一.导入导出数据库常用命令语句 1)列出mysql数据库中的所有数据库命令 # sqoop list-databases --connect jdbc:mysql://localhost:3306 ...
【转】Hive导入10G数据的测试
原博文出自于: http://blog.fens.me/hadoop-hive-10g/ 感谢! Hive导入10G数据的测试让Hadoop跑在云端系列文章,介绍了如何整合虚拟化和Hadoop,让H ...
Hive导入10G数据的测试
Hive导入10G数据的测试让Hadoop跑在云端系列文章,介绍了如何整合虚拟化和Hadoop,让Hadoop集群跑在VPS虚拟主机上,通过云向用户提供存储和计算的服务. 现在硬件越来越便宜,一台非 ...
CRL快速开发框架系列教程九(导入/导出数据)
本系列目录 CRL快速开发框架系列教程一(Code First数据表不需再关心) CRL快速开发框架系列教程二(基于Lambda表达式查询) CRL快速开发框架系列教程三(更新数据) CRL快速开发框 ...
mysql导入导出数据中文乱码解决方法小结
linux系统中 linux默认的是utf8编码,而windows是gbk编码,所以会出现上面的乱码问题. 解决mysql导入导出数据乱码问题首先要做的是要确定你导出数据的编码格式,使用mysqld ...
Android开发笔记：SQLite导入导出数据
SQLite是Android中最方便使用的数据库了,现在看下如何快速的在SQLite中导入导出数据. 首先由于是.NET项目转Android,原有数据库使用的是SQLSERVER,由于项目相同部分结构 ...
解决mysql导入导出数据乱码问题
最近在linux上面用mysqldump导出数据,放在windows系统中导入就会出现中文乱码,然后就会导致出现: Unknown MySQL server host和Can't connect to ...

随机推荐

工作笔记——区块链POC
1.基础配置安装SecureCRT 8.0链接到虚拟服务器,并配置docker 安装文件上传到服务器工具FileZilla
javascript 中的 parameter vs arguments
像往常一样简单粗暴地看码: A parameter is the variable which is part of the method’s signature (method declaratio ...
Part01、sqlalchemy 使用
一.ORM 连表一对多 1.创建表,主动指定外键约束. 2.操作. ...
centos7命令3
查看监听的端口 netstat -lntp 检查端口被哪个进程占用 netstat -lnp|grep 8080 查看当前文件夹大小 du -sh 查看当前文件夹各目录大小 du -sh ./* 查看 ...
项目总结之HashMap问题
在项目中我需要用另一个项目的中的方法,在另一个项目中的方法返回值是一个hashmap,返回的不是一个hashMap中存的对象而是Object对象.在一个项目中调用另一个项目中的方式是直接引入另一个项目 ...
使用LocationManager来获取移动设备所在的地理位置信息
在Android应用程序中,可以使用LocationManager来获取移动设备所在的地理位置信息.看如下实例:新建android应用程序TestLocation. 1.activity_main.x ...
Codeforces Round #431 (Div. 2) C. From Y to Y
题目: C. From Y to Y time limit per test 1 second memory limit per test 256 megabytes input standard i ...
Python的幂运算
直接用例子说明
springcloud---2
每一个都是独立的springboot工程.通过自己的ip和端口访问. Eureka是服务发现组件,Eureka里面有一个服务注册表,存的是服务消费者和服务生产者的ip和端口.Eureka集群里面每个E ...
python3_pickle模块详解
python3 pickle持久化的储存数据. python程序运行中得到了一些字符串,列表,字典等数据,想要长久的保存下来,方便以后使用,而不是简单的放入内存中关机断电就丢失数据.python模块大 ...

Hive 导入、导出数据

Hive 导入、导出数据的更多相关文章

随机推荐

热门专题