Hive 导入、导出数据

<------ 导入 ------>

　　　　语法：LOAD DATA [LOCAL] INPATH 'filepath' [OVERWRITE] INTO TABLE tablename [PARTITION (partcol1=val1, partcol2=val2 ...)]

　　　　　　　　LOCAL : 区分是从本地，还是HDFS 导入

　　　　　　　　OVERWRITE : 表示重写；不加，表示追加写入

　　　　　　　　PARTITION(par1='val1') : 指定分区　　　　　　　　

　　　　步骤：

　　　　　　1. 新建一张Hive表，列分隔符指定是 ”\t“

use default;

drop table if exists kimbo_test;

create table kimbo_test

(

id   int comment '主键ID',

name string comment '名称'

)ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t' LINES TERMINATED BY '\n'

STORED AS TEXTFILE ;

　　　　　　2. 创建文件，并写入内容，列分隔用 ”\t“

　　　　　　　　vi kimbo_test.txt

　　　　　　3. 导入数据

　　　　　　　　Hive 模式： load data local inpath '/home/zhangshaosheng/kimbo_test.txt' overwrite into table default.kimbo_test;

　　　　　　　　命令行模式： hive -S -e "load data local inpath '/home/zhangshaosheng/kimbo_test.txt' overwrite into table default.kimbo_test;"

从已有的表导入数据

-- 创建临时表，只有表结构

use default;

drop table if exists kimbo_test2 ;

create table kimbo_test2 as select * from default.kimbo_test where 1=0;

-- 创建临时表，插入数据

use default;

drop table if exists kimbo_test3 ;

create table kimbo_test3 as select * from default.kimbo_test；

插入单条数据

　　　　Hive 模式： insert into table kimbo_test values (40,'南京');

<------ 导出 ------>

从Hive查询表数据，导出到本地目录文件,跟HDFS的目录结构一致

　　　　Hive 模式： insert overwrite local directory '/home/zhangshaosheng/test3' select * from default.kimbo_test;

从Hive查询表数据，直接导出到文件中(本人常用)

　　　　命令行模式： hive -S -e "select * from default.kimbo_test; " >kimbo_test7.txt

Hive 导入、导出数据的更多相关文章

Mysql & Hive 导入导出数据
---王燕行转列sql select split(concat_ws(',',collect_set(cast(smzq as string))),',')[1] ,split(concat_ws(' ...
hive导入导出数据案例
查询数据: use ods;set /user.password=ODS-SH;select * from base_cdma_all limit 10; use tag_bonc;select * ...
Hive导入导出数据的方法
Hive导入数据的方式官网文档: LOAD DATA [LOCAL] INPATH 'filepath' [OVERWRITE] INTO TABLE tablename [PARTITION (p ...
利用sqoop将hive数据导入导出数据到mysql
一.导入导出数据库常用命令语句 1)列出mysql数据库中的所有数据库命令 # sqoop list-databases --connect jdbc:mysql://localhost:3306 ...
【转】Hive导入10G数据的测试
原博文出自于: http://blog.fens.me/hadoop-hive-10g/ 感谢! Hive导入10G数据的测试让Hadoop跑在云端系列文章,介绍了如何整合虚拟化和Hadoop,让H ...
Hive导入10G数据的测试
Hive导入10G数据的测试让Hadoop跑在云端系列文章,介绍了如何整合虚拟化和Hadoop,让Hadoop集群跑在VPS虚拟主机上,通过云向用户提供存储和计算的服务. 现在硬件越来越便宜,一台非 ...
CRL快速开发框架系列教程九(导入/导出数据)
本系列目录 CRL快速开发框架系列教程一(Code First数据表不需再关心) CRL快速开发框架系列教程二(基于Lambda表达式查询) CRL快速开发框架系列教程三(更新数据) CRL快速开发框 ...
mysql导入导出数据中文乱码解决方法小结
linux系统中 linux默认的是utf8编码,而windows是gbk编码,所以会出现上面的乱码问题. 解决mysql导入导出数据乱码问题首先要做的是要确定你导出数据的编码格式,使用mysqld ...
Android开发笔记：SQLite导入导出数据
SQLite是Android中最方便使用的数据库了,现在看下如何快速的在SQLite中导入导出数据. 首先由于是.NET项目转Android,原有数据库使用的是SQLSERVER,由于项目相同部分结构 ...
解决mysql导入导出数据乱码问题
最近在linux上面用mysqldump导出数据,放在windows系统中导入就会出现中文乱码,然后就会导致出现: Unknown MySQL server host和Can't connect to ...

随机推荐

SVM支持向量机总结
一.拉格朗日乘子法一般,在有等式约束时使用拉格朗日乘子法,在有不等约束时使用KKT条件.这里我们先介绍拉格朗日乘子法,后面再介绍KKT条件. 比如考虑下面的组合优化的问题, 这是一个带等式约束的优化 ...
Spark应用日志级别设置
一. 日志效率原因开发时,控制台输出一大堆日志信息,严重影响查看日志效率. 从控制台输出日志我们可以看出,应用程序是默认加载Spark-core包下面的log4j-defaults.proper ...
cpu-》内存-》磁盘
cpu相当于计算机大脑负责计算以及发送执行命令:内存相当于人的记忆是临时存储:磁盘相当于笔记本,负责永久存储数据: 当系统需要调用硬盘当中的数据时,会将硬盘数据读入内存供cpu进行处理.cpu只会读取 ...
Element 中表单非必填数据项必须为数字的验证问题
Element-ui 的el-form组建中,自带基本的验证功能,比如某些项必填的验证,直接加入rules 规则中即可,如下实例: 在页面中书写如下: <el-form-item label=& ...
NodeJS NPM HTTPS
npm config set registry http://registry.npmjs.org/
spark[源码]-TaskSchedulerlmpl类源码
TaskSchedulerImpl概述 TaskSchedulerlmpl是创建三大核心TaskSheduler的实现类,TaskScheduler是一个特征类,DAGScheduler在提交Task ...
ansible playbook部署ELK集群系统
一.介绍总共4台机器,分别为 192.168.1.99 192.168.1.100 192.168.1.210 192.168.1.211 服务所在机器为: redis:192.168.1.211 ...
sparkSQL——DataFrame&Datasets
对于新司机,可能看到sc与spark不知道是什么,看图知意 ********************************************************************** ...
Web前端页面的浏览器兼容性测试心得（一）搭建测试用本地静态服务器
自从实习以来,我体验了由一个人编程再到多人协作编程的转换.同时也接触了很多新鲜事物,学到了很多东西.工作时,常常需要多个人协同测试一张H5页面(PC.手机.平板等跨设备测试),也会经常把页面给PM或老 ...
s3cmd安装
配置yum.repos cd /etc/yum.repos.d/ vim s3tools.repo [s3tools] name=Tools for managing Amazon S3 - Simp ...

Hive 导入、导出数据

Hive 导入、导出数据的更多相关文章

随机推荐

热门专题