2.7-2.8 导入、导出数据(进/出)hive表的方式

一、导入数据进hive表

1、语法

LOAD DATA [LOCAL] INPATH 'filepath'

[OVERWRITE] INTO TABLE tablename

[PARTITION (partcol1=val1,partcol2=val2...)]

##

* 原始文件的存储位置

    *在本地要写local

    *在HDFS不用写local

* ‘filepath’ 文件路径要加引号

* 对表的数据是否覆盖

    * 覆盖要写overwrite

    * 追加不写overwrite

* 分区表要写partition

2、加载本地数据进hive表

load data local inpath '/opt/datas/emp. txt' into table default. emp;

3、加载hdfs文件到hive中

#hdfs上的数据

hive (default)> dfs -ls -R /user/root/hive/datas;

-rw-r--r--   1 root supergroup        659 2019-04-23 11:23 /user/root/hive/datas/emp.txt

#emp表中现在有14条数据

hive (default)> select * from emp;

OK

emp.empno    emp.ename    emp.job    emp.mgr    emp.hiredate    emp.sal    emp.comm    emp.deptno

7369    SMITH    CLERK    7902    1980-12-17    800.0    NULL    20

7499    ALLEN    SALESMAN    7698    1981-2-20    1600.0    300.0    30

7521    WARD    SALESMAN    7698    1981-2-22    1250.0    500.0    30

7566    JONES    MANAGER    7839    1981-4-2    2975.0    NULL    20

7654    MARTIN    SALESMAN    7698    1981-9-28    1250.0    1400.0    30

7698    BLAKE    MANAGER    7839    1981-5-1    2850.0    NULL    30

7782    CLARK    MANAGER    7839    1981-6-9    2450.0    NULL    10

7788    SCOTT    ANALYST    7566    1987-4-19    3000.0    NULL    20

7839    KING    PRESIDENT    NULL    1981-11-17    5000.0    NULL    10

7844    TURNER    SALESMAN    7698    1981-9-8    1500.0    0.0    30

7876    ADAMS    CLERK    7788    1987-5-23    1100.0    NULL    20

7900    JAMES    CLERK    7698    1981-12-3    950.0    NULL    30

7902    FORD    ANALYST    7566    1981-12-3    3000.0    NULL    20

7934    MILLER    CLERK    7782    1982-1-23    1300.0    NULL    10

Time taken: 0.606 seconds, Fetched: 14 row(s)

#将hdfs上的数据加载到emp表中，加载到hive表后，hdfs上的数据会被删除

hive (default)> load data inpath '/user/root/hive/datas/emp.txt' into table default.emp;

Loading data to table default.emp

Table default.emp stats: [numFiles=2, numRows=0, totalSize=1318, rawDataSize=0]

OK

Time taken: 0.228 seconds

#emp表中的数据增加到了28条

hive (default)> select * from emp;

OK

emp.empno    emp.ename    emp.job    emp.mgr    emp.hiredate    emp.sal    emp.comm    emp.deptno

7369    SMITH    CLERK    7902    1980-12-17    800.0    NULL    20

7499    ALLEN    SALESMAN    7698    1981-2-20    1600.0    300.0    30

7521    WARD    SALESMAN    7698    1981-2-22    1250.0    500.0    30

7566    JONES    MANAGER    7839    1981-4-2    2975.0    NULL    20

7654    MARTIN    SALESMAN    7698    1981-9-28    1250.0    1400.0    30

7698    BLAKE    MANAGER    7839    1981-5-1    2850.0    NULL    30

7782    CLARK    MANAGER    7839    1981-6-9    2450.0    NULL    10

7788    SCOTT    ANALYST    7566    1987-4-19    3000.0    NULL    20

7839    KING    PRESIDENT    NULL    1981-11-17    5000.0    NULL    10

7844    TURNER    SALESMAN    7698    1981-9-8    1500.0    0.0    30

7876    ADAMS    CLERK    7788    1987-5-23    1100.0    NULL    20

7900    JAMES    CLERK    7698    1981-12-3    950.0    NULL    30

7902    FORD    ANALYST    7566    1981-12-3    3000.0    NULL    20

7934    MILLER    CLERK    7782    1982-1-23    1300.0    NULL    10

7369    SMITH    CLERK    7902    1980-12-17    800.0    NULL    20

7499    ALLEN    SALESMAN    7698    1981-2-20    1600.0    300.0    30

7521    WARD    SALESMAN    7698    1981-2-22    1250.0    500.0    30

7566    JONES    MANAGER    7839    1981-4-2    2975.0    NULL    20

7654    MARTIN    SALESMAN    7698    1981-9-28    1250.0    1400.0    30

7698    BLAKE    MANAGER    7839    1981-5-1    2850.0    NULL    30

7782    CLARK    MANAGER    7839    1981-6-9    2450.0    NULL    10

7788    SCOTT    ANALYST    7566    1987-4-19    3000.0    NULL    20

7839    KING    PRESIDENT    NULL    1981-11-17    5000.0    NULL    10

7844    TURNER    SALESMAN    7698    1981-9-8    1500.0    0.0    30

7876    ADAMS    CLERK    7788    1987-5-23    1100.0    NULL    20

7900    JAMES    CLERK    7698    1981-12-3    950.0    NULL    30

7902    FORD    ANALYST    7566    1981-12-3    3000.0    NULL    20

7934    MILLER    CLERK    7782    1982-1-23    1300.0    NULL    10

Time taken: 0.033 seconds, Fetched: 28 row(s)

4、加载数据覆盖表中已有的数据

#重新加载到hdfs，因为刚才的数据加载到hdfs后已被删除

hive (default)> dfs -put /opt/datas/emp.txt /user/root/hive/datas;   

#覆盖加载金hive表

hive (default)> load data inpath '/user/root/hive/datas/emp.txt' overwrite into table default.emp;

Loading data to table default.emp

rmr: DEPRECATED: Please use 'rm -r' instead.

Moved: 'hdfs://hadoop-senior.ibeifeng.com:8020/user/hive/warehouse/emp' to trash at: hdfs://hadoop-senior.ibeifeng.com:8020/user/root/.Trash/Current

Table default.emp stats: [numFiles=1, numRows=0, totalSize=659, rawDataSize=0]

OK

Time taken: 0.192 seconds

#此时emp中只有14条数据，刚才此表中有28条数据

hive (default)> select * from emp;

OK

emp.empno    emp.ename    emp.job    emp.mgr    emp.hiredate    emp.sal    emp.comm    emp.deptno

7369    SMITH    CLERK    7902    1980-12-17    800.0    NULL    20

7499    ALLEN    SALESMAN    7698    1981-2-20    1600.0    300.0    30

7521    WARD    SALESMAN    7698    1981-2-22    1250.0    500.0    30

7566    JONES    MANAGER    7839    1981-4-2    2975.0    NULL    20

7654    MARTIN    SALESMAN    7698    1981-9-28    1250.0    1400.0    30

7698    BLAKE    MANAGER    7839    1981-5-1    2850.0    NULL    30

7782    CLARK    MANAGER    7839    1981-6-9    2450.0    NULL    10

7788    SCOTT    ANALYST    7566    1987-4-19    3000.0    NULL    20

7839    KING    PRESIDENT    NULL    1981-11-17    5000.0    NULL    10

7844    TURNER    SALESMAN    7698    1981-9-8    1500.0    0.0    30

7876    ADAMS    CLERK    7788    1987-5-23    1100.0    NULL    20

7900    JAMES    CLERK    7698    1981-12-3    950.0    NULL    30

7902    FORD    ANALYST    7566    1981-12-3    3000.0    NULL    20

7934    MILLER    CLERK    7782    1982-1-23    1300.0    NULL    10

Time taken: 0.036 seconds, Fetched: 14 row(s)

5、创建表是通过insert加载

##

hive (default)> create table default.emp_ci like emp;

OK

Time taken: 0.092 seconds

hive (default)> select * from emp_ci;

OK

emp_ci.empno    emp_ci.ename    emp_ci.job    emp_ci.mgr    emp_ci.hiredate    emp_ci.sal    emp_ci.comm    emp_ci.deptno

Time taken: 0.034 seconds

##

hive (default)> insert into table default.emp_ci select * from default.emp;

hive (default)> select * from emp_ci;

OK

emp_ci.empno    emp_ci.ename    emp_ci.job    emp_ci.mgr    emp_ci.hiredate    emp_ci.sal    emp_ci.comm    emp_ci.deptno

7369    SMITH    CLERK    7902    1980-12-17    800.0    NULL    20

7499    ALLEN    SALESMAN    7698    1981-2-20    1600.0    300.0    30

7521    WARD    SALESMAN    7698    1981-2-22    1250.0    500.0    30

7566    JONES    MANAGER    7839    1981-4-2    2975.0    NULL    20

7654    MARTIN    SALESMAN    7698    1981-9-28    1250.0    1400.0    30

7698    BLAKE    MANAGER    7839    1981-5-1    2850.0    NULL    30

7782    CLARK    MANAGER    7839    1981-6-9    2450.0    NULL    10

7788    SCOTT    ANALYST    7566    1987-4-19    3000.0    NULL    20

7839    KING    PRESIDENT    NULL    1981-11-17    5000.0    NULL    10

7844    TURNER    SALESMAN    7698    1981-9-8    1500.0    0.0    30

7876    ADAMS    CLERK    7788    1987-5-23    1100.0    NULL    20

7900    JAMES    CLERK    7698    1981-12-3    950.0    NULL    30

7902    FORD    ANALYST    7566    1981-12-3    3000.0    NULL    20

7934    MILLER    CLERK    7782    1982-1-23    1300.0    NULL    10

Time taken: 0.028 seconds, Fetched: 14 row(s)

6、创建表的时候通过location指定加载

二、导出hive表数据

1、导出到本地

#将查询结果插入到本地，本地目录会自动创建

hive (default)> insert overwrite local directory '/opt/datas/hive_exp_emp'

              > ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t' COLLECTION ITEMS TERMINATED BY '/n'

              > select * from default.emp;

ROW FORMAT DELIMITED FIELDS TERMINATED BY '\t'    #列之间的分隔符

COLLECTION ITEMS TERMINATED BY '/n'        #行之间的分隔符

[root@hadoop-senior modules]# cat /opt/datas/hive_exp_emp/000000_0

7369    SMITH    CLERK    7902    1980-12-17    800.0    \N    20

7499    ALLEN    SALESMAN    7698    1981-2-20    1600.0    300.0    30

7521    WARD    SALESMAN    7698    1981-2-22    1250.0    500.0    30

7566    JONES    MANAGER    7839    1981-4-2    2975.0    \N    20

7654    MARTIN    SALESMAN    7698    1981-9-28    1250.0    1400.0    30

7698    BLAKE    MANAGER    7839    1981-5-1    2850.0    \N    30

7782    CLARK    MANAGER    7839    1981-6-9    2450.0    \N    10

7788    SCOTT    ANALYST    7566    1987-4-19    3000.0    \N    20

7839    KING    PRESIDENT    \N    1981-11-17    5000.0    \N    10

7844    TURNER    SALESMAN    7698    1981-9-8    1500.0    0.0    30

7876    ADAMS    CLERK    7788    1987-5-23    1100.0    \N    20

7900    JAMES    CLERK    7698    1981-12-3    950.0    \N    30

7902    FORD    ANALYST    7566    1981-12-3    3000.0    \N    20

7934    MILLER    CLERK    7782    1982-1-23    1300.0    \N    10

2、查询输出到文件

##

[root@hadoop-senior hive-0.13.1]# bin/hive -e "select * from default.emp;" >/opt/datas/exp_res.txt

Logging initialized using configuration in file:/opt/modules/hive-0.13.1/conf/hive-log4j.properties

OK

Time taken: 0.837 seconds, Fetched: 14 row(s)

[root@hadoop-senior hive-0.13.1]# cat /opt/datas/exp_res.txt

emp.empno    emp.ename    emp.job    emp.mgr    emp.hiredate    emp.sal    emp.comm    emp.deptno

7369    SMITH    CLERK    7902    1980-12-17    800.0    NULL    20

7499    ALLEN    SALESMAN    7698    1981-2-20    1600.0    300.0    30

7521    WARD    SALESMAN    7698    1981-2-22    1250.0    500.0    30

7566    JONES    MANAGER    7839    1981-4-2    2975.0    NULL    20

7654    MARTIN    SALESMAN    7698    1981-9-28    1250.0    1400.0    30

7698    BLAKE    MANAGER    7839    1981-5-1    2850.0    NULL    30

7782    CLARK    MANAGER    7839    1981-6-9    2450.0    NULL    10

7788    SCOTT    ANALYST    7566    1987-4-19    3000.0    NULL    20

7839    KING    PRESIDENT    NULL    1981-11-17    5000.0    NULL    10

7844    TURNER    SALESMAN    7698    1981-9-8    1500.0    0.0    30

7876    ADAMS    CLERK    7788    1987-5-23    1100.0    NULL    20

7900    JAMES    CLERK    7698    1981-12-3    950.0    NULL    30

7902    FORD    ANALYST    7566    1981-12-3    3000.0    NULL    20

7934    MILLER    CLERK    7782    1982-1-23    1300.0    NULL    10

3、导出到HDFS上

##

hive (default)> insert overwrite directory '/user/root/hive/hive_exp_emp'

              > select * from default.emp;

##

hive (default)> dfs -ls -R /user/root/hive/hive_exp_emp;

-rw-r--r--   1 root supergroup        661 2019-04-23 13:33 /user/root/hive/hive_exp_emp/000000_0

hive (default)> dfs -text /user/root/hive/hive_exp_emp/000000_0;

7369SMITHCLERK79021980-12-17800.0\N20

7499ALLENSALESMAN76981981-2-201600.0300.030

7521WARDSALESMAN76981981-2-221250.0500.030

7566JONESMANAGER78391981-4-22975.0\N20

7654MARTINSALESMAN76981981-9-281250.01400.030

7698BLAKEMANAGER78391981-5-12850.0\N30

7782CLARKMANAGER78391981-6-92450.0\N10

7788SCOTTANALYST75661987-4-193000.0\N20

7839KINGPRESIDENT\N1981-11-175000.0\N10

7844TURNERSALESMAN76981981-9-81500.00.030

7876ADAMSCLERK77881987-5-231100.0\N20

7900JAMESCLERK76981981-12-3950.0\N30

7902FORDANALYST75661981-12-33000.0\N20

7934MILLERCLERK77821982-1-231300.0\N10

#也可以从hdfs上get到本地查看

4、sqoop

hive—>rdbms

rdbms—>hive

2.7-2.8 导入、导出数据(进/出)hive表的方式的更多相关文章

CRL快速开发框架系列教程九(导入/导出数据)
本系列目录 CRL快速开发框架系列教程一(Code First数据表不需再关心) CRL快速开发框架系列教程二(基于Lambda表达式查询) CRL快速开发框架系列教程三(更新数据) CRL快速开发框 ...
mysql导入导出数据中文乱码解决方法小结
linux系统中 linux默认的是utf8编码,而windows是gbk编码,所以会出现上面的乱码问题. 解决mysql导入导出数据乱码问题首先要做的是要确定你导出数据的编码格式,使用mysqld ...
Android开发笔记：SQLite导入导出数据
SQLite是Android中最方便使用的数据库了,现在看下如何快速的在SQLite中导入导出数据. 首先由于是.NET项目转Android,原有数据库使用的是SQLSERVER,由于项目相同部分结构 ...
解决mysql导入导出数据乱码问题
最近在linux上面用mysqldump导出数据,放在windows系统中导入就会出现中文乱码,然后就会导致出现: Unknown MySQL server host和Can't connect to ...
[转]mysql导入导出数据中文乱码解决方法小结
本文章总结了mysql导入导出数据中文乱码解决方法,出现中文乱码一般情况是导入导入时编码的设置问题,我们只要把编码调整一致即可解决此方法,下面是搜索到的一些方法总结,方便需要的朋友. linux系统中 ...
oracle中导入导出数据备份数据库
原文:oracle中导入导出数据备份数据库数据库所在位置将数据导出到的文件名用户名备份数据库 :exp c ...
PLSQL导入/导出数据方法
PLSQL导入/导出数据方法 PLSQL导入/导出数据方法以前导数据库信息的时候,总是会先开启sql窗口,把自己手写的建表文件复制进去,然后再导入数据信息. 今天突然懒得去找以前的建表文件,而想用S ...
oracle10g和oracle11g导入导出数据区别
其中flxuser为用户名,flxuser为密码,file值为导入到数据库中的备份文件. oracle10g和oracle11g导入导出数据的命令方式大有不同: oracle10g导入数据: imp ...
利用sqoop将hive数据导入导出数据到mysql
一.导入导出数据库常用命令语句 1)列出mysql数据库中的所有数据库命令 # sqoop list-databases --connect jdbc:mysql://localhost:3306 ...

随机推荐

【随想】android是个什么东西,andorid机制随想
优秀程序猿的天性就是好奇,软件是怎么运作的.屏幕是怎样显示的.桌面窗口为何能如此人性化的被鼠标拖动? 假设你常常会有这样一些问题迸发在脑海中,恭喜你,你是一名非常有潜力的程序猿. 我在大学读的是自己主 ...
Android中Environment与StatFs获取系统/SDCard存储空间大小
近期想起Android开发的知识.好久没有使用了,都忘得几乎相同了,今天查看了一会资料往回捡捡,顺便写下来帮助一下须要的同学. 首先讲述一下Environment与StatFs这两个类,然后介绍它们的 ...
Flash制作和软件使用
Flash制作和软件使用 2014-11-09 ——君子善假于物也引子虽说FLASH在随着HTML5的发展而受阻,尤其移动终端都不再支持它了,但是在一段时间内还是重要的.近期朋友说要结婚,想弄个电 ...
机器学习资源汇总----来自于tensorflow中文社区
新手入门完整教程进阶指南 API中文手册精华文章TF社区 INTRODUCTION 1. 新手入门 1.1. 介绍 1.2. 下载及安装 1.3. 基本用法 2. 完整教程 2.1. 总览 2.2. ...
C语言预处理条件语句的与或运算
1.#ifdef 与或运算 #ifdef (MIN) && (MAX) ----------------------------错误使用 #if defined(MIN) & ...
JS计算网页停留时间
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/ ...
Webkit JNI
WebCoreFrameBridge.cpp BrowserFrame通过jni传下来的调用都会调用到WebCoreFrameBridge.cpp中的对应函数中,其他webkit的模块想回调信息给Br ...
CentOS系统时间修改
1. 实体机器上安装CentOS $date -s '2015-03-03 13:34:00' 2. 虚拟机上安装的CentOS #查看系统时间和硬件时间 date hwclock --show #设 ...
C# 打开指定的目录记住路径中 / 与 \ 的使用方法
老生常谈的问题了,C#在指定目录时,路径中要使用 \\.直接看实例 using System; namespace OpenFile{ class OpenFile{ static void Main ...
《AndroidStudio有用指南》反馈问题和建议
<AndroidStudio有用指南>反馈问题和建议 IntelliJ IDEA在持续更新, Android Studio也在持续更新, 本书也将会持续更新. Android Studio ...

2.7-2.8 导入、导出数据(进/出)hive表的方式

2.7-2.8 导入、导出数据(进/出)hive表的方式的更多相关文章

随机推荐

热门专题