Hive几种数据导出方式

 今天我们再谈谈Hive中的几种不同的数据导出方式。可以根据导出的地方不一样,将这些方式分为三种:

  (1)、导出到本地文件系统;

  (2)、导出到HDFS中;

  (3)、导出到Hive的另一个表中。为了避免单纯的文字,我将一步一步地用命令进行说明。

  一、导出到本地文件系统

  hive> insert overwrite local directory '/home/wyp/wyp'

    > select * from wyp;

  这条HQL的执行需要启用Mapreduce完成,运行完这条语句之后,将会在本地文件系统的/home/wyp/wyp目录下生成文件,这个文件是Reduce产生的结果(这里生成的文件名是000000_0),我们可以看看这个文件的内容:

  [wyp@master ~/wyp]$ vim 000000_0
  5^Awyp1^A23^A131212121212
  6^Awyp2^A24^A134535353535
  7^Awyp3^A25^A132453535353
  8^Awyp4^A26^A154243434355
  1^Awyp^A25^A13188888888888
  2^Atest^A30^A13888888888888
  3^Azs^A34^A899314121

可以看出,这就是wyp表中的所有数据。数据中的列与列之间的分隔符是^A(ascii码是\00001)。

  和导入数据到Hive不一样,不能用insert into来将数据导出:

  hive> insert into local directory '/home/wyp/wyp'
    > select * from wyp;
    NoViableAltException(79@[])
    at org.apache.hadoop.hive.ql.parse.HiveParser_SelectClauseParser.selectClause(HiveParser_SelectClauseParser.java:683)
    at org.apache.hadoop.hive.ql.parse.HiveParser.selectClause(HiveParser.java:30667)
    at org.apache.hadoop.hive.ql.parse.HiveParser.regular_body(HiveParser.java:28421)
    at org.apache.hadoop.hive.ql.parse.HiveParser.queryStatement(HiveParser.java:28306)
    at org.apache.hadoop.hive.ql.parse.HiveParser.queryStatementExpression(HiveParser.java:28100)
    at org.apache.hadoop.hive.ql.parse.HiveParser.execStatement(HiveParser.java:1213)
    at org.apache.hadoop.hive.ql.parse.HiveParser.statement(HiveParser.java:928)
    at org.apache.hadoop.hive.ql.parse.ParseDriver.parse(ParseDriver.java:190)
    at org.apache.hadoop.hive.ql.Driver.compile(Driver.java:418)
    at org.apache.hadoop.hive.ql.Driver.compile(Driver.java:337)
    at org.apache.hadoop.hive.ql.Driver.run(Driver.java:902)
    at org.apache.hadoop.hive.cli.CliDriver.processLocalCmd(CliDriver.java:259)
    at org.apache.hadoop.hive.cli.CliDriver.processCmd(CliDriver.java:216)
    at org.apache.hadoop.hive.cli.CliDriver.processLine(CliDriver.java:413)
    at org.apache.hadoop.hive.cli.CliDriver.run(CliDriver.java:756)
    at org.apache.hadoop.hive.cli.CliDriver.main(CliDriver.java:614)
    at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
    at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:39)
    at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:25)
    at java.lang.reflect.Method.invoke(Method.java:597)
    at org.apache.hadoop.util.RunJar.main(RunJar.java:212)
    FAILED: ParseException line 1:12 missing TABLE at 'local' near 'local' in select clause
  line 1:18 cannot recognize input near 'directory' ''/home/wyp/wyp'' 'select'in select clause

  二、导出到HDFS中

  和导入数据到本地文件系统一样的简单,可以用下面的语句实现:

  hive> insert overwrite directory '/home/wyp/hdfs'
    > select * from wyp;

将会在HDFS的/home/wyp/hdfs目录下保存导出来的数据。注意,和导出文件到本地文件系统的HQL少一个local,数据的存放路径就不一样了。

  三、导出到Hive的另一个表中

  如下操作:

  hive> insert into table test
    > partition (age='25')
    > select id, name, tel
    > from wyp;
  #####################################################################
  这里输出了一堆Mapreduce任务信息,这里省略
  #####################################################################
  Total MapReduce CPU Time Spent: 1 seconds 310 msec
  OK
  Time taken: 19.125 seconds

  hive> select * from test;
  OK
  5 wyp1 131212121212 25
  6 wyp2 134535353535 25
  7 wyp3 132453535353 25
  8 wyp4 154243434355 25
  1 wyp 13188888888888 25
  2 test 13888888888888 25
  3 zs 899314121 25
  Time taken: 0.126 seconds, Fetched: 7 row(s)

  细心的读者可能会问,怎么导入数据到文件中,数据的列之间为什么不是wyp表设定的列分隔符呢?其实在Hive 0.11.0版本之间,数据的导出是不能指定列之间的分隔符的,只能用默认的列分隔符,也就是上面的^A来分割,这样导出来的数据很不直观,看起来很不方便!
  如果你用的Hive版本是0.11.0,那么你可以在导出数据的时候来指定列之间的分隔符,操作如下:

  hive> insert overwrite local directory '/home/yangping.wu/local'

    > row format delimited
    > fields terminated by '\t'
    > select * from wyp;

  [wyp@master ~/local]$ vim 000000_0
  5 wyp1 23 131212121212
  6 wyp2 24 134535353535
  7 wyp3 25 132453535353
  8 wyp4 26 154243434355
  1 wyp 25 13188888888888
  2 test 30 13888888888888
  3 zs 34 899314121

这个很不错吧!
  其实,我们还可以用hive的-e和-f参数来导出数据。其中-e 表示后面直接接带双引号的sql语句;而-f是接一个文件,文件的内容为一个sql语句,如下:

  [wyp@master ~/local]$ hive -e "select * from wyp" >> local/wyp.txt
  [wyp@master ~/local]$ cat wyp.txt
  5 wyp1 23 131212121212
  6 wyp2 24 134535353535
  7 wyp3 25 132453535353
  8 wyp4 26 154243434355
  1 wyp 25 13188888888888
  2 test 30 13888888888888
  3 zs 34 899314121

 

  得到的结果也是用\t分割的。也可以用-f参数实现:

  [wyp@master ~/local]$ cat wyp.sql
  select * from wyp
  [wyp@master ~/local]$ hive -f wyp.sql >> local/wyp2.txt

  上述语句得到的结果也是\t分割的。


转载自过往记忆(http://www.iteblog.com/)

Hive几种数据导出方式的更多相关文章

  1. HIVE几种数据导入方式

    HIVE几种数据导入方式 今天的话题是总结Hive的几种常见的数据导入方式,我总结为四种:(1).从本地文件系统中导入数据到Hive表:(2).从HDFS上导入数据到Hive表:(3).从别的表中查询 ...

  2. Hive四种数据导入方式介绍

    问题导读 1.从本地文件系统中通过什么命令可导入数据到Hive表? 2.什么是动态分区插入? 3.该如何实现动态分区插入? 扩展: 这里可以和Hive中的三种不同的数据导出方式介绍进行对比? Hive ...

  3. 【hive】——Hive四种数据导入方式

    Hive的几种常见的数据导入方式这里介绍四种:(1).从本地文件系统中导入数据到Hive表:(2).从HDFS上导入数据到Hive表:(3).从别的表中查询出相应的数据并导入到Hive表中:(4).在 ...

  4. Hive总结(七)Hive四种数据导入方式

  5. Hive中的三种不同的数据导出方式介绍

    问题导读:1.导出本地文件系统和hdfs文件系统区别是什么?2.带有local命令是指导出本地还是hdfs文件系统?3.hive中,使用的insert与传统数据库insert的区别是什么?4.导出数据 ...

  6. iOS开发中的4种数据持久化方式【二、数据库 SQLite3、Core Data 的运用】

                   在上文,我们介绍了ios开发中的其中2种数据持久化方式:属性列表.归档解档.本节将继续介绍另外2种iOS持久化数据的方法:数据库 SQLite3.Core Data 的运 ...

  7. 四种数据持久化方式(下) :SQLite3 和 Core Data

    在上文,我们介绍了iOS开发中的其中2种数据持久化方式:属性列表.归档解档. 本节将继续介绍另外2种iOS持久化数据的方法:数据库 SQLite3.Core Data 的运用: 在本节,将通过对4个文 ...

  8. Android编程中的5种数据存储方式

    Android编程中的5种数据存储方式 作者:牛奶.不加糖 字体:[增加 减小] 类型:转载 时间:2015-12-03我要评论 这篇文章主要介绍了Android编程中的5种数据存储方式,结合实例形式 ...

  9. Android五种数据存储方式

    android 五种数据存储 :SharePreferences.SQLite.Contert Provider.File.网络存储 Android系统提供了四种存储数据方式.分别为:SharePre ...

随机推荐

  1. db2 常用命令

    db2osconf 检查系统内核参数 db2pd 监控检查数据库工具,可以检查数据库的许多信息(锁.交易.表空间. SQL等) db2expln 查看程序包的执行计划 db2exfmt 格式化expl ...

  2. 通过RGB灯输出七色

    本文由博主原创,如有不对之处请指明,转载请说明出处. /********************************* 代码功能:输出模拟信号,控制RGB灯的颜色 使用函数: pinMode(引脚 ...

  3. 查看Windows服务器登录日志

    本文以Windows7系统为例:[控制面板]——[管理工具]——[查看事件日志]——[Windows日志]——[安全].此时在视图窗口应该可以看到登录信息了,如果需要知道具体信息那么可以点击某条记录或 ...

  4. NGUI 使用EventDelegate.Add与UIInput.onSubmit、UIInput.onChange限定编辑框中的内容

    Unity中,使用NGUI,通常为某个控件(如按钮)绑定事件(单击.双击.拖拽.滚轮.选择等)都是用UIEventListener,比如: public void Bind() { UIEventLi ...

  5. 课堂Beta发布140字评论

    Beta发布140字评论: 第一组:飞天小女警 此项目组的功能是礼物挑选,创意十足,用户只要一听名字便会被深深吸引,并且页面设计感,时尚感十足,不断吸引客户的眼球,而且发布到云服务器上面. 第二组:金 ...

  6. spring-data-redis注册fastjson序列化工具

    使用spring-data-redis的时候,其序列化工具自带:

  7. WebStorm 8.0.1 注册码

    username:24718-12042010 key:00001h6wzKLpfo3gmjJ8xoTPw5mQvY YA8vwka9tH!vibaUKS4FIDIkUfy!!f 3C"rQ ...

  8. IP首部校验和计算

    根据RFC1071文档的计算方法,编写代码实现IP首部校验和的计算 计算步骤: 1.首先将IP首部中校验和字段置0 2.将IP首部每16bit进行相加,如果有进位产生,则将进位加到最低位. 3.将计算 ...

  9. java 学习写架构必会几大技术点

    java 学习写架构必会几大技术点 关于学习架构,必须会的几点技术 1. java反射技术 2. xml文件处理 3. properties属性文件处理 4. 线程安全机制 5. annocation ...

  10. Codeforces 731C. Socks 联通块

    C. Socks time limit per test: 2 seconds memory limit per test: 256 megabytes input: standard input o ...