Hive几种数据导出方式

 今天我们再谈谈Hive中的几种不同的数据导出方式。可以根据导出的地方不一样,将这些方式分为三种:

  (1)、导出到本地文件系统;

  (2)、导出到HDFS中;

  (3)、导出到Hive的另一个表中。为了避免单纯的文字,我将一步一步地用命令进行说明。

  一、导出到本地文件系统

  hive> insert overwrite local directory '/home/wyp/wyp'

    > select * from wyp;

  这条HQL的执行需要启用Mapreduce完成,运行完这条语句之后,将会在本地文件系统的/home/wyp/wyp目录下生成文件,这个文件是Reduce产生的结果(这里生成的文件名是000000_0),我们可以看看这个文件的内容:

  [wyp@master ~/wyp]$ vim 000000_0
  5^Awyp1^A23^A131212121212
  6^Awyp2^A24^A134535353535
  7^Awyp3^A25^A132453535353
  8^Awyp4^A26^A154243434355
  1^Awyp^A25^A13188888888888
  2^Atest^A30^A13888888888888
  3^Azs^A34^A899314121

可以看出,这就是wyp表中的所有数据。数据中的列与列之间的分隔符是^A(ascii码是\00001)。

  和导入数据到Hive不一样,不能用insert into来将数据导出:

  hive> insert into local directory '/home/wyp/wyp'
    > select * from wyp;
    NoViableAltException(79@[])
    at org.apache.hadoop.hive.ql.parse.HiveParser_SelectClauseParser.selectClause(HiveParser_SelectClauseParser.java:683)
    at org.apache.hadoop.hive.ql.parse.HiveParser.selectClause(HiveParser.java:30667)
    at org.apache.hadoop.hive.ql.parse.HiveParser.regular_body(HiveParser.java:28421)
    at org.apache.hadoop.hive.ql.parse.HiveParser.queryStatement(HiveParser.java:28306)
    at org.apache.hadoop.hive.ql.parse.HiveParser.queryStatementExpression(HiveParser.java:28100)
    at org.apache.hadoop.hive.ql.parse.HiveParser.execStatement(HiveParser.java:1213)
    at org.apache.hadoop.hive.ql.parse.HiveParser.statement(HiveParser.java:928)
    at org.apache.hadoop.hive.ql.parse.ParseDriver.parse(ParseDriver.java:190)
    at org.apache.hadoop.hive.ql.Driver.compile(Driver.java:418)
    at org.apache.hadoop.hive.ql.Driver.compile(Driver.java:337)
    at org.apache.hadoop.hive.ql.Driver.run(Driver.java:902)
    at org.apache.hadoop.hive.cli.CliDriver.processLocalCmd(CliDriver.java:259)
    at org.apache.hadoop.hive.cli.CliDriver.processCmd(CliDriver.java:216)
    at org.apache.hadoop.hive.cli.CliDriver.processLine(CliDriver.java:413)
    at org.apache.hadoop.hive.cli.CliDriver.run(CliDriver.java:756)
    at org.apache.hadoop.hive.cli.CliDriver.main(CliDriver.java:614)
    at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
    at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:39)
    at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:25)
    at java.lang.reflect.Method.invoke(Method.java:597)
    at org.apache.hadoop.util.RunJar.main(RunJar.java:212)
    FAILED: ParseException line 1:12 missing TABLE at 'local' near 'local' in select clause
  line 1:18 cannot recognize input near 'directory' ''/home/wyp/wyp'' 'select'in select clause

  二、导出到HDFS中

  和导入数据到本地文件系统一样的简单,可以用下面的语句实现:

  hive> insert overwrite directory '/home/wyp/hdfs'
    > select * from wyp;

将会在HDFS的/home/wyp/hdfs目录下保存导出来的数据。注意,和导出文件到本地文件系统的HQL少一个local,数据的存放路径就不一样了。

  三、导出到Hive的另一个表中

  如下操作:

  hive> insert into table test
    > partition (age='25')
    > select id, name, tel
    > from wyp;
  #####################################################################
  这里输出了一堆Mapreduce任务信息,这里省略
  #####################################################################
  Total MapReduce CPU Time Spent: 1 seconds 310 msec
  OK
  Time taken: 19.125 seconds

  hive> select * from test;
  OK
  5 wyp1 131212121212 25
  6 wyp2 134535353535 25
  7 wyp3 132453535353 25
  8 wyp4 154243434355 25
  1 wyp 13188888888888 25
  2 test 13888888888888 25
  3 zs 899314121 25
  Time taken: 0.126 seconds, Fetched: 7 row(s)

  细心的读者可能会问,怎么导入数据到文件中,数据的列之间为什么不是wyp表设定的列分隔符呢?其实在Hive 0.11.0版本之间,数据的导出是不能指定列之间的分隔符的,只能用默认的列分隔符,也就是上面的^A来分割,这样导出来的数据很不直观,看起来很不方便!
  如果你用的Hive版本是0.11.0,那么你可以在导出数据的时候来指定列之间的分隔符,操作如下:

  hive> insert overwrite local directory '/home/yangping.wu/local'

    > row format delimited
    > fields terminated by '\t'
    > select * from wyp;

  [wyp@master ~/local]$ vim 000000_0
  5 wyp1 23 131212121212
  6 wyp2 24 134535353535
  7 wyp3 25 132453535353
  8 wyp4 26 154243434355
  1 wyp 25 13188888888888
  2 test 30 13888888888888
  3 zs 34 899314121

这个很不错吧!
  其实,我们还可以用hive的-e和-f参数来导出数据。其中-e 表示后面直接接带双引号的sql语句;而-f是接一个文件,文件的内容为一个sql语句,如下:

  [wyp@master ~/local]$ hive -e "select * from wyp" >> local/wyp.txt
  [wyp@master ~/local]$ cat wyp.txt
  5 wyp1 23 131212121212
  6 wyp2 24 134535353535
  7 wyp3 25 132453535353
  8 wyp4 26 154243434355
  1 wyp 25 13188888888888
  2 test 30 13888888888888
  3 zs 34 899314121

 

  得到的结果也是用\t分割的。也可以用-f参数实现:

  [wyp@master ~/local]$ cat wyp.sql
  select * from wyp
  [wyp@master ~/local]$ hive -f wyp.sql >> local/wyp2.txt

  上述语句得到的结果也是\t分割的。


转载自过往记忆(http://www.iteblog.com/)

Hive几种数据导出方式的更多相关文章

  1. HIVE几种数据导入方式

    HIVE几种数据导入方式 今天的话题是总结Hive的几种常见的数据导入方式,我总结为四种:(1).从本地文件系统中导入数据到Hive表:(2).从HDFS上导入数据到Hive表:(3).从别的表中查询 ...

  2. Hive四种数据导入方式介绍

    问题导读 1.从本地文件系统中通过什么命令可导入数据到Hive表? 2.什么是动态分区插入? 3.该如何实现动态分区插入? 扩展: 这里可以和Hive中的三种不同的数据导出方式介绍进行对比? Hive ...

  3. 【hive】——Hive四种数据导入方式

    Hive的几种常见的数据导入方式这里介绍四种:(1).从本地文件系统中导入数据到Hive表:(2).从HDFS上导入数据到Hive表:(3).从别的表中查询出相应的数据并导入到Hive表中:(4).在 ...

  4. Hive总结(七)Hive四种数据导入方式

  5. Hive中的三种不同的数据导出方式介绍

    问题导读:1.导出本地文件系统和hdfs文件系统区别是什么?2.带有local命令是指导出本地还是hdfs文件系统?3.hive中,使用的insert与传统数据库insert的区别是什么?4.导出数据 ...

  6. iOS开发中的4种数据持久化方式【二、数据库 SQLite3、Core Data 的运用】

                   在上文,我们介绍了ios开发中的其中2种数据持久化方式:属性列表.归档解档.本节将继续介绍另外2种iOS持久化数据的方法:数据库 SQLite3.Core Data 的运 ...

  7. 四种数据持久化方式(下) :SQLite3 和 Core Data

    在上文,我们介绍了iOS开发中的其中2种数据持久化方式:属性列表.归档解档. 本节将继续介绍另外2种iOS持久化数据的方法:数据库 SQLite3.Core Data 的运用: 在本节,将通过对4个文 ...

  8. Android编程中的5种数据存储方式

    Android编程中的5种数据存储方式 作者:牛奶.不加糖 字体:[增加 减小] 类型:转载 时间:2015-12-03我要评论 这篇文章主要介绍了Android编程中的5种数据存储方式,结合实例形式 ...

  9. Android五种数据存储方式

    android 五种数据存储 :SharePreferences.SQLite.Contert Provider.File.网络存储 Android系统提供了四种存储数据方式.分别为:SharePre ...

随机推荐

  1. LINUX 更新

    sudo apt-get dist-upgrade,更新所有的软件

  2. [刘阳Java]_斗胆介绍一下Eclipse快捷键大全[超详细]_第6讲

    斗胆让我在这里介绍一下Eclipse快捷键有哪些 ctrl+shirt+r 打开资源 这组快捷键可以让你开打Eclipse工作区中任何一个文件,你只需要输入你想查找的文件名字即可,而且绝对支持模糊检索 ...

  3. Kinect2在线重建(Tracking and Mapping)

    前言      个人理解错误的地方还请不吝赐教,转载请标明出处,内容如有改动更新,请看原博:http://www.cnblogs.com/hitcm/      如有任何问题,feel free to ...

  4. js ShowDialogModal 关闭子页面并刷新父页面,保留查询条件

    不知道大家有没有碰到类似的问题,当时的你是什么思路来处理这个问题呢?是url,session,cookie,还是…… 今天笔者就遇到了这个问题,当时的想法如:url,session,cookie都尝试 ...

  5. checkbox全选-取消-再全选没有显示问题

    源码: <input type="checkbox" id="cleckAll" />全选 <div class="list&quo ...

  6. Android中脱离WebView使用WebSocket实现群聊和推送功能

    WebSocket是Web2.0时代的新产物,用于弥补HTTP协议的某些不足,不过他们之间真实的关系是兄弟关系,都是对socket的进一步封装,其目前最直观的表现就是服务器推送和聊天功能.更多知识参考 ...

  7. 文件上传——servlet实现

    自己对照别的博主的博客实现的,记录用. 整个上传的结构如下: 上传的页面:unload.jsp <%@ page language="java" import="j ...

  8. dddddd

    (function(window){ var com = function(box){ this.box = document.querySelector(box); } window.zhangle ...

  9. 如何查看SharePoint未知错误的详细信息

    在sharepoint 开发的时候,需要查看具体的sharepoint报错信息需要在配置文件中配置如下 通过下面方法就可以直接在出错页面查看错误信息.修改Web应用程序根目录上的Web.config文 ...

  10. Android之GridView

    <GridView android:id="@+id/gridView" android:layout_width="match_parent" andr ...