HIVE外部表分区表

HIVE外部表分区表
外部表
创建hive表，经过检查发现TBLS表中，hive表的类型为MANAGED_TABLE.

在真实开发中，很可能在hdfs中已经有了数据，希望通过hive直接使用这些数据作为表内容。
此时可以直接创建出hdfs文件夹，其中放置数据，再在hive中创建表管来管理，这种方式创建出来的表叫做外部表。

#创建目录，上传已有文件
       hadoop fs -mkdir /data
       hadoop fs -put student.txt /datax/a.txt
       hadoop fs -put student.txt /datax/b.txt
       #在hive中创建外部表管理已有数据
       create external table ext_student(id int ,name string) row format delimited fields terminated by '\t' location '/datax';
       经过检查发现可以使用其中的数据。成功的建立了一张外部表。

#vim ppp.txt
           1   x
           2   y
           3   z
       #hadoop fs - put peo.avi
       再在该目录下手动创建文件，能不能查询出来呢？
       发现是可以的。

不管是内部表还是外部表，新增的文件都可以自动被应用。

在删除表时，内部表一旦删除对应元数据和hdfs中的文件夹和文件都会被删除。外部表只删除元数据，对应的hdfs中的文件夹和文件不会被删除。
   分区表
       hive也支持分区表
       对数据进行分区可以提高查询时的效率
       普通表和分区表区别：有大量数据增加的需要建分区表
       create table book (id bigint, name string) partitioned by (category string) row format delimited fields terminated by '\t';
       在创建分区表时，partitioned字段可以不在字段列表中。生成的文件自动就会具有该字段。

       分区表加载数据
       load data local inpath './book_china.txt' overwrite into table book partition (category='china');
       load data local inpath './book_us.txt' overwrite into table book partition (pubdate='2015-01-11');

       select * from book;
       select * from book where pubdate='2010-08-22';
       经检查发现分区也是一个目录。
       此时手动创建目录是无法被hive使用的，因为元数据库中没有记录该分区。
       如果需要将自己创建的分区也能被识别，需要执行：
           ALTER TABLE book add PARTITION (category = 'zazhi') location '/user/hive/warehouse/datax.db/book/category=zazhi';

HIVE外部表分区表的更多相关文章

Hive 外部表分区表
之前主要研究oracle与mysql,认为hive事实上就是一种数据仓库的框架,也没有太多另类,所以主要精力都在研究hadoop.hbase,sqoop,mahout,近期略微用心看了下hive. ...
Hive 外部表的练习(多表关联查询,以及分组,子查询)
Hive 外部表的练习 hive创建库和表操作 hive加载数据,4种发放 1.数据放在Linux创建表结构进行加载 2.先定义表结构.将一个查询select语句结果插入到表中 3.数据先放在hdf ...
hive外部表删除遇到的一个坑
hive外部表删除遇到的一个坑操作步骤创建某个表(create external table xxx location xxx) 插入数据(insert xxx select xxx from x ...
hive外部表的建立与数据匹配
1.建立hive的外部表匹配hdfs上的数据出现如下报错: hive (solar)> ; OK Failed with exception java.io.IOException:java. ...
Hive 外部表新增字段或者修改字段类型等不生效
标题比较笼统,实际情况是: 对于Hive 的分区外部表的已有分区,在对表新增或者修改字段后,相关分区不生效. 原因是:表元数据虽然修改成功,但是分区也会对应列的元数据,这个地方不会随表的元数据修改而修 ...
hive 外部表和内部表的区别和相互转换
Hive内部表和外部表区别 1.创建内部表时,内部表的数据文件是保存在指定的路径的:如若创建外部表,则只记录数据所在的路径,不会对数据位置做改变. 2.删除表的时候,内部表元数据和数据会跟着一起删除. ...
hive -- 外部表、内部表、临时表
1.外部表关键字:EXTERNAL 外部表创建时需要指定LOCATION 删除外部表时,数据不被删除 CREATE EXTERNAL TABLE page_view(viewTime INT, us ...
hive外部表
创建外部表.数据从HDFS获取只是建立了链接,hdfs中的数据丢失,表中数据也丢失;hdfs数据增加,表中数据也增加上传文件创建外部表删除文件执行查询语句,发现少了
hive学习笔记之三：内部表和外部表
欢迎访问我的GitHub https://github.com/zq2599/blog_demos 内容:所有原创文章分类汇总及配套源码,涉及Java.Docker.Kubernetes.DevOPS ...

随机推荐

洛谷P1330 封锁阳光大学【dfs】
题目:https://www.luogu.org/problemnew/show/P1330 题意:一个无向边,一个河蟹可以占领一个点,但一个点只能被一个河蟹占领. 占领了一个点之后,这个点所有的边都 ...
X509
1 打开iis 找到部署的站点应用连接池,高级设置,“加载用户配置文件”项的值改为true 2 用户:certmgr.msc 本地计算机:mmc——文件——证书 --CN = QALINE001.on ...
IIS上传限制大小
加入下面的配置即可 <?xml version="1.0" encoding="UTF-8"?> <configuration> < ...
PHP mmysqli_affected_rows(connection);函数
mysqli_affected_rows(); 函数返回前一次 MySQL 操作所影响的记录行数. mysqli_affected_rows(connection); connection 必需.规定 ...
springboot2.0最精简的配置yml
https://blog.csdn.net/yu_hongrun/article/details/81708762
CF633C Spy Syndrome 2 trie树
这个模型以前绝对见过,模拟赛的时候开始敲了一个AC自动机,纯属脑抽~ code: #include <bits/stdc++.h> #define N 5000006 #define NN ...
spring-boot-starter-test
1.约定单元测试代码写在src/test/java目录下单元测试类命名为*Test,前缀为要测试的类名 2. 使用mock方式单元测试 Spring测试框架提供MockMvc对象,可以在不需要客户 ...
Spark（二）CentOS7.5之Spark2.3.1HA安装
一下载安装包 1 官方下载官方下载地址:http://spark.apache.org/downloads.html 2 安装前提 Java8 安装成功 zookeeper 安装成功 had ...
win10下linux子系统的文件夹的布局
我这里的目录为:C:\Users\com\AppData\Local\Packages\CanonicalGroupLimited.UbuntuonWindows_79rhkp1fndgsc\Loca ...
centos7 安装 mysql（在线安装）
在CentOS中默认安装有MariaDB,这个是MySQL的分支,但为了需要,还是要在系统中安装MySQL,而且安装完成之后可以直接覆盖掉MariaDB. 1 下载并安装MySQL官方的 Yum Re ...

HIVE外部表 分区表

HIVE外部表 分区表的更多相关文章

随机推荐

热门专题

HIVE外部表分区表

HIVE外部表分区表的更多相关文章