Hive的两种表

1.内部表

内部表Load数据有两种方式：① Load data ***；②hdfs dfs -put ****。这是因为在Metastore文件，即mysql的hive数据库的“SDS”表中，保存着Hive表对应的hdfs路径信息。
内部表在Load数据时，如果使用LOCAL关键字，Hive会把本地文件系统中的数据文件复制到Hive的 /warehouse 目录。反之，则是将HDFS上的数据文件剪切到 /warehouse 目录。
Hive在Load数据时，并不检查目录中的文件是否符合表所声明的模式。只有通过SELECT查询返回空值NULL，才能确定不匹配。
内部表drop时，表的元数据(mysql中)和数据文件(hdfs中)都会被删除。

create table book (id bigint, name string) row format delimited fields terminated by '\t';

2.外部表

外部表Load数据也有两种方式。
外部表只需在创建表时显示指定表中数据存储位置即可。Hive不会把数据剪切到自己的目录。
实际上，在创建表时，Hive甚至不会检查这一外部位置是否存在。这是一个非常重要的特性，这意味着可以先创建表，再上传数据文件。
如果不显示指定外部表的存放路径，这样Hive将在HDFS上的 /user/hive/warehouse/ 文件夹下创建一个以外部表表名的文件夹，并将属于这个表的数据存放在这里。
对于创建外部表命令，执行成功后，会在hdfs上自动创建空目录'/book'用来存储数据文件。
外部表在drop时，不会碰数据文件，而只会删除元数据信息，即HDFS上的'/book'目录依旧存在。

create external table book (id bigint, name string) row format delimited fields terminated by '\t' location '/book';

区别：

1. 在导入数据到外部表，数据并没有移动到 '/user/hive/warehouse/T_Name'目录下，也就是说外部表中的数据并不是由它自己来管理的！而内部表则不一样；

2. 在删除内部表的时候，Hive将会把属于内部表的元数据和数据文件全部删掉；而删除外部表的时候，Hive仅仅删除外部表的元数据，数据文件是不会删除的！

3.两种表的选择：推荐使用外部表(跨部门的数据)

4.默认行内分隔符

如果在创建表时没有用row format或stored as子句，那么Hive使用默认格式来分割的每一行。
默认的行内分隔符不是制表符，而是ASCII控制码集合中的Control-A(它的ASCII码为1)
这是因为它出现在文本中的概率相对于制表符来说概率更小。

CREATE TABLE records ( id string ) Row Format Delimited Fields Terminated By ‘\t’ ;

　　英语解释：行内格式的限定符以 ' \t '结尾终止

Hive的两种表的更多相关文章

MySQL Innodb的两种表空间方式
要说表空间,MySQL的表空间管理远远说不上完善.换句话说,事实上MySQL根本没有真正意义上的表空间管理.MySQL的Innodb包含两种表空间文件模式,默认的共享表空间和每个表分离的独立表空间.只 ...
select into from和insert into select from两种表复制语句区别
select into from和insert into select from两种表复制语句都是将源表source_table的记录插入到目标表target_table,但两句又有区别. 第一句(s ...
INNODB与MyISAM两种表存储引擎区别
mysql数据库分类为INNODB为MyISAM两种表存储引擎了,两种各有优化在不同类型网站可能选择不同,下面小编为各位介绍mysql更改表引擎INNODB为MyISAM技巧. 常见的mysql表引擎 ...
问题：oracle select into；结果：oracle SELECT INTO 和 INSERT INTO SELECT 两种表复制语句详解
oracle SELECT INTO 和 INSERT INTO SELECT 两种表复制语句详解 (2011-07-08 08:59:47) 转载▼ 标签: it 分类: oracle 我们经常会遇 ...
oracle数据库【表复制】insert into select from跟create table as select * from 两种表复制语句区别
create table as select * from和insert into select from两种表复制语句区别 create table targer_table as select ...
hive的两种使用方式
hive的两种使用方式 1,hive shell的方式启动命令: bin/hive 2.beeline客户端方式首先在一个机器上启动hive thrift服务 bin/hiveserver2 在其 ...
PostgreSQL SELECT INTO和INSERT INTO SELECT 两种表复制语句
SELECT INTO和INSERT INTO SELECT两种表复制语句都可以用来复制表与表之间的数据,但是它们之间也有区别. 建表语句: bas_custom_rel表 CREATE TABLE ...
大数据学习day26----hive01----1hive的简介 2 hive的安装（hive的两种连接方式，后台启动，标准输出，错误输出）3. 数据库的基本操作 4. 建表（内部表和外部表的创建以及应用场景，数据导入，学生、分数sql练习）5.分区表 6加载数据的方式
1. hive的简介(具体见文档) Hive是分析处理结构化数据的工具本质:将hive sql转化成MapReduce程序或者spark程序 Hive处理的数据一般存储在HDFS上,其分析数据底 ...
MySQL两种表存储结构MyISAM和InnoDB的性能比较测试
转载 http://www.jb51.net/article/5620.htm MySQL支持的两种主要表存储格式MyISAM,InnoDB,上个月做个项目时,先使用了InnoDB,结果速度特别慢,1 ...

随机推荐

虚拟机VMWare安装苹果系统MacOS详细教程（联网设置，全屏插件、文件互传）
运行环境: VMware® Workstation 12 Pro(自行安装,或者用这个) 推荐(下面以10.11.6版本做的教程,但是安装时推荐使用此版本安装然后升级到10.11.6):MacOS X ...
微信开发获取用户openId 与路由控制
w实践,满足当前需求. www.w.com www.w.com/w1.php $wxurl='https://open.weixin.qq.com/connect/oauth2/authorize?a ...
Cookies and Session Tracking Client Identification cookie与会话跟踪客户端识别
w HTTP The Definitive Guide Cookies can be used to track users as they make multiple transactions to ...
python基础-第四篇-4.1内置函数
lambda表达式 lambda表达式是对简单函数的精简化表达语法结构:函数名 = lambda:运算表达式 def f1(a): a = a + 1 return a ret = f1(1) pr ...
Php 创建XML
Php 创建XML Php 创建XML并保存,学习示比例如以下: <? php try{ //创建DOMDocument 对象 $dom = new DOMDocument("1.0 ...
Elasticsearch.js 发布 —— 在Node.js和浏览器中调用Elasticsearch
继PHP.Ruby.Python和Perl之后,Elasticsearch最近发布了Elasticsearch.js,Elasticsearch的JavaScript客户端库.可以在Node.js和浏 ...
模块讲解----random模块（随机取值）
导入random模块 import random #查看random的帮助: # help(random) #随机浮点数: #用于生成一个0到1的0 >= n < 1.0的范围值 prin ...
boost编译很慢的解决方法
场景:使用boost库的正则模块时出现编译超慢的情况,看了头文件 #include <boost/regex.hpp> 的引用关系,它依赖的头文件相当多,这应该就是根本原因吧. 目前知道可 ...
python 中list的操作（循环、切片、增、删、改、查、反转、排序）
列表的索引(下标)从0开始,最后一个可以用-1表示. 1. 循环如果直接for 循环一个list 的时候,那么每次循环的都是这个List里的元素 2. 切片可指定步长进行取值,步长默认为1 3. ...
PKU 1094 Sorting It All Out(拓扑排序)
题目大意:就是给定一组字母的大小关系判断他们是否能组成唯一的拓扑序列. 是典型的拓扑排序,但输出格式上确有三种形式: 1.该字母序列有序,并依次输出: 2.判断该序列是否唯一: 3.该序列字母次序之间 ...

Hive的两种表

Hive的两种表的更多相关文章

随机推荐

热门专题