hadoop笔记之Hive的数据存储(内部表)

Xsky 2024-10-19 16:22:20 原文

Hive的数据存储(内部表)

Hive的数据存储(内部表)

基于HDFS

可使用hadoop给我们提供的web管理工具查看数据。打开管理工具localhost:9000–>Utilities下的Browse the file system–>/user/hive/warehouse就能看到表目录–>打开表目录能看到表文件–>点击表文件，会询问是否需要下载文件–>点击download，可以用编辑器查看文件

没有专门的数据存储格式(因为来自不同的数据库)
存储结构主要包括：数据库、文件、表、视图
可以直接加载文本文件(.txt文件等)
创建表时，指定Hive数据的列分隔符与行分隔符

表又分为;

Table 内部表
Partition 分区表
External Table 外部表
Bucket Table 桶表

而视图的概念，类似于表

内部表

与数据库中的Table在概念上是类似
每一个Table在Hive中都有一个相应的目录存储数据
所有Table数据(不包括External Table)都保存在这个目录中
删除表时，元数据与数据都会被删除

○如何创建一张内部表t1(第一列是id号(整数类型)，第二列是名称(字符串)，最后是年龄(整数类型))

create table t1
(tid int,tname string,age int);

将上述代码运行在hive当中，如果没有指定保存位置，则默认保存在/user/hive/warehouse下

当然我们也可以指定表的创建位置在/mytable/hive/t2

create table t2
(tid int,tname string,age int)
location '/mytable/hive/t2';

刚才我们创建两张表的时候没有指明列与列之间的分隔符，默认情况下hive中的表默认采用制表符作为分隔符。我们也可以在创建表的时候指明分隔符是什么。

create table t3
(tid int,tname string,age int)
row format delimited fields terminated by ',';

row format是说行的格式是什么。这里采用,号进行分割

我们在创建上面三张表的时候是没有任何数据的，那么可不可以创建的同时加入数据呢？当然是可以的。

这里有一张表

create table t4
as
select * from sample_data;

这样就可以查询语句的集合来创建t4表

注意我们在创建t4表的时候是没有指明分隔符的，所以t4表是没有分隔符的。如若要分隔符，如下：

create table t5
row format delimited fields terminated by ','
as
select * from sample_data;

当然我们还可以对表的结构进行一定修改

例如我们想在t1表上添加一个新的列

alter table t1 add columns(english int);

删除一张表

drop table t1;

在删除一张表的时候，就将该表移入hdfs的回收站中

hadoop笔记之Hive的数据存储(内部表)的更多相关文章

hadoop笔记之Hive的数据存储(外部表)
Hive的数据存储(外部表) Hive的数据存储(外部表) 外部表指向已经在HDFS中存在的数据,可以创建Partition 它和内部表在元数据的组织上是相同的,而实际数据的存储则有较大的差异外部 ...
hadoop笔记之Hive的数据存储(桶表)
Hive的数据存储(桶表) Hive的数据存储(桶表) 桶表桶表是对数据进行哈希取值,然后放到不同文件中存储. 比如说,创建三个桶,而创建桶的原则可以按照左边表中学生的名字来创建对应的桶.这样子把左 ...
hadoop笔记之Hive的数据存储(视图)
Hive的数据存储(视图) Hive的数据存储(视图) 视图(view) 视图是一种虚表,是一个逻辑概念:可以跨越多张表既然视图是一种虚表,那么也就是说用操作表的方式也可以操作视图但是视图是建立在 ...
hadoop笔记之Hive的数据存储(分区表)
Hive的数据存储(分区表) Hive的数据存储(分区表) 分区表 Partition对应于数据库的Partition列的密集索引在Hive中,表中的一个Partition对应于表下的一个目录,所有 ...
Hive 表操作（HIVE的数据存储、数据库、表、分区、分桶）
1.Hive的数据存储 Hive的数据存储基于Hadoop HDFS Hive没有专门的数据存储格式存储结构主要包括:数据库.文件.表.试图 Hive默认可以直接加载文本文件(TextFile),还 ...
大数据软件安装之Hadoop（Apache）（数据存储及计算）
大数据软件安装之Hadoop(Apache)(数据存储及计算) 一.生产环境准备 1.修改主机名 vim /etc/sysconfig/network 2.修改静态ip vim /etc/udev/r ...
一文彻底搞懂Hive的数据存储与压缩
目录行存储与列存储行存储的特点列存储的特点常见的数据格式 TextFile SequenceFile RCfile ORCfile 格式数据访问 Parquet 测试准备测试数据存储空间 ...
hadoop笔记之Hive入门(Hive的体系结构)
Hive入门(二) Hive入门(二) Hive的体系结构 ○ Hive的元数据 Hive将元数据存储在数据库中(metastore),支持mysql.derby.oracle等数据库,Hive默认是 ...
hadoop笔记之Hive入门(什么是Hive)
Hive入门(一) Hive入门(一) 什么是Hive? Hive是个数据仓库,数据仓库就是数据库,但又与一般意义上的数据库有点区别实际上,Hive是构建在hadoop HDFS上的一个数据仓库. ...

随机推荐

Mac下Mysql启动异常["ERROR 2002 (HY000): Can't connect to local MySQL server through socket '/tmp/mysql.sock' (2)"]
在mac下使用brew安装mysql,之前没有使用过,今天启动的时候发现启动不了 huijundeMacBook-Pro:bin huijunzhang$ mysql ERROR (HY000): C ...
Ajax实现动态的二级级联菜单
今天花了点时间用Ajax实现了一个二级级联菜单.整理总结一下.为了把重点放在Ajax和级联菜单的实现上,本文省略了数据库建表语句和操作数据库的代码! 数据库建表语句就不帖出来了.主要有两张表,区域表: ...
unity3d在Android端读取修改Json数据
首先我们需要下载一个文件 LitJson.dll(下载链接 ps: 是用自己的百度云盘下载的如果链接过时,请留言或自行下载, 密码: 5foa) 另外,由于我们要发布到安卓手机上,所以需要配置Jar和 ...
c++11: <thread>学习
<thread>头文件中包含thread类与this_thread命名空间,下面逐一介绍. thread类 1. 构造函数 (1)默认构造函数 thread() noexcept; 默认构 ...
git管理修改
为什么Git比其他版本控制系统设计得优秀,因为Git跟踪并管理的是修改,而非文件. 新增了一行,这就是一个修改,删除了一行,也是一个修改,更改了某些字符,也是一个修改,删了一些又加了一些,也是一个修改 ...
python3.5之string
刚开始学习python变成, 这勉强算是第一个博客吧, 主要记录了一下字符串中的方法, 不太准确,或者是错误的地方, 请大家指点 str1 = "GooGle" str2 = ...
C语言基础04
什么叫数组呢?我们的第一反应是很多数组合在一起就是数组,字面意思,当然不仅仅是数字,字符也是可以的. 数组属于构造类型 .指相同类型的若干变量组织起来. 类型说明符数组名 [常量表达式] int ...
docker 数据管理<1>
1. 挂载本地的目录到容器里: docker run -itd -v /data/:/data1 centos bash // -v 用来指定挂载目录, :前面的/data为本地目录,:后面的/dat ...
java中memcached
http://www.oschina.net/code/snippet_250396_9181
习题3.15 自调整表Find例程
#include<stdio.h> #include<stdlib.h> typedef int * List; /* 自调整表的Find数组实现 */ int Find(Li ...