Hive——元数据表含义
Hive——元数据表含义
1、VERSION -- 查询版本信息
| Field | Type | Comment | |
|---|---|---|---|
| VER_ID | bigint(20) | ID主键 | |
| SCHEMA_VERSION | varchar(127) | Hive版本 | |
| VERSION_COMMENT | varchar(255) | 版本说明 |
2、DBS -- 存储Hive中所有数据库的基本信息
| Field | Type | Comment | |
|---|---|---|---|
| DB_ID | bigint(20) | 数据库ID | |
| DESC | varchar(4000) | 数据库描述 | |
| DB_LOCATION_URI | varchar(4000) | 数据库HDFS路径 | |
| NAME | varchar(128) | 数据库名 | |
| OWNER_NAME | varchar(128) | 数据库所有者用户名 | |
| OWNER_TYPE | varchar(10) | 所有者角色 |
3、DATABASE_PARAMS --该表存储数据库的相关参数,在CREATE DATABASE时候用
| Field | Type | Comment | |
|---|---|---|---|
| DB_ID | bigint(20) | 数据库ID | |
| PARAM_KEY | varchar(180) | 参数名 | |
| PARAM_VALUE | varchar(4000) | 参数值 |
4、TBLS --该表中存储Hive表、视图、索引表的基本信息
| Field | Type | Comment | |
|---|---|---|---|
| TBL_ID | bigint(20) | 表ID | |
| CREATE_TIME | int(11) | 创建时间 | |
| DB_ID | bigint(20) | 数据库ID | |
| LAST_ACCESS_TIME | int(11) | 上次访问时间 | |
| OWNER | varchar(767) | 所有者 | |
| RETENTION | int(11) | 保留字段 | |
| SD_ID | bigint(20) | 序列化配置信息 | |
| TBL_NAME | varchar(128) | 表名 | |
| TBL_TYPE | varchar(128) | 表类型 | |
| VIEW_EXPANDED_TEXT | mediumtext | 视图的详细HQL语句 | |
| VIEW_ORIGINAL_TEXT | mediumtext | 视图的原始HQL语句 |
5、TABLE_PARAMS --该表存储表/视图的属性信息。
| Field | Type | Comment | |
|---|---|---|---|
| TBL_ID | bigint(20) | 表ID | |
| PARAM_KEY | varchar(256) | 属性名 | |
| PARAM_VALUE | varchar(4000) | 属性值 |
6、SDS --该表保存文件存储的基本信息,如INPUT_FORMAT、OUTPUT_FORMAT、是否压缩等。
| Field | Type | Comment | |
|---|---|---|---|
| SD_ID | bigint(20) | 存储信息ID | |
| CD_ID | bigint(20) | 字段信息ID | |
| INPUT_FORMAT | varchar(4000) | 文件输入格式 | |
| IS_COMPRESSED | bit(1) | 是否压缩 | |
| IS_STOREDASSUBDIRECTORIES | bit(1) | 是否以子目录存储 | |
| LOCATION | varchar(4000) | HDFS路径 | |
| NUM_BUCKETS | int(11) | 分桶数量 | |
| OUTPUT_FORMAT | varchar(4000) | 文件输出格式 | |
| SERDE_ID | bigint(20) | 序列化类ID |
7、SERDS --该表存储序列化使用的类信息
| Field | Type | Comment | |
|---|---|---|---|
| SERDE_ID | bigint(20) | 序列化类配置ID | |
| NAME | varchar(128) | 序列化类别名 | |
| SLIB | varchar(4000) | 序列化类 |
8、SERDE_PARAMS --该表存储序列化的一些属性、格式信息,比如:行、列分隔符
| Field | Type | Comment | |
|---|---|---|---|
| SERDE_ID | bigint(20) | 序列化类配置ID | |
| PARAM_KEY | varchar(256) | 属性名 | |
| PARAM_VALUE | varchar(4000) | 属性值 |
9、COLUMNS_V2 --该表存储表对应的字段信息。
| Field | Type | Comment | |
|---|---|---|---|
| CD_ID | bigint(20) | 字段信息ID | |
| COMMENT | varchar(256) | 字段注释 | |
| COLUMN_NAME | varchar(128) | 字段名 | |
| TYPE_NAME | varchar(4000) | 字段类型 | |
| INTEGER_IDX | int(11) | 字段顺序 |
10、PARTITIONS --该表存储表分区的基本信息。
| Field | Type | Comment | |
|---|---|---|---|
| PART_ID | bigint(20) | 分区ID | |
| CREATE_TIME | int(11) | 分区创建时间 | |
| LAST_ACCESS_TIME | int(11) | 最后一次访问时间 | |
| PART_NAME | varchar(767) | 分区名 | |
| SD_ID | bigint(20) | 分区存储ID | |
| TBL_ID | bigint(20) | 表ID |
11、PARTITION_KEYS --该表存储分区的字段信息。
| Field | Type | Comment | |
|---|---|---|---|
| TBL_ID | bigint(20) | 表ID | |
| PKEY_COMMENT | varchar(4000) | 分区字段说明 | |
| PKEY_NAME | varchar(128) | 分区字段名 | |
| PKEY_TYPE | varchar(767) | 分区字段类型 | |
| INTEGER_IDX | int(11) | 分区字段顺序 |
12、PARTITION_KEY_VALS --该表存储分区字段值。
| Field | Type | Comment | |
|---|---|---|---|
| PART_ID | bigint(20) | 分区ID | |
| PART_KEY_VAL | varchar(255) | 分区字段值 | |
| INTEGER_IDX | int(11) | 分区字段值顺序 |
13、PARTITION_PARAMS --该表存储分区的属性信息。
| Field | Type | Comment | |
|---|---|---|---|
| PART_ID | bigint(20) | 分区ID | |
| PARAM_KEY | varchar(256) | 分区属性名 | |
| PARAM_VALUE | varchar(4000) | 分区属性值 |
其他不常用的元数据表:
DB_PRIVS:数据库权限信息表。通过GRANT语句对数据库授权后,将会在这里存储。
IDXS:索引表,存储Hive索引相关的元数据
INDEX_PARAMS:索引相关的属性信息。
TAB_COL_STATS:表字段的统计信息。使用ANALYZE语句对表字段分析后记录在这里。
TBL_COL_PRIVS:表字段的授权信息
PART_PRIVS:分区的授权信息
PART_COL_STATS:分区字段的统计信息。
PART_COL_PRIVS:分区字段的权限信息。
FUNCS:用户注册的函数信息
FUNC_RU:用户注册函数的资源信息
Hive——元数据表含义的更多相关文章
- Hive学习之路 (三)Hive元数据信息对应MySQL数据库表
概述 Hive 的元数据信息通常存储在关系型数据库中,常用MySQL数据库作为元数据库管理.上一篇hive的安装也是将元数据信息存放在MySQL数据库中. Hive的元数据信息在MySQL数据中有57 ...
- Hive(三)Hive元数据信息对应MySQL数据库表
概述 Hive 的元数据信息通常存储在关系型数据库中,常用MySQL数据库作为元数据库管理.上一篇hive的安装也是将元数据信息存放在MySQL数据库中. Hive的元数据信息在MySQL数据中有57 ...
- Apache Hive (三)Hive元数据信息对应MySQL数据库表
转自:https://www.cnblogs.com/qingyunzong/p/8710356.html 概述 Hive 的元数据信息通常存储在关系型数据库中,常用MySQL数据库作为元数据库管理. ...
- 【转】Hive内部表、外部表
hive内部表.外部表区别自不用说,可实际用的时候还是要小心. 1. 内部表: create table tt (name string , age string) location '/input/ ...
- hive内部表、外部表
hive内部表.外部表区别自不用说,可实际用的时候还是要小心. Hive的数据分为表数据和元数据,表数据是Hive中表格(table)具有的数据:而元数据是用来存储表的名字,表的列和分区及其属性,表的 ...
- hive内部表与外部表区别
1.在Hive里面创建一个表: hive> create table wyp(id int, > name string, > age int, > tele ...
- 如何监听对 HIVE 元数据的操作
目录 简介 HIVE 基本操作 获取 HIVE 源码 编译 HIVE 源码 启动 HIVE 停止 HIVE 监听对 HIVE 元数据的操作 参考文档 简介 公司有个元数据管理平台,会定期同步 HIVE ...
- hive元数据研究
hive的元数据存放在关系型数据库中,元数据中存储了hive中所有表格的信息,包括表格的名字,表格的字段,字段的类型,注释.这些信息分散的存放在各个表中,给定一个hive中的表格名字,查询这个表中含有 ...
- hive内部表、外部表、分区
hive内部表.外部表.分区 内部表(managed table) 默认创建的是内部表(managed table),存储位置在hive.metastore.warehouse.dir设置,默认位置是 ...
随机推荐
- 循环IRNNv2Layer实现
循环IRNNv2Layer实现 IRNNv2Layer实现循环层,例如循环神经网络(RNN),门控循环单元(GRU)和长期短期记忆(LSTM).支持的类型为RNN,GRU和LSTM.它执行循环操作,该 ...
- TVM源码框架安装方法
TVM源码框架安装方法 本文提供如何在各种系统上从零构建和安装TVM包的说明.它包括两个步骤: 首先从C++代码中构建共享库(linux的libtvm.so,macOS的libtvm.dylib和wi ...
- 预测汽车级Linux专业技术的需求
预测汽车级Linux专业技术的需求 Anticipating need for Automotive Grade Linux expertise 在听了多年汽车级Linux(AGL)及其所有潜力之后, ...
- 1482. 制作 m 束花所需的最少天数
2021-05-09 LeetCode每日一题 链接:https://leetcode-cn.com/problems/minimum-number-of-days-to-make-m-bouquet ...
- 【九】Kubernetes 之 Service 概念图文讲解及功能演示
Service 概念 Kubernetes Service 定义了这样一种抽象:逻辑上的一组 Pod,一种可以访问它们的策略 -- 通常称为微服务. Service 通常是通过 Label Selec ...
- Visual Studio 2019本地不能运行Azure Functions
最近一个项目,需要维护同事写得代码,主要是一堆基于 .net core 3.1 的 Azure Functions.想起2年前第一次接触 Azure Functions(那次是基于.net frame ...
- 卢卡斯定理&&中国剩余定理
卢卡斯定理(模数较小,且是质数) 式子C(m,n)=C(m/p,n/p)*C(m%p,n%p)%p 至于证明(我也不会QAQ,只要记住公式也该就好了). 同时卢卡斯定理一般用于组合数取模上 1.首先当 ...
- 自动删除n天前的日志(此处用于业务删除xml文件)
Linux应用总结:自动删除n天前的日志 linux是一个很能自动产生文件的系统,日志.邮件.备份等.虽然现在硬盘廉价,我们可以有很多硬盘空间供这些文件浪费,让系统定时清理一些不需要的文件很有一种爽快 ...
- SpringBoot实战:10分钟快速搞定环境
什么是 springboot Spring Boot是由Pivotal团队提供的全新框架,其设计目的是用来简化新Spring应用的初始搭建以及开发过程. 该框架使用了特定的方式来进行配置,从而使开发人 ...
- Redmine部署
Redmine部署文章: 第一篇:Redmine部署 第二篇:Redmine部署中遇到的问题 部门内部需要项目开发维护的网站,这种网站有付费的,也有开源项目.这类项目管理与协作的工具主要的MS Sha ...