Hive——元数据表含义

1、VERSION   -- 查询版本信息

  Field Type Comment
  VER_ID bigint(20) ID主键
  SCHEMA_VERSION varchar(127) Hive版本
  VERSION_COMMENT varchar(255) 版本说明

2、DBS     -- 存储Hive中所有数据库的基本信息

  Field Type Comment
  DB_ID bigint(20) 数据库ID
  DESC varchar(4000) 数据库描述
  DB_LOCATION_URI varchar(4000) 数据库HDFS路径
  NAME varchar(128) 数据库名
  OWNER_NAME varchar(128) 数据库所有者用户名
  OWNER_TYPE varchar(10) 所有者角色

3、DATABASE_PARAMS  --该表存储数据库的相关参数,在CREATE DATABASE时候用

  Field Type Comment
  DB_ID bigint(20) 数据库ID
  PARAM_KEY varchar(180) 参数名
  PARAM_VALUE varchar(4000) 参数值

4、TBLS  --该表中存储Hive表、视图、索引表的基本信息

  Field Type Comment
  TBL_ID bigint(20) 表ID
  CREATE_TIME int(11) 创建时间
  DB_ID bigint(20) 数据库ID
  LAST_ACCESS_TIME int(11) 上次访问时间
  OWNER varchar(767) 所有者
  RETENTION int(11) 保留字段
  SD_ID bigint(20) 序列化配置信息
  TBL_NAME varchar(128) 表名
  TBL_TYPE varchar(128) 表类型
  VIEW_EXPANDED_TEXT mediumtext 视图的详细HQL语句
  VIEW_ORIGINAL_TEXT mediumtext 视图的原始HQL语句

5、TABLE_PARAMS  --该表存储表/视图的属性信息。

  Field Type Comment
  TBL_ID bigint(20) 表ID
  PARAM_KEY varchar(256) 属性名
  PARAM_VALUE varchar(4000) 属性值

6、SDS  --该表保存文件存储的基本信息,如INPUT_FORMAT、OUTPUT_FORMAT、是否压缩等。

  Field Type Comment
  SD_ID bigint(20) 存储信息ID
  CD_ID bigint(20) 字段信息ID
  INPUT_FORMAT varchar(4000) 文件输入格式
  IS_COMPRESSED bit(1) 是否压缩
  IS_STOREDASSUBDIRECTORIES bit(1) 是否以子目录存储
  LOCATION varchar(4000) HDFS路径
  NUM_BUCKETS int(11) 分桶数量
  OUTPUT_FORMAT varchar(4000) 文件输出格式
  SERDE_ID bigint(20) 序列化类ID

7、SERDS      --该表存储序列化使用的类信息

  Field Type Comment
  SERDE_ID bigint(20) 序列化类配置ID
  NAME varchar(128) 序列化类别名
  SLIB varchar(4000) 序列化类

8、SERDE_PARAMS      --该表存储序列化的一些属性、格式信息,比如:行、列分隔符

  Field Type Comment
  SERDE_ID bigint(20) 序列化类配置ID
  PARAM_KEY varchar(256) 属性名
  PARAM_VALUE varchar(4000) 属性值

9、COLUMNS_V2      --该表存储表对应的字段信息。

  Field Type Comment
  CD_ID bigint(20) 字段信息ID
  COMMENT varchar(256) 字段注释
  COLUMN_NAME varchar(128) 字段名
  TYPE_NAME varchar(4000) 字段类型
  INTEGER_IDX int(11) 字段顺序

10、PARTITIONS      --该表存储表分区的基本信息。

  Field Type Comment
  PART_ID bigint(20) 分区ID
  CREATE_TIME int(11) 分区创建时间
  LAST_ACCESS_TIME int(11) 最后一次访问时间
  PART_NAME varchar(767) 分区名
  SD_ID bigint(20) 分区存储ID
  TBL_ID bigint(20) 表ID

11、PARTITION_KEYS      --该表存储分区的字段信息。

  Field Type Comment
  TBL_ID bigint(20) 表ID
  PKEY_COMMENT varchar(4000) 分区字段说明
  PKEY_NAME varchar(128) 分区字段名
  PKEY_TYPE varchar(767) 分区字段类型
  INTEGER_IDX int(11) 分区字段顺序

12、PARTITION_KEY_VALS      --该表存储分区字段值。

  Field Type Comment
  PART_ID bigint(20) 分区ID
  PART_KEY_VAL varchar(255) 分区字段值
  INTEGER_IDX int(11) 分区字段值顺序

13、PARTITION_PARAMS      --该表存储分区的属性信息。

  Field Type Comment
  PART_ID bigint(20) 分区ID
  PARAM_KEY varchar(256) 分区属性名
  PARAM_VALUE varchar(4000) 分区属性值

其他不常用的元数据表:

DB_PRIVS:数据库权限信息表。通过GRANT语句对数据库授权后,将会在这里存储。

IDXS:索引表,存储Hive索引相关的元数据

INDEX_PARAMS:索引相关的属性信息。

TAB_COL_STATS:表字段的统计信息。使用ANALYZE语句对表字段分析后记录在这里。

TBL_COL_PRIVS:表字段的授权信息

PART_PRIVS:分区的授权信息

PART_COL_STATS:分区字段的统计信息。

PART_COL_PRIVS:分区字段的权限信息。

FUNCS:用户注册的函数信息

FUNC_RU:用户注册函数的资源信息

Hive——元数据表含义的更多相关文章

  1. Hive学习之路 (三)Hive元数据信息对应MySQL数据库表

    概述 Hive 的元数据信息通常存储在关系型数据库中,常用MySQL数据库作为元数据库管理.上一篇hive的安装也是将元数据信息存放在MySQL数据库中. Hive的元数据信息在MySQL数据中有57 ...

  2. Hive(三)Hive元数据信息对应MySQL数据库表

    概述 Hive 的元数据信息通常存储在关系型数据库中,常用MySQL数据库作为元数据库管理.上一篇hive的安装也是将元数据信息存放在MySQL数据库中. Hive的元数据信息在MySQL数据中有57 ...

  3. Apache Hive (三)Hive元数据信息对应MySQL数据库表

    转自:https://www.cnblogs.com/qingyunzong/p/8710356.html 概述 Hive 的元数据信息通常存储在关系型数据库中,常用MySQL数据库作为元数据库管理. ...

  4. 【转】Hive内部表、外部表

    hive内部表.外部表区别自不用说,可实际用的时候还是要小心. 1. 内部表: create table tt (name string , age string) location '/input/ ...

  5. hive内部表、外部表

    hive内部表.外部表区别自不用说,可实际用的时候还是要小心. Hive的数据分为表数据和元数据,表数据是Hive中表格(table)具有的数据:而元数据是用来存储表的名字,表的列和分区及其属性,表的 ...

  6. hive内部表与外部表区别

    1.在Hive里面创建一个表: hive> create table wyp(id int,    > name string,    > age int,    > tele ...

  7. 如何监听对 HIVE 元数据的操作

    目录 简介 HIVE 基本操作 获取 HIVE 源码 编译 HIVE 源码 启动 HIVE 停止 HIVE 监听对 HIVE 元数据的操作 参考文档 简介 公司有个元数据管理平台,会定期同步 HIVE ...

  8. hive元数据研究

    hive的元数据存放在关系型数据库中,元数据中存储了hive中所有表格的信息,包括表格的名字,表格的字段,字段的类型,注释.这些信息分散的存放在各个表中,给定一个hive中的表格名字,查询这个表中含有 ...

  9. hive内部表、外部表、分区

    hive内部表.外部表.分区 内部表(managed table) 默认创建的是内部表(managed table),存储位置在hive.metastore.warehouse.dir设置,默认位置是 ...

随机推荐

  1. 循环IRNNv2Layer实现

    循环IRNNv2Layer实现 IRNNv2Layer实现循环层,例如循环神经网络(RNN),门控循环单元(GRU)和长期短期记忆(LSTM).支持的类型为RNN,GRU和LSTM.它执行循环操作,该 ...

  2. TVM源码框架安装方法

    TVM源码框架安装方法 本文提供如何在各种系统上从零构建和安装TVM包的说明.它包括两个步骤: 首先从C++代码中构建共享库(linux的libtvm.so,macOS的libtvm.dylib和wi ...

  3. 预测汽车级Linux专业技术的需求

    预测汽车级Linux专业技术的需求 Anticipating need for Automotive Grade Linux expertise 在听了多年汽车级Linux(AGL)及其所有潜力之后, ...

  4. 1482. 制作 m 束花所需的最少天数

    2021-05-09 LeetCode每日一题 链接:https://leetcode-cn.com/problems/minimum-number-of-days-to-make-m-bouquet ...

  5. 【九】Kubernetes 之 Service 概念图文讲解及功能演示

    Service 概念 Kubernetes Service 定义了这样一种抽象:逻辑上的一组 Pod,一种可以访问它们的策略 -- 通常称为微服务. Service 通常是通过 Label Selec ...

  6. Visual Studio 2019本地不能运行Azure Functions

    最近一个项目,需要维护同事写得代码,主要是一堆基于 .net core 3.1 的 Azure Functions.想起2年前第一次接触 Azure Functions(那次是基于.net frame ...

  7. 卢卡斯定理&&中国剩余定理

    卢卡斯定理(模数较小,且是质数) 式子C(m,n)=C(m/p,n/p)*C(m%p,n%p)%p 至于证明(我也不会QAQ,只要记住公式也该就好了). 同时卢卡斯定理一般用于组合数取模上 1.首先当 ...

  8. 自动删除n天前的日志(此处用于业务删除xml文件)

    Linux应用总结:自动删除n天前的日志 linux是一个很能自动产生文件的系统,日志.邮件.备份等.虽然现在硬盘廉价,我们可以有很多硬盘空间供这些文件浪费,让系统定时清理一些不需要的文件很有一种爽快 ...

  9. SpringBoot实战:10分钟快速搞定环境

    什么是 springboot Spring Boot是由Pivotal团队提供的全新框架,其设计目的是用来简化新Spring应用的初始搭建以及开发过程. 该框架使用了特定的方式来进行配置,从而使开发人 ...

  10. Redmine部署

    Redmine部署文章: 第一篇:Redmine部署 第二篇:Redmine部署中遇到的问题 部门内部需要项目开发维护的网站,这种网站有付费的,也有开源项目.这类项目管理与协作的工具主要的MS Sha ...