Hive——元数据表含义

1、VERSION   -- 查询版本信息

  Field Type Comment
  VER_ID bigint(20) ID主键
  SCHEMA_VERSION varchar(127) Hive版本
  VERSION_COMMENT varchar(255) 版本说明

2、DBS     -- 存储Hive中所有数据库的基本信息

  Field Type Comment
  DB_ID bigint(20) 数据库ID
  DESC varchar(4000) 数据库描述
  DB_LOCATION_URI varchar(4000) 数据库HDFS路径
  NAME varchar(128) 数据库名
  OWNER_NAME varchar(128) 数据库所有者用户名
  OWNER_TYPE varchar(10) 所有者角色

3、DATABASE_PARAMS  --该表存储数据库的相关参数,在CREATE DATABASE时候用

  Field Type Comment
  DB_ID bigint(20) 数据库ID
  PARAM_KEY varchar(180) 参数名
  PARAM_VALUE varchar(4000) 参数值

4、TBLS  --该表中存储Hive表、视图、索引表的基本信息

  Field Type Comment
  TBL_ID bigint(20) 表ID
  CREATE_TIME int(11) 创建时间
  DB_ID bigint(20) 数据库ID
  LAST_ACCESS_TIME int(11) 上次访问时间
  OWNER varchar(767) 所有者
  RETENTION int(11) 保留字段
  SD_ID bigint(20) 序列化配置信息
  TBL_NAME varchar(128) 表名
  TBL_TYPE varchar(128) 表类型
  VIEW_EXPANDED_TEXT mediumtext 视图的详细HQL语句
  VIEW_ORIGINAL_TEXT mediumtext 视图的原始HQL语句

5、TABLE_PARAMS  --该表存储表/视图的属性信息。

  Field Type Comment
  TBL_ID bigint(20) 表ID
  PARAM_KEY varchar(256) 属性名
  PARAM_VALUE varchar(4000) 属性值

6、SDS  --该表保存文件存储的基本信息,如INPUT_FORMAT、OUTPUT_FORMAT、是否压缩等。

  Field Type Comment
  SD_ID bigint(20) 存储信息ID
  CD_ID bigint(20) 字段信息ID
  INPUT_FORMAT varchar(4000) 文件输入格式
  IS_COMPRESSED bit(1) 是否压缩
  IS_STOREDASSUBDIRECTORIES bit(1) 是否以子目录存储
  LOCATION varchar(4000) HDFS路径
  NUM_BUCKETS int(11) 分桶数量
  OUTPUT_FORMAT varchar(4000) 文件输出格式
  SERDE_ID bigint(20) 序列化类ID

7、SERDS      --该表存储序列化使用的类信息

  Field Type Comment
  SERDE_ID bigint(20) 序列化类配置ID
  NAME varchar(128) 序列化类别名
  SLIB varchar(4000) 序列化类

8、SERDE_PARAMS      --该表存储序列化的一些属性、格式信息,比如:行、列分隔符

  Field Type Comment
  SERDE_ID bigint(20) 序列化类配置ID
  PARAM_KEY varchar(256) 属性名
  PARAM_VALUE varchar(4000) 属性值

9、COLUMNS_V2      --该表存储表对应的字段信息。

  Field Type Comment
  CD_ID bigint(20) 字段信息ID
  COMMENT varchar(256) 字段注释
  COLUMN_NAME varchar(128) 字段名
  TYPE_NAME varchar(4000) 字段类型
  INTEGER_IDX int(11) 字段顺序

10、PARTITIONS      --该表存储表分区的基本信息。

  Field Type Comment
  PART_ID bigint(20) 分区ID
  CREATE_TIME int(11) 分区创建时间
  LAST_ACCESS_TIME int(11) 最后一次访问时间
  PART_NAME varchar(767) 分区名
  SD_ID bigint(20) 分区存储ID
  TBL_ID bigint(20) 表ID

11、PARTITION_KEYS      --该表存储分区的字段信息。

  Field Type Comment
  TBL_ID bigint(20) 表ID
  PKEY_COMMENT varchar(4000) 分区字段说明
  PKEY_NAME varchar(128) 分区字段名
  PKEY_TYPE varchar(767) 分区字段类型
  INTEGER_IDX int(11) 分区字段顺序

12、PARTITION_KEY_VALS      --该表存储分区字段值。

  Field Type Comment
  PART_ID bigint(20) 分区ID
  PART_KEY_VAL varchar(255) 分区字段值
  INTEGER_IDX int(11) 分区字段值顺序

13、PARTITION_PARAMS      --该表存储分区的属性信息。

  Field Type Comment
  PART_ID bigint(20) 分区ID
  PARAM_KEY varchar(256) 分区属性名
  PARAM_VALUE varchar(4000) 分区属性值

其他不常用的元数据表:

DB_PRIVS:数据库权限信息表。通过GRANT语句对数据库授权后,将会在这里存储。

IDXS:索引表,存储Hive索引相关的元数据

INDEX_PARAMS:索引相关的属性信息。

TAB_COL_STATS:表字段的统计信息。使用ANALYZE语句对表字段分析后记录在这里。

TBL_COL_PRIVS:表字段的授权信息

PART_PRIVS:分区的授权信息

PART_COL_STATS:分区字段的统计信息。

PART_COL_PRIVS:分区字段的权限信息。

FUNCS:用户注册的函数信息

FUNC_RU:用户注册函数的资源信息

Hive——元数据表含义的更多相关文章

  1. Hive学习之路 (三)Hive元数据信息对应MySQL数据库表

    概述 Hive 的元数据信息通常存储在关系型数据库中,常用MySQL数据库作为元数据库管理.上一篇hive的安装也是将元数据信息存放在MySQL数据库中. Hive的元数据信息在MySQL数据中有57 ...

  2. Hive(三)Hive元数据信息对应MySQL数据库表

    概述 Hive 的元数据信息通常存储在关系型数据库中,常用MySQL数据库作为元数据库管理.上一篇hive的安装也是将元数据信息存放在MySQL数据库中. Hive的元数据信息在MySQL数据中有57 ...

  3. Apache Hive (三)Hive元数据信息对应MySQL数据库表

    转自:https://www.cnblogs.com/qingyunzong/p/8710356.html 概述 Hive 的元数据信息通常存储在关系型数据库中,常用MySQL数据库作为元数据库管理. ...

  4. 【转】Hive内部表、外部表

    hive内部表.外部表区别自不用说,可实际用的时候还是要小心. 1. 内部表: create table tt (name string , age string) location '/input/ ...

  5. hive内部表、外部表

    hive内部表.外部表区别自不用说,可实际用的时候还是要小心. Hive的数据分为表数据和元数据,表数据是Hive中表格(table)具有的数据:而元数据是用来存储表的名字,表的列和分区及其属性,表的 ...

  6. hive内部表与外部表区别

    1.在Hive里面创建一个表: hive> create table wyp(id int,    > name string,    > age int,    > tele ...

  7. 如何监听对 HIVE 元数据的操作

    目录 简介 HIVE 基本操作 获取 HIVE 源码 编译 HIVE 源码 启动 HIVE 停止 HIVE 监听对 HIVE 元数据的操作 参考文档 简介 公司有个元数据管理平台,会定期同步 HIVE ...

  8. hive元数据研究

    hive的元数据存放在关系型数据库中,元数据中存储了hive中所有表格的信息,包括表格的名字,表格的字段,字段的类型,注释.这些信息分散的存放在各个表中,给定一个hive中的表格名字,查询这个表中含有 ...

  9. hive内部表、外部表、分区

    hive内部表.外部表.分区 内部表(managed table) 默认创建的是内部表(managed table),存储位置在hive.metastore.warehouse.dir设置,默认位置是 ...

随机推荐

  1. 中国摄像头CMOS需求潜力旺盛

    中国摄像头CMOS需求潜力旺盛 CMOS是Complementary Metal Oxide Semiconductor(互补金属氧化物半导体)的缩写.它是指制造大规模集成电路芯片用的一种技术或用这种 ...

  2. MinkowskiEngine多GPU训练

    MinkowskiEngine多GPU训练 目前,MinkowskiEngine通过数据并行化支持Multi-GPU训练.在数据并行化中,有一组微型批处理,这些微型批处理将被送到到网络的一组副本中. ...

  3. 如何使用Nsight Compute?

    如何使用Nsight Compute? 下图command Line Argunments是指训练或测试命令,Linux下直接用测试或训练命令

  4. 使用Nginx配置服务静态文件(图片,文本,视频等)

    安装Nginx 安装Nginx较为简单,请参考下方链接或自行百度. 参考链接:https://blog.csdn.net/qq_26666947/article/details/112272058 以 ...

  5. [源码解析] 深度学习分布式训练框架 horovod (5) --- 融合框架

    [源码解析] 深度学习分布式训练框架 horovod (5) --- 融合框架 目录 [源码解析] 深度学习分布式训练框架 horovod (5) --- 融合框架 0x00 摘要 0x01 架构图 ...

  6. 再有人问你HashMap,把这篇文章甩给他

    搞定HashMap 作为一个Java从业者,面试的时候肯定会被问到过HashMap,因为对于HashMap来说,可以说是Java==集合中的精髓==了,如果你觉得自己对它掌握的还不够好,我想今天这篇文 ...

  7. jquery循环动画

      <!DOCTYPE html> <html> <head> <meta charset="utf-8"> <title&g ...

  8. 《机器学习Python实现_10_10_集成学习_xgboost_原理介绍及回归树的简单实现》

    一.简介 xgboost在集成学习中占有重要的一席之位,通常在各大竞赛中作为杀器使用,同时它在工业落地上也很方便,目前针对大数据领域也有各种分布式实现版本,比如xgboost4j-spark,xgbo ...

  9. 如何优雅地实现浏览器兼容与CSS规则回退

    读完了<Visual Studio Code权威指南>,前端方面书籍不能停,于是捡起「CSS一姐」 Lea Verou 的<CSS魔法>. 我们没法控制用户使用新版本还是老版本 ...

  10. Centos7.5使用SSH密钥登录

    12.1.查看操作系统版本 # cat /etc/redhat-release CentOS Linux release 7.5.1804 (Core) 12.2.在服务器端创建密钥 # ssh-ke ...