Hive——元数据表含义

1、VERSION   -- 查询版本信息

  Field Type Comment
  VER_ID bigint(20) ID主键
  SCHEMA_VERSION varchar(127) Hive版本
  VERSION_COMMENT varchar(255) 版本说明

2、DBS     -- 存储Hive中所有数据库的基本信息

  Field Type Comment
  DB_ID bigint(20) 数据库ID
  DESC varchar(4000) 数据库描述
  DB_LOCATION_URI varchar(4000) 数据库HDFS路径
  NAME varchar(128) 数据库名
  OWNER_NAME varchar(128) 数据库所有者用户名
  OWNER_TYPE varchar(10) 所有者角色

3、DATABASE_PARAMS  --该表存储数据库的相关参数,在CREATE DATABASE时候用

  Field Type Comment
  DB_ID bigint(20) 数据库ID
  PARAM_KEY varchar(180) 参数名
  PARAM_VALUE varchar(4000) 参数值

4、TBLS  --该表中存储Hive表、视图、索引表的基本信息

  Field Type Comment
  TBL_ID bigint(20) 表ID
  CREATE_TIME int(11) 创建时间
  DB_ID bigint(20) 数据库ID
  LAST_ACCESS_TIME int(11) 上次访问时间
  OWNER varchar(767) 所有者
  RETENTION int(11) 保留字段
  SD_ID bigint(20) 序列化配置信息
  TBL_NAME varchar(128) 表名
  TBL_TYPE varchar(128) 表类型
  VIEW_EXPANDED_TEXT mediumtext 视图的详细HQL语句
  VIEW_ORIGINAL_TEXT mediumtext 视图的原始HQL语句

5、TABLE_PARAMS  --该表存储表/视图的属性信息。

  Field Type Comment
  TBL_ID bigint(20) 表ID
  PARAM_KEY varchar(256) 属性名
  PARAM_VALUE varchar(4000) 属性值

6、SDS  --该表保存文件存储的基本信息,如INPUT_FORMAT、OUTPUT_FORMAT、是否压缩等。

  Field Type Comment
  SD_ID bigint(20) 存储信息ID
  CD_ID bigint(20) 字段信息ID
  INPUT_FORMAT varchar(4000) 文件输入格式
  IS_COMPRESSED bit(1) 是否压缩
  IS_STOREDASSUBDIRECTORIES bit(1) 是否以子目录存储
  LOCATION varchar(4000) HDFS路径
  NUM_BUCKETS int(11) 分桶数量
  OUTPUT_FORMAT varchar(4000) 文件输出格式
  SERDE_ID bigint(20) 序列化类ID

7、SERDS      --该表存储序列化使用的类信息

  Field Type Comment
  SERDE_ID bigint(20) 序列化类配置ID
  NAME varchar(128) 序列化类别名
  SLIB varchar(4000) 序列化类

8、SERDE_PARAMS      --该表存储序列化的一些属性、格式信息,比如:行、列分隔符

  Field Type Comment
  SERDE_ID bigint(20) 序列化类配置ID
  PARAM_KEY varchar(256) 属性名
  PARAM_VALUE varchar(4000) 属性值

9、COLUMNS_V2      --该表存储表对应的字段信息。

  Field Type Comment
  CD_ID bigint(20) 字段信息ID
  COMMENT varchar(256) 字段注释
  COLUMN_NAME varchar(128) 字段名
  TYPE_NAME varchar(4000) 字段类型
  INTEGER_IDX int(11) 字段顺序

10、PARTITIONS      --该表存储表分区的基本信息。

  Field Type Comment
  PART_ID bigint(20) 分区ID
  CREATE_TIME int(11) 分区创建时间
  LAST_ACCESS_TIME int(11) 最后一次访问时间
  PART_NAME varchar(767) 分区名
  SD_ID bigint(20) 分区存储ID
  TBL_ID bigint(20) 表ID

11、PARTITION_KEYS      --该表存储分区的字段信息。

  Field Type Comment
  TBL_ID bigint(20) 表ID
  PKEY_COMMENT varchar(4000) 分区字段说明
  PKEY_NAME varchar(128) 分区字段名
  PKEY_TYPE varchar(767) 分区字段类型
  INTEGER_IDX int(11) 分区字段顺序

12、PARTITION_KEY_VALS      --该表存储分区字段值。

  Field Type Comment
  PART_ID bigint(20) 分区ID
  PART_KEY_VAL varchar(255) 分区字段值
  INTEGER_IDX int(11) 分区字段值顺序

13、PARTITION_PARAMS      --该表存储分区的属性信息。

  Field Type Comment
  PART_ID bigint(20) 分区ID
  PARAM_KEY varchar(256) 分区属性名
  PARAM_VALUE varchar(4000) 分区属性值

其他不常用的元数据表:

DB_PRIVS:数据库权限信息表。通过GRANT语句对数据库授权后,将会在这里存储。

IDXS:索引表,存储Hive索引相关的元数据

INDEX_PARAMS:索引相关的属性信息。

TAB_COL_STATS:表字段的统计信息。使用ANALYZE语句对表字段分析后记录在这里。

TBL_COL_PRIVS:表字段的授权信息

PART_PRIVS:分区的授权信息

PART_COL_STATS:分区字段的统计信息。

PART_COL_PRIVS:分区字段的权限信息。

FUNCS:用户注册的函数信息

FUNC_RU:用户注册函数的资源信息

Hive——元数据表含义的更多相关文章

  1. Hive学习之路 (三)Hive元数据信息对应MySQL数据库表

    概述 Hive 的元数据信息通常存储在关系型数据库中,常用MySQL数据库作为元数据库管理.上一篇hive的安装也是将元数据信息存放在MySQL数据库中. Hive的元数据信息在MySQL数据中有57 ...

  2. Hive(三)Hive元数据信息对应MySQL数据库表

    概述 Hive 的元数据信息通常存储在关系型数据库中,常用MySQL数据库作为元数据库管理.上一篇hive的安装也是将元数据信息存放在MySQL数据库中. Hive的元数据信息在MySQL数据中有57 ...

  3. Apache Hive (三)Hive元数据信息对应MySQL数据库表

    转自:https://www.cnblogs.com/qingyunzong/p/8710356.html 概述 Hive 的元数据信息通常存储在关系型数据库中,常用MySQL数据库作为元数据库管理. ...

  4. 【转】Hive内部表、外部表

    hive内部表.外部表区别自不用说,可实际用的时候还是要小心. 1. 内部表: create table tt (name string , age string) location '/input/ ...

  5. hive内部表、外部表

    hive内部表.外部表区别自不用说,可实际用的时候还是要小心. Hive的数据分为表数据和元数据,表数据是Hive中表格(table)具有的数据:而元数据是用来存储表的名字,表的列和分区及其属性,表的 ...

  6. hive内部表与外部表区别

    1.在Hive里面创建一个表: hive> create table wyp(id int,    > name string,    > age int,    > tele ...

  7. 如何监听对 HIVE 元数据的操作

    目录 简介 HIVE 基本操作 获取 HIVE 源码 编译 HIVE 源码 启动 HIVE 停止 HIVE 监听对 HIVE 元数据的操作 参考文档 简介 公司有个元数据管理平台,会定期同步 HIVE ...

  8. hive元数据研究

    hive的元数据存放在关系型数据库中,元数据中存储了hive中所有表格的信息,包括表格的名字,表格的字段,字段的类型,注释.这些信息分散的存放在各个表中,给定一个hive中的表格名字,查询这个表中含有 ...

  9. hive内部表、外部表、分区

    hive内部表.外部表.分区 内部表(managed table) 默认创建的是内部表(managed table),存储位置在hive.metastore.warehouse.dir设置,默认位置是 ...

随机推荐

  1. list 分批导入db, 每1000条数据一批 , 从字符串中获取数字,小数, 版本号比较

    //这个有个弊端: 分组后分批导入, 是阻塞的,我没有导入完成,别人就不能导入, 这里可以优化成异步,线程池 public static void main(String[] args) { Rand ...

  2. 面试一次问一次,HashMap是该拿下了(一)

    文章目录 前言 一.HashMap类图 二.源码剖析 1. HashMap(jdk1.7版本) - 此篇详解 2. HashMap(jdk1.8版本) 3. ConcurrentHashMap ~~ ...

  3. 最短路径问题,BFS,408方向,思路与实现分析

    最短路径问题,BFS,408方向,思路与实现分析 继上回挖下的坑,不知道大家有没有认真看最小生成树呢?很简单,这回也讲讲正常难度的,看不懂就来这里看看,讲的很好~~ 最短路径问题 说起这个问题,先说个 ...

  4. 【Java编程实战】Metasploit_Java后门运行原理分析以及实现源码级免杀与JRE精简化

    QQ:3496925334 文章作者:MG1937 CNBLOG博客ID:ALDYS4 未经许可,禁止转载 某日午睡,迷迷糊糊梦到Metasploit里有个Java平台的远控载荷,梦醒后,打开虚拟机, ...

  5. 【HTML】同页面锚点跳转

    跳转: <a href="#maodian001">去吧!</a> 锚点: <a id="maodian001"></ ...

  6. anaconda安装VSCODE后,python报错

    重新用anaconda时遇到了一点问题. 测试anaconda捆绑安装的VSCODE时写了一行print(1),然后报错. 后来发现用anaconda下载vscdoe时并不会给python一个路径,这 ...

  7. 关于MySQL索引面试题的六连炮!招架的住吗?

    1.面试真题 MySQ索引的原理和数据结构能介绍一下吗? b+树和b-树有什么区别? MySQL聚簇索引和非聚簇索引的区别是什么? 他们分别是如何存储的? 使用MySQL索引都有哪些原则? MySQL ...

  8. 「10.12」木板(数学)·打扫卫生(神仙DP)

    A. 木板 一个很简单的数学题,简单推一下就好,路丽姐姐教你学数学. 将式子化出我们发现只需求出$i\times i/n$的个数 那么我们将$n$质因数分解,可知因子个数 为了整除$n$,令$i==\ ...

  9. MySQL 到 ES 数据实时同步技术架构

    MySQL 到 ES 数据实时同步技术架构 我们已经讨论了数据去规范化的几种实现方式.MySQL 到 ES 数据同步本质上是数据去规范化多种实现方式中的一种,即通过"数据迁移同步" ...

  10. js笔记22

    1.在拖拽元素的时候,如果元素的内部加了文字或者图片,拖拽效果会失灵? 浏览器会给文字和图片一个默认行为,当文字和图片被选中的时候,会有一个拖拽的效果,即使我们没有人为给他添加.所以当我们点击这个元素 ...