Hive——元数据表含义
Hive——元数据表含义
1、VERSION -- 查询版本信息
| Field | Type | Comment | |
|---|---|---|---|
| VER_ID | bigint(20) | ID主键 | |
| SCHEMA_VERSION | varchar(127) | Hive版本 | |
| VERSION_COMMENT | varchar(255) | 版本说明 |
2、DBS -- 存储Hive中所有数据库的基本信息
| Field | Type | Comment | |
|---|---|---|---|
| DB_ID | bigint(20) | 数据库ID | |
| DESC | varchar(4000) | 数据库描述 | |
| DB_LOCATION_URI | varchar(4000) | 数据库HDFS路径 | |
| NAME | varchar(128) | 数据库名 | |
| OWNER_NAME | varchar(128) | 数据库所有者用户名 | |
| OWNER_TYPE | varchar(10) | 所有者角色 |
3、DATABASE_PARAMS --该表存储数据库的相关参数,在CREATE DATABASE时候用
| Field | Type | Comment | |
|---|---|---|---|
| DB_ID | bigint(20) | 数据库ID | |
| PARAM_KEY | varchar(180) | 参数名 | |
| PARAM_VALUE | varchar(4000) | 参数值 |
4、TBLS --该表中存储Hive表、视图、索引表的基本信息
| Field | Type | Comment | |
|---|---|---|---|
| TBL_ID | bigint(20) | 表ID | |
| CREATE_TIME | int(11) | 创建时间 | |
| DB_ID | bigint(20) | 数据库ID | |
| LAST_ACCESS_TIME | int(11) | 上次访问时间 | |
| OWNER | varchar(767) | 所有者 | |
| RETENTION | int(11) | 保留字段 | |
| SD_ID | bigint(20) | 序列化配置信息 | |
| TBL_NAME | varchar(128) | 表名 | |
| TBL_TYPE | varchar(128) | 表类型 | |
| VIEW_EXPANDED_TEXT | mediumtext | 视图的详细HQL语句 | |
| VIEW_ORIGINAL_TEXT | mediumtext | 视图的原始HQL语句 |
5、TABLE_PARAMS --该表存储表/视图的属性信息。
| Field | Type | Comment | |
|---|---|---|---|
| TBL_ID | bigint(20) | 表ID | |
| PARAM_KEY | varchar(256) | 属性名 | |
| PARAM_VALUE | varchar(4000) | 属性值 |
6、SDS --该表保存文件存储的基本信息,如INPUT_FORMAT、OUTPUT_FORMAT、是否压缩等。
| Field | Type | Comment | |
|---|---|---|---|
| SD_ID | bigint(20) | 存储信息ID | |
| CD_ID | bigint(20) | 字段信息ID | |
| INPUT_FORMAT | varchar(4000) | 文件输入格式 | |
| IS_COMPRESSED | bit(1) | 是否压缩 | |
| IS_STOREDASSUBDIRECTORIES | bit(1) | 是否以子目录存储 | |
| LOCATION | varchar(4000) | HDFS路径 | |
| NUM_BUCKETS | int(11) | 分桶数量 | |
| OUTPUT_FORMAT | varchar(4000) | 文件输出格式 | |
| SERDE_ID | bigint(20) | 序列化类ID |
7、SERDS --该表存储序列化使用的类信息
| Field | Type | Comment | |
|---|---|---|---|
| SERDE_ID | bigint(20) | 序列化类配置ID | |
| NAME | varchar(128) | 序列化类别名 | |
| SLIB | varchar(4000) | 序列化类 |
8、SERDE_PARAMS --该表存储序列化的一些属性、格式信息,比如:行、列分隔符
| Field | Type | Comment | |
|---|---|---|---|
| SERDE_ID | bigint(20) | 序列化类配置ID | |
| PARAM_KEY | varchar(256) | 属性名 | |
| PARAM_VALUE | varchar(4000) | 属性值 |
9、COLUMNS_V2 --该表存储表对应的字段信息。
| Field | Type | Comment | |
|---|---|---|---|
| CD_ID | bigint(20) | 字段信息ID | |
| COMMENT | varchar(256) | 字段注释 | |
| COLUMN_NAME | varchar(128) | 字段名 | |
| TYPE_NAME | varchar(4000) | 字段类型 | |
| INTEGER_IDX | int(11) | 字段顺序 |
10、PARTITIONS --该表存储表分区的基本信息。
| Field | Type | Comment | |
|---|---|---|---|
| PART_ID | bigint(20) | 分区ID | |
| CREATE_TIME | int(11) | 分区创建时间 | |
| LAST_ACCESS_TIME | int(11) | 最后一次访问时间 | |
| PART_NAME | varchar(767) | 分区名 | |
| SD_ID | bigint(20) | 分区存储ID | |
| TBL_ID | bigint(20) | 表ID |
11、PARTITION_KEYS --该表存储分区的字段信息。
| Field | Type | Comment | |
|---|---|---|---|
| TBL_ID | bigint(20) | 表ID | |
| PKEY_COMMENT | varchar(4000) | 分区字段说明 | |
| PKEY_NAME | varchar(128) | 分区字段名 | |
| PKEY_TYPE | varchar(767) | 分区字段类型 | |
| INTEGER_IDX | int(11) | 分区字段顺序 |
12、PARTITION_KEY_VALS --该表存储分区字段值。
| Field | Type | Comment | |
|---|---|---|---|
| PART_ID | bigint(20) | 分区ID | |
| PART_KEY_VAL | varchar(255) | 分区字段值 | |
| INTEGER_IDX | int(11) | 分区字段值顺序 |
13、PARTITION_PARAMS --该表存储分区的属性信息。
| Field | Type | Comment | |
|---|---|---|---|
| PART_ID | bigint(20) | 分区ID | |
| PARAM_KEY | varchar(256) | 分区属性名 | |
| PARAM_VALUE | varchar(4000) | 分区属性值 |
其他不常用的元数据表:
DB_PRIVS:数据库权限信息表。通过GRANT语句对数据库授权后,将会在这里存储。
IDXS:索引表,存储Hive索引相关的元数据
INDEX_PARAMS:索引相关的属性信息。
TAB_COL_STATS:表字段的统计信息。使用ANALYZE语句对表字段分析后记录在这里。
TBL_COL_PRIVS:表字段的授权信息
PART_PRIVS:分区的授权信息
PART_COL_STATS:分区字段的统计信息。
PART_COL_PRIVS:分区字段的权限信息。
FUNCS:用户注册的函数信息
FUNC_RU:用户注册函数的资源信息
Hive——元数据表含义的更多相关文章
- Hive学习之路 (三)Hive元数据信息对应MySQL数据库表
概述 Hive 的元数据信息通常存储在关系型数据库中,常用MySQL数据库作为元数据库管理.上一篇hive的安装也是将元数据信息存放在MySQL数据库中. Hive的元数据信息在MySQL数据中有57 ...
- Hive(三)Hive元数据信息对应MySQL数据库表
概述 Hive 的元数据信息通常存储在关系型数据库中,常用MySQL数据库作为元数据库管理.上一篇hive的安装也是将元数据信息存放在MySQL数据库中. Hive的元数据信息在MySQL数据中有57 ...
- Apache Hive (三)Hive元数据信息对应MySQL数据库表
转自:https://www.cnblogs.com/qingyunzong/p/8710356.html 概述 Hive 的元数据信息通常存储在关系型数据库中,常用MySQL数据库作为元数据库管理. ...
- 【转】Hive内部表、外部表
hive内部表.外部表区别自不用说,可实际用的时候还是要小心. 1. 内部表: create table tt (name string , age string) location '/input/ ...
- hive内部表、外部表
hive内部表.外部表区别自不用说,可实际用的时候还是要小心. Hive的数据分为表数据和元数据,表数据是Hive中表格(table)具有的数据:而元数据是用来存储表的名字,表的列和分区及其属性,表的 ...
- hive内部表与外部表区别
1.在Hive里面创建一个表: hive> create table wyp(id int, > name string, > age int, > tele ...
- 如何监听对 HIVE 元数据的操作
目录 简介 HIVE 基本操作 获取 HIVE 源码 编译 HIVE 源码 启动 HIVE 停止 HIVE 监听对 HIVE 元数据的操作 参考文档 简介 公司有个元数据管理平台,会定期同步 HIVE ...
- hive元数据研究
hive的元数据存放在关系型数据库中,元数据中存储了hive中所有表格的信息,包括表格的名字,表格的字段,字段的类型,注释.这些信息分散的存放在各个表中,给定一个hive中的表格名字,查询这个表中含有 ...
- hive内部表、外部表、分区
hive内部表.外部表.分区 内部表(managed table) 默认创建的是内部表(managed table),存储位置在hive.metastore.warehouse.dir设置,默认位置是 ...
随机推荐
- 中国摄像头CMOS需求潜力旺盛
中国摄像头CMOS需求潜力旺盛 CMOS是Complementary Metal Oxide Semiconductor(互补金属氧化物半导体)的缩写.它是指制造大规模集成电路芯片用的一种技术或用这种 ...
- MinkowskiEngine多GPU训练
MinkowskiEngine多GPU训练 目前,MinkowskiEngine通过数据并行化支持Multi-GPU训练.在数据并行化中,有一组微型批处理,这些微型批处理将被送到到网络的一组副本中. ...
- 如何使用Nsight Compute?
如何使用Nsight Compute? 下图command Line Argunments是指训练或测试命令,Linux下直接用测试或训练命令
- 使用Nginx配置服务静态文件(图片,文本,视频等)
安装Nginx 安装Nginx较为简单,请参考下方链接或自行百度. 参考链接:https://blog.csdn.net/qq_26666947/article/details/112272058 以 ...
- [源码解析] 深度学习分布式训练框架 horovod (5) --- 融合框架
[源码解析] 深度学习分布式训练框架 horovod (5) --- 融合框架 目录 [源码解析] 深度学习分布式训练框架 horovod (5) --- 融合框架 0x00 摘要 0x01 架构图 ...
- 再有人问你HashMap,把这篇文章甩给他
搞定HashMap 作为一个Java从业者,面试的时候肯定会被问到过HashMap,因为对于HashMap来说,可以说是Java==集合中的精髓==了,如果你觉得自己对它掌握的还不够好,我想今天这篇文 ...
- jquery循环动画
<!DOCTYPE html> <html> <head> <meta charset="utf-8"> <title&g ...
- 《机器学习Python实现_10_10_集成学习_xgboost_原理介绍及回归树的简单实现》
一.简介 xgboost在集成学习中占有重要的一席之位,通常在各大竞赛中作为杀器使用,同时它在工业落地上也很方便,目前针对大数据领域也有各种分布式实现版本,比如xgboost4j-spark,xgbo ...
- 如何优雅地实现浏览器兼容与CSS规则回退
读完了<Visual Studio Code权威指南>,前端方面书籍不能停,于是捡起「CSS一姐」 Lea Verou 的<CSS魔法>. 我们没法控制用户使用新版本还是老版本 ...
- Centos7.5使用SSH密钥登录
12.1.查看操作系统版本 # cat /etc/redhat-release CentOS Linux release 7.5.1804 (Core) 12.2.在服务器端创建密钥 # ssh-ke ...