Bootstrap

hive元数据信息管理总结

hive元数据表 关系总览

在这里插入图片描述

关键表总览

在这里插入图片描述

表名称及其业务

BUCKETING_COLS 存储bucket字段信息,通过SD_ID与其他表关联
CDS 表示该分区、表存储的字段信息。一个字段CD_ID,与SDS表关联
COLUMNS_V2 表示该分区、表存储的字段信息。存储字段信息,通过CD_ID与其他表关联
DATABASE_PARAMS 描述数据库的属性信息
DBS 存储hive的database信息
DB_PRIVS 描述数据库的权限信息
FUNCS 记录用户子集编写的函数信息,包括函数名、对应类名、创建者信息等
FUNC_RU 记录自定义函数所在文件的路径
GLOBAL_PRIVS 全局变量,与表无关
IDXS Hive中索引的信息
INDEX_PARAMS
PARTITIONS 分区信息,SD_ID, TBL_ID关联
PARTITION_KEYS 存储分区字段列,TBL_ID关联
PARTITION_KEY_VALS 分区的值,通过PART_ID关联。与PARTITION_KEYS共用同一个字段INTEGER_IDX来标示不同的分区字段。
PARTITION_PARAMS 存储某分区相关信息,包括文件数,文件大小,记录条数等。通过PART_ID关联
PART_COL_PRIVS 分区列的授权信息
PART_COL_STATS 分区中列的统计信息
PART_PRIVS
ROLES 角色表,和GLOBAL_PRIVS配合,与表无关
SDS 存储输入输出format等信息,包括表的format和分区的format。关联字段CD_ID,SERDE_ID
SD_PARAMS 空
SEQUENCE_TABLE 存储sqeuence相关信息,与表无关
SERDES 存储序列化反序列化使用的类
SERDE_PARAMS 序列化反序列化相关配置信息,通过SERDE_ID关联
SKEWED_COL_NAMES 保存表、分区由数据倾斜的列信息,包括列名
SKEWED_COL_VALUE_LOC_MAP
SKEWED_STRING_LIST 保存表,分区有数据倾斜的字符串列表和值的信息
SKEWED_STRING_LIST_VALUES 保存表,分区有数据倾斜的字符串列表和值的信息
SKEWED_VALUES 保存表、分区倾斜列对应的本地文件路径
SORT_COLS 排序字段,包括列名和排序方式。通过SD_ID关联
TABLE_PARAMS 表相关信息,是否外部表,通过TBL_ID关联
TAB_COL_STATS 表中列的统计信息,包括数值类型的最大和最小值
TBLS 存储表信息,关联字段DB_ID,SD_ID,
TBL_COL_PRIVS 表或视图中列的授权信息,包括授权用户、被授权用户和授权的权限等
TBL_PRIVS 表赋权限相关信息,通过TBL_ID关联
VERSION 版本
VERSION_copy 版本,通过VER_ID关联

表字段信息

DBS

DB_ID 数据库ID 2
DESC 数据库描述 测试库
DB_LOCATION_URI 数据库HDFS路径 hdfs://namenode/user/hive/warehouse/lxw1234.db
NAME 数据库名 lxw1234
OWNER_NAME 数据库所有者用户名 lxw1234
OWNER_TYPE 所有者角色 USER

DATABASE_PARAMS

该表存储数据库的相关参数,在CREATE DATABASE时候用

Hive表和视图相关的元数据表

TBLS、TABLE_PARAMS、TBL_PRIVS,这三张表通过TBL_ID关联。

Hive文件存储信息相关的元数据表

SDS、SD_PARAMS、SERDES、SERDE_PARAMS

Hive表字段相关的元数据表

COLUMNS_V2

Hive表分区相关的元数据表

主要涉及PARTITIONS、PARTITION_KEYS、PARTITION_KEY_VALS、PARTITION_PARAMS

;