Bootstrap

大厂数据仓库数仓建模面试题及参考答案

目录

什么是数据仓库,和数据库有什么区别?

数据仓库的基本原理是什么?

数据仓库架构是怎样的?

数据仓库分层(层级划分),每层做什么?分层的好处是什么?数据分层是根据什么?数仓分层的原则与思路是什么?

数仓建模常用模型有哪些?区别、优缺点是什么?星型模型和雪花模型的区别?应用场景?优劣对比如何?

数仓建模有哪些方式?数仓建模的流程是什么?

维度建模的步骤有哪些,如何确定这些维度?维度建模和范式建模区别是什么?

维度表和事实表的区别是什么?什么是 ER 模型?

OLAP、OLTP 如何解释(区别)?三范式是什么,请举例说明。

维度设计过程和事实设计过程是怎样的?

维度设计中有整合和拆分,有哪些方法,并详细说明

事实表设计分几种,每一种都是如何在业务中使用

单事务事实表、多事务事实表区别与作用是什么

请解释一致性维度、一致性事实、总线矩阵的概念

从 ODS 层到 DW 层的 ETL,做了哪些工作

数据仓库的数据质量是怎么保证的,有哪些方法?怎么衡量数仓的数据质量,有哪些指标?

增量表、全量表和拉链表分别是什么?

数据仓库存储的基本要点(存储格式和压缩格式)是什么?

数据仓库为什么要分层,数仓分层的架构是怎样的?

数据仓库设计中的要点和难点分别是什么?

是否了解维度建模?请简述维度建模的基本概念。维度建模主要解决什么问题?

数仓分主题预计算的好处和坏处是什么?

指标维度矩阵了解吗?

你觉得怎样判断一个数据明细模型是否算做一个好的数据明细模型?

数仓指标同名不同义的解决方法?


什么是数据仓库,和数据库有什么区别?

数据仓库是一个面向主题的、集成的、相对稳定的、反映历史变化的数据集合,用于支持管理决策。它主要是为企业提供数据分析和决策支持,将不同来源的数据进行整合、清洗、转换,以统一的格式存储,方便进行复杂的查询和分析。

数据库则是按照数据结构来组织、存储和管理数据的仓库,主要用于事务处理,比如企业的业务系统,如订单系统、库存系统等,负责数据的实时读写操作,保证数据的一致性和完整性。

两者的区别体现在多个方面。在应用

;