查看源

Smartbi的数据模型基于成熟的建模理论和方法，总体的而言主要体现在两方面：模型架构和模型表关系。

模型架构

数据模型是围绕事实表和维度表的关系而进行模型的构建：

事实表：是数据模型中的中央表，它包含联系事实与维度表的数字度量值和键。事实数据表包含描述业务（例如产品销售）内特定事件的数据。
维度表：是维度属性的集合，是分析问题的一个窗口，是人们观察数据的特定角度，是考虑问题时的一类属性，属性的集合构成一个维。

Smartbi支持星型模型和雪花模型：

星型模型：所有维表都直接连接到事实表上，整个视图就像星星一样。

Smartbi Insight V10帮助中心 > 数据模型-概述 > image2021-7-5_15-38-16.png

星型模型强调的是对维度进行预处理，将多个维度集合到一个事实表，形成一个宽表。

雪花模型：一个或多个维表没有直接连接到事实表上，而是通过其他维度表连接到事实表，视图就像多个雪花连接在一起。

Smartbi Insight V10帮助中心 > 数据模型-概述 > image2021-7-5_15-52-58.png

雪花模型是对星型模型的扩展，它对星型模型的维表进一步层次化，原有的各维表可能被扩展为小的事实表，形成一些局部的 "层次 " 区域，这些被分解的表都连接到主维度表而不是事实表。如将产品维表分解为产品类别维表。

模型表关系

模型设计过程中，模型表的关系也是很重要的一项内容。

关系的确立需要通过匹配键列中的数据（通常是两表中同名的列）。在大多数情况下，该关系会将一个表中的主键（它为每行提供了唯一标识）与另一个表的外部键中的某项相匹配。例如，通过创建 orderdetails表中的 orderid（主键）与orders 表中的 orderid 列（外部键）之间的关系，则销售量就与订单相关联了。

一对多（多对一）关系

一对多关系是最普通的一种关系。在这种关系中，A 表中的一行可以匹配 B 表中的多行，但是 B 表中的一行只能匹配 A 表中的一行。例如，publishers 和 titles 表之间具有一对多关系：每个出版社出版很多书，但是每本书名只能出自一个出版社。

只有当一个相关列是一个主键或具有唯一约束时，才能创建一对多关系。

一对一关系

在一对一关系中，A 表中的一行最多只能匹配于 B 表中的一行，反之亦然。如果相关列都是主键或都具有唯一约束，则可以创建一对一关系。

这种关系并不常见，因为一般来说，按照这种方式相关的信息都在一个表中。可以利用一对一关系来：

分割具有多列的表。
由于安全原因而隔离表的一部分。
保存临时的数据，并且可以毫不费力地通过删除该表而删除这些数据。
保存只适用于主表的子集的信息。

多对多关系

在多对多关系中，A 表中的一行可以匹配 B 表中的多行，反之亦然。要创建这种关系，需要定义第三个表，称为结合表，它的主键由 A 表和 B 表的外部键组成。例如，authors 和 titles 表具有多对多关系，这是由于这些表都与 titleauthors 表具有一对多关系。titleauthors 表的主键是 au_id 列（authors 表的主键）和 title_id 列（titles 表的主键）的组合。

目前Smarbi数据模型构建仅支持一对多（多对一）和一对一关系。

模型选型

星型模型和雪花模型在架构体系中各有优劣，其对比如下：

区别项	星型模型	雪花模型
维度表	一级维度表	多级维度表（子维度表）
存储空间	多	少
数据冗余度	大	小
表宽度	宽	窄
扩展性	差	好
Join复杂度	低	高
查询逻辑	简单	难
查询速度	快	慢
可读性	简单	难
OLAP建模工具优化度	低	高
数据总量	多	少
可读性	容易	差
表个数	少	多

在实际业务场景中，往往是两种模型的综合应用。

模型架构

相关概念

度量值

雪花维度

渐变维度

角色扮演维度

模型表关系

一对多（多对一）关系

一对一关系

多对多关系

模型选型