页面树结构
转至元数据结尾
转至元数据起始

正在查看旧版本。 查看 当前版本.

与当前比较 查看页面历史

« 前一个 版本 40 下一个 »

1 概述

Smartbi 数据模型引擎V2.0正式上线,它在稳定性、性能以及可扩展性上有全面革新,旨在为业务分析与决策支持提供更为强大、可靠的驱动力。

2 功能介绍

V2.0依然包含 SQL引擎和多维引擎:

  • SQL引擎:详情可查看SQL引擎介绍
  • 多维引擎:是基于V1.0重构而来的,V2.0比V1.0 更稳定、查数更快、扩展性更强。

注意:多维引擎V2.0跟1.0在实现上有部分差异,升级的用户主要重点关注。

2.1  如何开启引擎V2.0

  • 在系统运维/系统选/高级设置,设置:OLAP_QUERY_NEW_ENGINE_BUILD_MDX 如果为true代表开启,如为false代表关闭。
  • 2024年7月1号之后全新安装的版本,默认开启V2.0引擎。

2.2  数据模型引擎V2.0 比V1.0 增强了哪些功能

1、前提:业务库适配


2、数据模型抽取方面

选项V1.0V2.0 
抽取整体逻辑抽取成一个大宽表。

抽取成小宽表。

优势

1、抽取时,抽取大数据量的模型更不容易内存溢出,因为单个表数据量大大减少了。
2、查询时,根据查询的度量、维度更精准的命中某一部分小宽表,不用去查包含所有数据的大宽表,理论查询速度更快。

什么是小宽表? 以模型上所有单个表/查询为中心构建的宽表。构建宽表的逻辑,以基数进行判断:

  1. 如果该表与连接表的基数是“多对一”或“一对一”的一方,并且它是“多”的一方,构建宽表时会加上连接的表;如果该表是“一”的一方,那么构建宽表时不会加上连接的表。
  2. 如果该表与连接表的基数是“一对一”,该表是“一”的一方,连接的表也是“一”的一方,构建宽表时会加上连接的表。
按次抽取session级别的,不同用户抽取是不一样的,不同用户无法共享,而且session不过期是不会清理表。
  • 设定MPP表动态有效期:(默认30分钟会自动抽取,运维可配置,详情可查看:直连&抽取)
  • 报表刷新时,系统将自动触发重新抽取,数据获取更及时;

优势:

1、MPP表超过设置的抽取时间,自动清理旧表、减少资源消耗。

2、相同权限的用户间,抽取结果共享,减少重复抽取。

抽取行权限(

只最针对:数据模型中的数据源表做出的更改)

数据模型中添加的是“数据源表”,抽取时是引用计划任务设置的执行人在源表上设置的行权限。还需要再数据模型上重新设置好数据行权限,查询时才不会权限泄露。
  • 数据模型中添加的是“数据源表”,抽取时不引用计划任务设置的执行人的权限,行权限在查询时生效。

优势:

如果数据模型中添加都是数据源表:数据不容易泄露,查询时可直接以引用源表的行权限,无需再在数据模型上重新设置。

抽取计算字段时间层次、分组字段、计算列全部不抽取。
  • 时间层次、分组字段、计算列都抽取了小宽表中。
  • 不抽取的情况:
    • 计算列含有参数、用户属性。
    • 在报表层创建的计算列。

优势

1、计算字段抽取到MPP表中,查询SQL语句更简洁、查询速度更快。

计算度量
  • 不管是在数据模型中创建的计算度量还是在报表层创建的计算度量,如果计算度量错误时,查询数据时:没有勾选该计算度量,不会报错,只有勾选了该计算度量才会报错。
计算列
  • 抽取模式:不知道是哪个字段报错。
  • 抽取模式:计算列如果报错,在抽取模式下,抽取日志会显示对应的计算列名称以及表达式信息。

优势

1、日志更友好,问题定位更精准,并增强了易用性。

查询逻辑

SQL引擎、多维引擎走不同的逻辑。

  • SQL引擎:根据在报表层勾选字段判断命中几张表,如果是只勾选一张表的字段,即直接查询对应的表/查询;如果勾选了属于不同表/查询的字段,会时时判断,如果命中多个表,就查询大宽表。
  • 多维引擎:只会查大宽表。


如果在报表层勾选了属于不同小宽表的字段,需要时时判断字段属于哪几个小宽表,如果命中多个小宽表:

  • SQL引擎:小宽表之间是join关系;
  • 多维引擎:小宽表之间是union关系。

优势

查询时,根据查询的度量、维度更精准的命中某一部分小宽表,不用去查包含所有数据的大宽表,理论查询速度更快。


3、计算列支持更多函数

选项V1.0V2.0
产品封装的统一函数只有10几个函数。

计算列封装了45+函数,包含:日期函数、数值函数、字符串函数、逻辑函数,并且在持续完善。

详情可查看:计算列函数


4、报表层的增强

  • +新增功能,只在V2.0引擎上能使用:
    • 即席查询/透视分析筛选器条件自定义设置“且(AND)” 或者“或(OR)”关系,详情可查看:透视分析即席查询
    • 仪表盘支持单选/多选下拉树、单选/多选列表树(待上线)。
  • ^提升了交叉表某些场景下的查询性能:
    • 交叉表/透视分析:如果显示汇总小计、合计支持走SQL引擎,详情查看:SQL引擎介绍

2.3 数据模型引擎V2.0是基于V1.0重构而来的,但是也是有一些差异:

1、事实表与维表关联,事实表中只有部分维度数据,查询选择维表中的维度及事实表度量时,会查询出维表中的所有维度,事实表中没有的度量值补空。

新的变更调整更符合业务实际使用逻辑,如果想保持V1.0的效果,建议升级通过表格属性设置“压缩空行”

说明                                   V1.0            VS                V2.0
  • V1.0:默认不显示事实表中没有的维度成员。
  • V2.0:  默认显示维表中的所有维度成员,事实表中不存在的度量值补空。



原因:

V1.0 走的取数逻辑是星型模型:取维度成员从维表里面取,查出来行轴上的维度成员组合只有维表中存在的数据。
V2.0 取数逻辑:小宽表逻辑,压缩空行取维度成员是从小宽表里面取,查出来的维度成员组合包括事实表补空的数据。

2、事实表与维表关联,当事实表中存在维表中没有的维度成员,并且表关系未设置假设引用完整性,查询选择维表中的维度及事实表度量时,会出现空的维度。

新的变更调整更符合业务实际使用逻辑,如果想保持V1.0的效果,建议升级后设置“假设引用完整性”。

说明V1.0  VS  V2.0
  • V1.0,默认不显示维表中不存在的度量的值。
  • V2.0 ,默认会显示事实表中所有的度量值,匹配不到维表中的维度,则显示为空维度。



3、如果查询中未明确指定排序字段时,前端显示顺序可能不一致,建议升级后指定字段排序。

说明V1.0  VS  V2.0
  • V1.0与V2.0 查询都没有指定字段排序时,可能存在顺序不一致的情况。




2.4  V1.0 与V2.0 查询性能对比

说明:性能报告待上线。

  • 无标签