页面树结构

版本比较

标识

  • 该行被添加。
  • 该行被删除。
  • 格式已经改变。

1 概述

Smartbi 数据模型提供“直连”和“抽取”两种数据加载模式:

  • 直连:是指直接连接用户数据库进行数据的读取。
  • 抽取:则是将模型的数据抽取到SmartbiMPP数据库中提升查询效率,计算速度会更快,数据需要定期更新。


2 直连和抽取适用场景

2.2.1 什么样的用户适合适用直连模式

  • 实时性需求很高的用户用户进行业务分析实时性要求很高,直连引擎实时取数,最高实现毫秒级数据刷新。

  • 数据安全性要求很高的用户不希望将数据抽取到第三方软件,可使用新直连版本直连自己的数据库。

  • 拥有大数据平台的用户目前很多企业有较为专业的大数据平台,数据质量很高,通过直连引擎取数,可以在保障数据分析性能的同时避免数据资源冗余。

  • 数据量比较小,并觉得抽取要更新数据太过麻烦的用户直连性能要求较 抽取数据 要高一些,这部分用户数据量小所以使用直连不会有性能方面的担忧;使用直连可以不用更新数据,较为方便。


2.2.2 什么样的用户适合抽取模式

  • 联合查询当相关数据存储在不同数据库或文件内的多个表中时,可以使用数据模型的抽取做联合分析。
  • 非常适用于企业没有独立数仓或数仓负载过重的情况,用抽取模式可以提高性能。


3 直连介绍

注意

1、目前Smartbi JDBC for Excel、MongoDB、Tinysoft、Smartbi jdbc4Olap这个几个数据库 不支持直连,其他数据库均支持 直连

2、打开数据模型默认是直连模式,如果不手动切换或者不加入不支持直连的查询类型,将会一直保持直连模式。

3、直连 时查询计算依赖原始数据库或数仓,如果底层数据库或数仓的配置过低、性能不好等,可能会导致取数慢、查询奔溃等问题。

4、若在原始数据库对表结构进行更改(比如进行了列的增减),那么表结构的变化不会立即更新到在数据模型中;需要对模型中的表进行“同步”操作,“同步”之后才会把新字段添加进来,详情可查阅:设置及修改查

5、若 直连 的是数据仓库,而数据仓库又是通过ETL作业流 进行更新同步的,如果作业流没有执行,直连查询的还是原来的数据。

6、4、如果是数据模型是 直连模式,则可以根据切换参数值动态筛选;如果数据模型是 抽取 模式,则只能根据设置的默认值筛选,无法动态切换;详参:参数设置

...

2、直连模式是Smartbi引擎查询的默认模式,所有的查询会发送给底层数据库或数仓执行;目前数据模型中支持直连的查询有:数据源表即席查询SQL查询存储在指定数据库的日期表,详参:查询并准备数据


4 抽取介绍

注意
title前置条件

1、抽取是指抽取数据到高速缓存库,现在仅支持的高速缓存库类型有:SmartbiMpp、SmartbiMD、Presto+Hive、Vertica和星环。

2、抽取到SmartbiMPP即ClickHouse,由于ClickHouse对中文的列名支持是不太友好的,会出现莫名其妙的问题,所以字段尽量使用英文命名。

3、抽取到SmartbiMPP即ClickHouse,要求ClickHouse版本在22及以上,详参:安装包组件说明

4、如果是数据模型是 直连模式,则可以根据切换参数值动态筛选;如果数据模型是 抽取 模式,则只能根据设置的默认值筛选,无法动态切换;详参:参数设置

5、如果是抽取模式,并且缓存库是ClickHouse,关系设置条件不支持 等于、不等于、大于等于、小于、小于等于 条件详参设置查询关系

6、更新模型或重抽会自动清理缓存,详情可参考:缓存设置

...


4.1 数据抽取类型介绍

数据抽取支持 全量抽取按次抽取 

4.1.1 全量抽取

...