目前数据模型含有导入文件、JAVA查询、脚本查询、ETL高级查询、存储过程查询、生成日期表这些查询时,必须使用 抽取 模式
1 概述
Smartbi 数据模型提供“直连”和“抽取”两种数据加载模式:
...
4.1.3 查询动态抽取(原:按次抽取)
警告 | ||
---|---|---|
| ||
查询动态抽取 查询动态抽取(原:按次抽取原:按次抽取),在V11 数据模型引擎V2.0上优化了抽取逻辑,主要优化了:
|
...
- 如果是第一次切换的参数值,会从底层数据库取数,会触发抽取;如果后面再切换回原来的参数值,不会重新取数,而是取缓存的数据。
- 如果有新的数据进来,可以退出账号重新登录再查看或者清空缓存。
4.1.4 分区设置
信息 |
---|
1、抽取的分区设置目前支持的MPP库:只有SmartbiMpp产品默认使用高速缓存库CH、StarRocks。
2、分区设置仅支持抽取模式,支持的范围:全量抽取、增量抽取、查询动态抽取。 |
下面以示例说明分区设置的操作以及查看是否命中了分区。
以产品内置的northwind数据库里面的【orders】、【orderdetails】为示例构建数据模型
1、把【orders】、【orderdetails】加载到数据模型中,并创建数据模型
2、保存好模型,设置模型为 抽取 模式,并设置【orders】为全量抽取,设置分区设置:
选项 | ||||
---|---|---|---|---|
分区设置 | 选择日期或日期时间类型的字段作为分区依据时,系统会自动将数据分配到相应的分区表中。这样做不仅有助于更快的抽取数据,还能显著提升查询效率,特别是在进行大规模数据分析时。 温馨提示: 请选择一个在记录创建后几乎不发生变化的字段作为分区字段,例如记录的创建时间。 避免使用那些在数据生命周期内可能会更新的字段(如最后修改时间),因为这会导致分区数据重复或不准确。 | |||
分区字段 | 目前只支持日期、日期时间字段,每次只能选择一个字段。 | |||
分区格式 | 选项:年、年季、年月、年月日。暂不支持年周,原因:starRocks不支持年周、年季,而clickhouse支持年周的话 会与年季有冲突,所以没有支持
|
3、设置好分区之后对模型进行抽取,点击【立即抽取】,再去“系统监控/SQL/MDX监控”查看到抽取到MPP表的表名,如下图:
4、使用数据库工具连接MPP库,使用下面的语句查看是否命中分区?
如果查询有对应的数据,则分区成功。
代码块 |
---|
SELECT
partition,
name,
active
FROM system.parts
where table like '%o_662e015ae0aced9a870441ef1f3a2990_0_2%' |
4.1.5 抽取设置介绍
信息 | ||
---|---|---|
| ||
抽取的整体逻辑简单介绍:
|
...
选项 | |
---|---|
抽取并建宽表 | 适用于手动抽取的任意场景,比如模型的某个字段数据类型改了,别名改了,关系修改了,增加了某个字段等等,点击“抽取并建宽表”都会把整个模型的查询全部重抽并重新生成大宽表。 |
单个查询的抽取 |
|
更新宽表 | 如果模型里面的所有查询都没有任何调整,只是基数更改了,那么可以直接用更新宽表的方式减少抽取时间。 |
抽取参数值 |
锚 | ||||
---|---|---|---|---|
|
...
6 抽取计划
信息 |
---|
1、只要是抽取的模型,第一次保存之后都会自动生成计划任务,默认是停止状态。 2、在数据模型上点击”抽取并建宽表“不走抽取计划进行抽取。 |
...
2、设置好查询的抽取方式以及抽取参数值,如果想定时更新模型的数据,那么可以使用计划任务进行抽取, 详参:计划任务。
4.1.
...
7 抽取日志
用户查看抽取日志:
- 可以更好的判断模型是否已经抽取成功。
- 如果模型抽取失败可以在抽取日志中查看抽取失败的原因。
...