页面历史

关于数据抽取支持滚动备份一定数量的抽取表，详情请参考数据抽取备份随着市场竞争的日趋激烈，企业的决策更加强调及时性和准确性，越来越多的用户需要多维度、更加灵活的方式观察数据变化，以获得对数据更加深入的了解，从而更好的促进企业的发展。为了满足用户的需求，新版本产品新增数据模型，可实现将所有查询结果归集后，基于CUBE模型重新构建数据结构。CUBE模型主要以“维度”和“度量”进行构建，同时增加了“成员”和“命名集”的创建，实现了数据模型构建的灵活性及应用广泛性。

功能概述

新版本在 数据准备>数据集 中，新增“数据模型”类型。

Image Added

包含了以下功能：

私有查询

数据模型可实现将所有数据集作为私有查询结果归集。

支持数据来源有：数据源表、数据文件、SQL查询、即席查询、脚本查询、存储过程查询和ETL高级查询。

Image Added

重构数据结构

数据模型基于CUBE模型重新构建了数据结构，CUBE模型主要以“维度”和“度量”进行构建，支持使用MDX表达式创建计算度量、计算成员、命名集。

Image Added

参数及参数管理

数据模型支持设置每个私有查询的参数，可对整个数据集包含的参数进行管理。

Image Added

应用于报表

数据模型作为数据来源，可用于定制自助仪表盘和电子表格。

Image Added

参考文档

关于数据模型的功能，详情请参考数据模型。

锚
V10_数据准备_

数据准备2

自助ETL新增Python脚本节点
V10_

数据准备2

数据准备_自助ETL新增Python脚本节点

+【数据准备】自助ETL新增Python脚本节点

背景介绍

随着大数据时代的到来，Python已经在数据处理、数据可视化、机器学习等领域受到广泛应用。V10版本的ETL功能支持用户编写Python脚本，利用其丰富的科学计算扩展库，满足更多数据处理和分析场景，提高生产效率。

功能概述

Python脚本节点，支持用户编写Python代码，以便实现更自由、更高效的数据处理、数据分析操作，丰富了数据建模过程。

参考文档

关于Python脚本的功能，详情请参考 Python脚本。

锚
V10_数据准备_

数据准备5

新增作业流功能，实现多ETL实验之间执行依赖关系
V10_数据准备_

数据准备5

新增作业流功能，实现多ETL实验之间执行依赖关系

+

【数据挖掘】支持自动化生成自助ETL实验和物理表，提高操作效率

【数据准备】新增作业流功能，实现多ETL实验之间执行依赖关系

背景介绍以前的版本，用户在进行ETL处理之前要将数据从业务库迁移到数仓库，需要手动创建很多张表，重复操作且费时费力。新版本，产品新增ETL自动化功能，可根据用户提供的Excel文件，自动化生成自助ETL实验和物理表，减少重复操作，提高效率。

在数据准备中，从原始数据到最终展现数据需要经过多个ETL实验处理，这些ETL实验的执行调度存在着依赖关系，也就是多个ETL实验需要按照指定的顺序和条件调度执行。新版本，产品在自助ETL中新增作业流功能，是一个轻量级的调度功能，多个ETL实验可按照指定的顺序和条件调度执行，实现了多ETL之间执行依赖关系。

功能简介

新版本，产品新增ETL自动化工程功能，用户可通过上传Excel文件自动化生成自助ETL实验和物理表。

Image Removed

ETL自动化工程界面如图：

Image Removed

注意事项

ETL自动化工程目前只支持ClickHouse数据库。

参考文档

关于ETL自动化工程功能，详情请参考自助ETL-ETL自动化工程

新版本，产品在自助ETL中新增作业流功能，可将自助ETL、作业流实验当做作业执行。

Image Added

并支持设置分支条件，作业只有满足设置的条件才会继续执行。

Image Added

系统运维人员可通过作业流监控，对作业流的运行情况进行监控。

Image Added

参考文档

关于作业流的功能，详情请参考作业流。

锚
V10_数据准备_新增多表JOIN节点，支持同时接入多个数据源并设置表关系
V10_数据准备_新增多表JOIN节点，支持同时接入多个数据源并设置表关系

+【数据准备】新增多表JOIN节点，支持同时接入多个数据源并设置表关系

背景介绍

在实际应用中，有的用户业务复杂需要多张表的多个指标实现，使用节点数量较多，用户操作重复性高、灵活性较差。为了解决以上问题，新版本产品新增多表JOIN节点，支持同时接入多张数据源表并设置表关系，将多张表合并为一张表，减少产品与数据库的交互，提高产品性能。

功能简介

新版本，在数据模型、自助ETL、数据挖掘中，数据预处理下新增多表JOIN节点，支持同时接入多个数据集并设置表关系。

Image Added

参考文档

关于多表JOIN节点功能，详情请参考数据挖掘-多表JOIN 。

锚
V10_

数据准备6

数据准备_新增组合查询节点，支持去重、聚合、计新建算字段等高级功能
V10_

数据准备6^【数据准备】完善数据抽取日志

数据准备_新增组合查询节点，支持去重、聚合、计新建算字段等高级功能

+【数据准备】新增组合查询节点，支持去重、聚合、计新建算字段等高级功能

背景介绍随着数据的爆炸性增长，用户需要抽取的数据量越来越大，所消耗的时间也越多。为了能在数据抽取的过程中了解抽取的状态、获得更多的信息，便于系统运维，新版本对数据抽取的日志进行完善。

在实际场景中，有的用户业务复杂需要多张表的多个指标实现，且在数据处理时进行聚合、排序、条件筛选操作等，需要通过多个节点处理，操作既麻烦又复杂，也增加了实验运行的时间。为了解决以上问题，新版本产品新增组合查询节点，支持灵活选择查询的字段和去重、聚合、新建计算字段等高级功能，提升了数据处理效率与性能。

功能简介

1、打开 系统监控>日志 界面，增加了一些抽取过程中的日志信息，如获取总行数、总耗时、入库百分比等等。

Image Removed

2、在 抽取监控>抽取日志 的日志列表中不再仅限显示“抽取成功”、“抽取失败”，新版本可展示更多的抽取进展、错误信息。

Image Removed

参考文档

关于数据抽取日志，详情请参考抽取日志。

新版本在自助ETL、ETL高级查询、数据挖掘中，新增组合查询节点。

Image Added

支持灵活的选择字段和去重、条件筛选、聚合筛选、聚合、排序、修改别名、新建计算字段、批量选择列、取消选择列等高级功能。

Image Added

注意事项

组合查询节点只支持使用ClickHouse21及以上版本作为高速缓存库。

参考文档

关于组合查询节点，详情请参考数据挖掘-组合查询。

锚
V10_数据准备_新建或编辑计算度量、成员、命名集支持参数设置
V10_数据准备_新建或编辑计算度量、成员、命名集支持参数设置

^【数据准备】数据模型新建或编辑计算度量、成员、命名集支持参数设置

功能简介

为了满足用户更多需求，进一步扩大参数的应用范围，新版本支持用户在数据模型中新建或编辑度量、成员、命名集时设置参数，可实现动态获取结果。

Image Added

注意事项

由于清单表不支持度量，因此不支持新建命名集。

锚
V10_数据准备_取消支持Infobright作为高速缓存库
V10_数据准备_取消支持Infobright作为高速缓存库

<【数据准备】取消支持Infobright作为高速缓存库

功能简介

由于Infobright性能较差，不适合作为用户生产环境的缓存库，因此新版本产品取消支持Infobright作为高速缓存库。

页面树结构

版本比较

旧版本 24

新版本当前版本

标识

锚
V10_数据准备_

新增数据模型，将所有查询结果归集并基于CUBE重新构建数据结构
V10_

数据准备_新增数据模型，将所有查询结果归集并基于CUBE重新构建数据结构

+

【数据准备】新增数据模型，将所有查询结果归集并基于CUBE重新构建数据结构

锚
V10_数据准备_

自助ETL新增Python脚本节点
V10_

数据准备_自助ETL新增Python脚本节点

+【数据准备】自助ETL新增Python脚本节点

锚
V10_数据准备_

新增作业流功能，实现多ETL实验之间执行依赖关系
V10_数据准备_

新增作业流功能，实现多ETL实验之间执行依赖关系

+

【数据准备】新增作业流功能，实现多ETL实验之间执行依赖关系

锚
V10_数据准备_新增多表JOIN节点，支持同时接入多个数据源并设置表关系
V10_数据准备_新增多表JOIN节点，支持同时接入多个数据源并设置表关系

+【数据准备】新增多表JOIN节点，支持同时接入多个数据源并设置表关系

锚
V10_

数据准备_新增组合查询节点，支持去重、聚合、计新建算字段等高级功能
V10_

数据准备_新增组合查询节点，支持去重、聚合、计新建算字段等高级功能

+【数据准备】新增组合查询节点，支持去重、聚合、计新建算字段等高级功能

锚
V10_数据准备_新建或编辑计算度量、成员、命名集支持参数设置
V10_数据准备_新建或编辑计算度量、成员、命名集支持参数设置

^【数据准备】数据模型新建或编辑计算度量、成员、命名集支持参数设置

锚
V10_数据准备_取消支持Infobright作为高速缓存库
V10_数据准备_取消支持Infobright作为高速缓存库

<【数据准备】取消支持Infobright作为高速缓存库

页面树结构

页面历史

版本比较

旧版本 24

新版本 当前版本

标识

锚V10_数据准备_

新增数据模型，将所有查询结果归集并基于CUBE重新构建数据结构V10_

数据准备_新增数据模型，将所有查询结果归集并基于CUBE重新构建数据结构

+

【数据准备】新增数据模型，将所有查询结果归集并基于CUBE重新构建数据结构

锚V10_数据准备_

自助ETL新增Python脚本节点V10_

数据准备_自助ETL新增Python脚本节点

+【数据准备】自助ETL新增Python脚本节点

锚V10_数据准备_

新增作业流功能，实现多ETL实验之间执行依赖关系V10_数据准备_

新增作业流功能，实现多ETL实验之间执行依赖关系

+

【数据准备】新增作业流功能，实现多ETL实验之间执行依赖关系

锚V10_数据准备_新增多表JOIN节点，支持同时接入多个数据源并设置表关系V10_数据准备_新增多表JOIN节点，支持同时接入多个数据源并设置表关系

+【数据准备】新增多表JOIN节点，支持同时接入多个数据源并设置表关系

锚V10_

数据准备_新增组合查询节点，支持去重、聚合、计新建算字段等高级功能V10_

数据准备_新增组合查询节点，支持去重、聚合、计新建算字段等高级功能

+【数据准备】新增组合查询节点，支持去重、聚合、计新建算字段等高级功能

锚V10_数据准备_新建或编辑计算度量、成员、命名集支持参数设置V10_数据准备_新建或编辑计算度量、成员、命名集支持参数设置

^【数据准备】数据模型新建或编辑计算度量、成员、命名集支持参数设置

锚V10_数据准备_取消支持Infobright作为高速缓存库V10_数据准备_取消支持Infobright作为高速缓存库

<【数据准备】取消支持Infobright作为高速缓存库

新版本当前版本

锚
V10_数据准备_

新增数据模型，将所有查询结果归集并基于CUBE重新构建数据结构
V10_

锚
V10_数据准备_

自助ETL新增Python脚本节点
V10_

锚
V10_数据准备_

新增作业流功能，实现多ETL实验之间执行依赖关系
V10_数据准备_

锚
V10_数据准备_新增多表JOIN节点，支持同时接入多个数据源并设置表关系
V10_数据准备_新增多表JOIN节点，支持同时接入多个数据源并设置表关系

锚
V10_

数据准备_新增组合查询节点，支持去重、聚合、计新建算字段等高级功能
V10_

锚
V10_数据准备_新建或编辑计算度量、成员、命名集支持参数设置
V10_数据准备_新建或编辑计算度量、成员、命名集支持参数设置

锚
V10_数据准备_取消支持Infobright作为高速缓存库
V10_数据准备_取消支持Infobright作为高速缓存库