页面树结构

版本比较

标识

  • 该行被添加。
  • 该行被删除。
  • 格式已经改变。


目录

ETL高级查询工作流

ETL高级查询工作流必须以数据源为起点,以输出到MPP为终点:从数据源中抽取需要进行处理的数据,通过拖拽内置的预处理方法,之后再将处理过的数据存储到目标源中。

定义ETL高级查询

新建ETL高级查询

数据基础

数据源中“产品销售表”的数据预览如下:

操作步骤

1、在系统主界面的快捷菜单中,选择 数据准备 > 数据模型 。

2、进入“新建数据模型”界面,点击底部 + ,添加“ETL高级查询” 。

进入“新建ETL高级查询”设计界面。

数据源

1、将关系数据源节点拖入画布区,在节点配置区设置关系数据源的参数。

2、在工具栏中点击 执行 按钮 ,运行关系数据源节点。

数据预处理

1、将空值处理节点拖入画布区,连接两个节点,设置空值处理节点的参数。

2、在选择列界面中,添加“销售额”字段到已选字段,点击 确定 按钮后运行节点。

3、将派生列节点拖入画布区,连接两个节点。在节点配置区选择 派生列配置 按钮。

4、在选择列界面中,将对应函数和字段分别拖入添加/编辑表达式区,点击 确定 按钮,添加一条“收入规模取整”的派生列,点击 增加 按钮后运行节点。

目标源

1、连接派生列节点和输出到MPP节点,并运行节点。

2、点击底部 展开 按钮,在列筛选下拉框中选择“收入规模”、“收入规模取整”字段,查看数据预处理的结果,如图:

去除了销售额为空的数据,并对销售额字段取整。

3、新建高级ETL查询完成,点击 保存 按钮保存查询后,点击 回到数据集 按钮,返回新建数据模型主界面。

设置维度

1、在右侧维度区“销售额取整”字段上点击 标记为度量 按钮,将销售额字段标记为度量。

Image RemovedImage Added

2、在区域字段上右键“更多”中,选择“在报表中隐藏”来隐藏字段。

3、按照刚才的方法设置其他字段的度量、在报表中隐藏如图:

Image RemovedImage Added

4、设置完成后,保存数据集,新建数据模型完成。

下面可对产品销售情况进行数据分析,详情请参考 分析展现 。

其他私有查询转换为ETL高级查询

注意

ETL高级查询不能转换为ETL高级查询,其他私有查询可以转换为ETL高级查询。

新建其他私有查询

私有查询以“即席查询”为例,演示如何转换为ETL高级查询。

1、在系统主界面的快捷菜单中,选择 数据准备 > 数据模型 。

2、进入“新建数据模型”界面,点击底部 + ,添加“即席查询” 。

3、进入新建即席查询界面,定制即席查询如下:

定制即席查询,详情请参考 即席查询 。

4、新建即席查询完成,点击 保存 按钮保存查询后,点击 回到数据集 按钮,返回新建数据模型主界面。

转化为ETL高级查询

1、在新建的即席查询上右键或更多中,选择“转换为ETL高级查询”。

Image RemovedImage Added

进入“ETL高级查询”设计界面。

2、数据源为刚才新建的即席查询,删除节点之间的连线,可以点击 编辑数据查询 按钮,编辑即席查询的数据,完成后在工具栏中点击 运行 按钮。

编辑数据查询界面如下:

数据预处理

1、将过滤节点拖入画布区,连接两个节点,点击 过滤器 按钮,设置过滤节点的参数。

设置的过滤器界面如下:

目标源

1、连接过滤节点和输出到MPP节点,并运行节点。

2、点击底部 展开 按钮,原始数据有两千多条,筛选后1601条,筛选出运费大于20的数据,如图:

3、点击 保存 按钮,提示信息如下,点击 确定 按钮,转换为抽取模式。

4、再次点击 保存 按钮保存查询后,点击 回到数据集 按钮,返回新建数据模型主界面。

设置维度

1、在右侧维度区“Freight”字段上点击 标记为度量 按钮,将销售额字段标记为度量。

Image RemovedImage Added

2、按照刚才的方法设置其他字段的度量,如图:

Image RemovedImage Added

3、设置完成后,保存数据集,新建数据模型完成。

下面可进行数据分析,详情请参考 分析展现 。