页面树结构

版本比较

标识

  • 该行被添加。
  • 该行被删除。
  • 格式已经改变。


目录

ETL高级查询工作流

ETL高级查询工作流必须以数据源为起点,以输出到MPP为终点:从数据源中抽取需要进行处理的数据,通过拖拽内置的预处理方法,之后再将处理过的数据存储到目标源中。

定义ETL高级查询

一、新建ETL高级查询

新建ETL高级查询

数据基础

数据源中“产品销售表”的数据预览如下:

操作步骤

1、在系统主界面的快捷菜单中,选择 数据准备 > 增强数据集 数据模型

Image Removed

2、进入“新建增强数据集”界面,点击底部 + ,添加“ETL高级查询” 。

Image RemovedImage Added

2、进入“新建数据模型”界面,单击Image Added ,选择 ETL高级查询 

Image Added

进入“新建ETL高级查询”设计界面。

Image RemovedImage Added

数据源

1、将关系数据源节点拖入画布区,在节点配置区设置关系数据源的参数。

Image Removed

2、在工具栏中点击 执行 按钮 ,运行关系数据源节点。

Image RemovedImage Added

2、在“关系数据源”节点右键菜单选择 执行该节点运行关系数据源节点。

Image Added

数据预处理

1、将空值处理节点拖入画布区,连接两个节点,设置空值处理节点的参数。

Image Removed

2、在选择列界面中,添加“销售额”字段到已选字段,点击 确定 按钮后运行节点。

Image Removed节点拖入画布区,连接两个节点,单击 选择列

Image Added

2、在弹出的”空值处理“窗口中选择进行空值处理的字段及处理策略:

Image Added

2、在”空值处理“窗口单击 确定 按钮,返回高级ETL查询设计界面,在”空值处理“节点右键菜单选择 执行该节点,待执行成功。

Image Added

3、将派生列节点拖入画布区,连接两个节点。在节点配置区选择 派生列配置 按钮。

Image Removed

4、在选择列界面中,将对应函数和字段分别拖入添加/编辑表达式区,点击 确定 按钮,添加一条“销售额取整”的派生列,点击 确定 按钮后运行节点。

Image Removed节点拖入画布区,连接两个节点,在节点配置区单击 派生列配置,弹出"派生列配置“窗口。

Image Added

4、在"派生列配置“窗口按照如下设置:

Image Added

5、设置完成后,单击 确定 按钮,返回”高级ETL查询“设计界面。

目标源

1、连接派生列节点和输出到MPP节点,并运行节点。

Image Removed

2、点击底部 展开 按钮,在列筛选下拉框中选择“销售额”、“销售额取整”字段,查看数据预处理的结果,如图:

Image Removed

去除了销售额为空的数据,并对销售额字段取整。

3、新建高级ETL查询完成,点击 保存 按钮保存查询后,点击 回到数据集 按钮,返回新建增强数据集主界面。

Image RemovedImage Added

2、在”输出到MPP“节点右键菜单选择 查看输出,底部数据预览区展开,可以查看“销售额取整”字段的数据预处理结果,如图:

Image Added

3、新建高级ETL查询完成,单击工具栏 保存 按钮保存查询后,点击 回到模型 按钮,返回新建数据模型主界面。

设置维度

1、在右侧维度区“销售额取整”字段上点击 标记为度量 按钮,将销售额字段标记为度量。

Image RemovedImage Added

2、在区域字段上右键更多中,选择“在报表中隐藏”来隐藏字段。2、在区域字段上右键“更多”中,选择“在报表中隐藏”来隐藏字段。

Image RemovedImage Added

3、按照刚才的方法设置其他字段的度量、在报表中隐藏如图:

Image RemovedImage Added

4、设置完成后,保存数据集,新建增强数据集完成。4、设置完成后,保存数据模型,新建数据模型完成。

下面可对产品销售情况进行数据分析,详情请参考 分析展现 。

二、其他私有查询转换为ETL高级查询

其他私有查询转换为ETL高级查询

注意

ETL高级查询不能转换为ETL高级查询,其他私有查询可以转换为ETL高级查询。

新建其他私有查询

私有查询以“即席查询”为例,演示如何转换为ETL高级查询。

1、在系统主界面的快捷菜单中,选择 数据准备 > 增强数据集 数据模型

Image RemovedImage Added

2、进入“新建增强数据集”界面,点击底部 + ,添加“即席查询” 。Image Removed进入“新建数据模型”界面,单击Image Added ,选择 即席查询

Image Added

3、进入新建即席查询界面,定制即席查询如下:

Image RemovedImage Added

定制即席查询,详情请参考 即席查询可视化SQL查询 。

4、新建即席查询完成,点击 保存 按钮保存查询后,点击 回到数据集回到模型 按钮,返回新建增强数据集主界面。按钮,返回新建数据模型主界面。

Image RemovedImage Added

转化为ETL高级查询

1、在新建的即席查询上右键或更多中,选择“转换为ETL高级查询”。

Image RemovedImage Added

进入“ETL高级查询”设计界面。

Image Removed

2、数据源为刚才新建的即席查询,删除节点之间的连线,可以点击 编辑数据查询 按钮,编辑即席查询的数据,完成后在工具栏中点击 运行 按钮。

Image Removed

编辑数据查询界面如下:

Image RemovedImage Added

2、删除节点之间的连线,在“即席查询”右键菜单选择 执行该节点,执行成功则保证了该数据源可以应用。

Image Added

数据预处理

1、将过滤节点拖入画布区,连接两个节点,点击 节点拖入画布区,连接两个节点,选择“过滤”节点后单击击 过滤器 按钮,设置过滤节点的参数。 按钮,弹出“筛选器”窗口。

Image RemovedImage Added

2、设置的过滤器界面如下:2、在“筛选器”窗口进行如下设置:

Image RemovedImage Added

目标源

1、连接过滤节点和输出到MPP节点,并运行节点。Image Removed连接"过滤"节点和"输出到MPP"节点,并运行节点。

Image Added

2、点击底部 展开 按钮,原始数据有两千多条,筛选后1601条,筛选出运费大于20的数据,如图:

Image RemovedImage Added

3、点击 保存 按钮,提示信息如下,点击 确定 按钮,转换为抽取模式。

Image RemovedImage Added

4、再次点击 保存 按钮保存查询后,点击 回到数据集回到模型 按钮,返回新建增强数据集主界面。按钮,返回新建数据模型主界面。

Image RemovedImage Added

设置维度

1、在右侧维度区“Freight”字段上点击 标记为度量 按钮,将销售额字段标记为度量。

Image RemovedImage Added

2、按照刚才的方法设置其他字段的度量,如图:

Image RemovedImage Added

3、设置完成后,保存数据集,新建增强数据集完成。3、设置完成后,保存数据集,新建数据模型完成。

下面可进行数据分析,详情请参考 分析展现 。