页面树结构

版本比较

标识

  • 该行被添加。
  • 该行被删除。
  • 格式已经改变。


目录

ETL高级查询工作流

ETL高级查询工作流必须以数据源为起点,以输出到MPP为终点:从数据源中抽取需要进行处理的数据,通过拖拽内置的预处理方法,之后再将处理过的数据存储到目标源中。

定义ETL高级查询

新建ETL高级查询

数据基础

数据源中“产品销售表”的数据预览如下:

操作步骤

1、在系统主界面的快捷菜单中,选择 数据准备 > 数据模型 。

2、进入“新建数据模型”界面,点击底部 + ,添加“ETL高级查询” 。

Image Removed2、进入“新建数据模型”界面,单击Image Added ,选择 ETL高级查询 

Image Added

进入“新建ETL高级查询”设计界面。

Image RemovedImage Added

数据源

1、将关系数据源节点拖入画布区,在节点配置区设置关系数据源的参数。

Image RemovedImage Added

2、在工具栏中点击 执行 按钮 ,运行关系数据源节点。

Image RemovedImage Added

数据预处理

1、将空值处理节点拖入画布区,连接两个节点,设置空值处理节点的参数。

2、在选择列界面中,添加“销售额”字段到已选字段,点击 确定 按钮后运行节点。

3、将派生列节点拖入画布区,连接两个节点。在节点配置区选择 派生列配置 按钮。

4、在选择列界面中,将对应函数和字段分别拖入添加/编辑表达式区,点击 确定 按钮,添加一条“收入规模取整”的派生列,点击 增加 按钮后运行节点。

目标源

1、连接派生列节点和输出到MPP节点,并运行节点。

2、点击底部 展开 按钮,在列筛选下拉框中选择“收入规模”、“收入规模取整”字段,查看数据预处理的结果,如图:

去除了销售额为空的数据,并对销售额字段取整。

3、新建高级ETL查询完成,点击 保存 按钮保存查询后,点击 回到数据集 按钮,返回新建数据模型主界面。

设置维度

1、在右侧维度区“销售额取整”字段上点击 标记为度量 按钮,将销售额字段标记为度量。

2、在区域字段上右键“更多”中,选择“在报表中隐藏”来隐藏字段。

3、按照刚才的方法设置其他字段的度量、在报表中隐藏如图:

4、设置完成后,保存数据集,新建数据模型完成。

下面可对产品销售情况进行数据分析,详情请参考 分析展现 。

其他私有查询转换为ETL高级查询

注意

ETL高级查询不能转换为ETL高级查询,其他私有查询可以转换为ETL高级查询。

新建其他私有查询

私有查询以“即席查询”为例,演示如何转换为ETL高级查询。

1、在系统主界面的快捷菜单中,选择 数据准备 > 数据模型 。

2、进入“新建数据模型”界面,点击底部 + ,添加“即席查询” 。

3、进入新建即席查询界面,定制即席查询如下:

定制即席查询,详情请参考 即席查询 。

4、新建即席查询完成,点击 保存 按钮保存查询后,点击 回到数据集 按钮,返回新建数据模型主界面。

转化为ETL高级查询

1、在新建的即席查询上右键或更多中,选择“转换为ETL高级查询”。

进入“ETL高级查询”设计界面。

2、数据源为刚才新建的即席查询,删除节点之间的连线,可以点击 编辑数据查询 按钮,编辑即席查询的数据,完成后在工具栏中点击 运行 按钮。

编辑数据查询界面如下:

数据预处理

1、将过滤节点拖入画布区,连接两个节点,点击 过滤器 按钮,设置过滤节点的参数。

设置的过滤器界面如下:

目标源

1、连接过滤节点和输出到MPP节点,并运行节点。

2、点击底部 展开 按钮,原始数据有两千多条,筛选后1601条,筛选出运费大于20的数据,如图:

3、点击 保存 按钮,提示信息如下,点击 确定 按钮,转换为抽取模式。

4、再次点击 保存 按钮保存查询后,点击 回到数据集 按钮,返回新建数据模型主界面。

设置维度

1、在右侧维度区“Freight”字段上点击 标记为度量 按钮,将销售额字段标记为度量。

2、按照刚才的方法设置其他字段的度量,如图:

3、设置完成后,保存数据集,新建数据模型完成。

下面可进行数据分析,详情请参考 分析展现 。