ETL高级查询工作流

ETL高级查询工作流必须以数据源为起点,以输出到MPP为终点:从数据源中抽取需要进行处理的数据,通过拖拽内置的预处理方法,之后将处理过的数据存储到目标源中。

定义ETL高级查询

新建私有ETL高级查询

数据基础

数据源中“产品销售表”的数据预览如下:

操作步骤

1、在系统主界面的快捷菜单中选择 数据准备 > 增强数据集,进入“新建增强数据集”界面:

2、点击底部+添加“自助ETL高级查询” 

进入“新建ETL高级查询”设计界面。

数据源

1、将关系数据源节点拖入画布区,在节点配置区设置关系数据源的参数。

2、在工具栏中点击 执行 按钮 ,运行关系数据源节点。

数据预处理

1、将空值处理节点拖入画布区,连接两个节点,设置空值处理节点的参数。

添加“销售额”字段到已选字段,点击 确定 按钮后运行节点。

2、将派生列节点拖入画布区,连接两个节点。在节点配置区选择 派生列配置 按钮。

将对应函数和字段分别拖入添加/编辑表达式区,点击 确定 按钮,添加一条“销售额取整”的派生列,点击 确定 按钮后运行节点。

目标源

1、连接派生列节点和输出到MPP节点,并运行节点。

2、点击底部 展开 按钮,在列筛选中选择“销售额”、“销售额取整”,查看数据预处理的结果,如图:

3、新建高级ETL查询完成,点击 保存 按钮,保存查询后,点击 回到数据集 按钮,返回新建增强数据集主界面。

设置维度

1、在右侧维度区“销售额取整”字段上点击 标记为度量 按钮,将销售额字段标记为度量。

2、在区域字段上右键更多中,选择“在报表中隐藏”来隐藏字段。

3、按照刚才的方法设置其他字段为度量、在报表中隐藏如图:

设置完成后,保存数据集,新建增强数据集完成。

下面可对产品销售情况进行数据分析,详情请参考 分析展现 。

其他私有查询转换为ETL高级查询

注意:其他私有查询可以转换为ETL高级查询,ETL高级查询不能转换为ETL高级查询。

1、