ETL高级查询工作流
ETL高级查询工作流必须以数据源为起点,以输出到MPP为终点:从数据源中抽取需要进行处理的数据,通过拖拽内置的预处理方法,之后再将处理过的数据存储到目标源中。
定义ETL高级查询
一、新建ETL高级查询
数据基础
数据源中“产品销售表”的数据预览如下:
操作步骤
1、在系统主界面的快捷菜单中,选择 数据准备 > 增强数据集 。
2、进入“新建增强数据集”界面,点击底部 + ,添加“ETL高级查询” 。
进入“新建ETL高级查询”设计界面。
数据源
1、将关系数据源节点拖入画布区,在节点配置区设置关系数据源的参数。
2、在工具栏中点击 执行 按钮 ,运行关系数据源节点。
数据预处理
1、将空值处理节点拖入画布区,连接两个节点,设置空值处理节点的参数。
2、在选择列界面中,添加“销售额”字段到已选字段,点击 确定 按钮后运行节点。
3、将派生列节点拖入画布区,连接两个节点。在节点配置区选择 派生列配置 按钮。
4、在选择列界面中,将对应函数和字段分别拖入添加/编辑表达式区,点击 确定 按钮,添加一条“销售额取整”的派生列,点击 确定 按钮后运行节点。
目标源
1、连接派生列节点和输出到MPP节点,并运行节点。
2、点击底部 展开 按钮,在列筛选下拉框中选择“销售额”、“销售额取整”字段,查看数据预处理的结果,如图:
去除了销售额为空的数据,并对销售额字段取整。
3、新建高级ETL查询完成,点击 保存 按钮保存查询后,点击 回到数据集 按钮,返回新建增强数据集主界面。
设置维度
1、在右侧维度区“销售额取整”字段上点击 标记为度量 按钮,将销售额字段标记为度量。
2、在区域字段上右键更多中,选择“在报表中隐藏”来隐藏字段。
3、按照刚才的方法设置其他字段的度量、在报表中隐藏如图:
4、设置完成后,保存数据集,新建增强数据集完成。
下面可对产品销售情况进行数据分析,详情请参考 分析展现 。
二、其他私有查询转换为ETL高级查询
ETL高级查询不能转换为ETL高级查询,其他私有查询可以转换为ETL高级查询。
新建其他私有查询
私有查询以“即席查询”为例,演示如何转换为ETL高级查询。
1、在系统主界面的快捷菜单中,选择 数据准备 > 增强数据集 。
2、进入“新建增强数据集”界面,点击底部 + ,添加“即席查询” 。
3、进入新建即席查询界面,定制即席查询如下:
定制即席查询,详情请参考 即席查询 。
4、新建即席查询完成,点击 保存 按钮保存查询后,点击 回到数据集 按钮,返回新建增强数据集主界面。
转化为ETL高级查询
1、在新建的即席查询上右键或更多中,选择“转换为ETL高级查询”。
进入“ETL高级查询”设计界面。
2、数据源为刚才新建的即席查询,删除节点之间的连线,可以点击 编辑数据查询 按钮,编辑即席查询的数据,完成后在工具栏中点击 运行 按钮。
编辑数据查询界面如下:
数据预处理
1、将过滤节点拖入画布区,连接两个节点,点击 过滤器 按钮,设置过滤节点的参数。
设置的过滤器界面如下:
目标源
1、连接过滤节点和输出到MPP节点,并运行节点。
2、点击底部 展开 按钮,原始数据有两千多条,筛选后1601条,筛选出运费大于20的数据,如图:
3、点击 保存 按钮,提示信息如下,点击 确定 按钮,转换为抽取模式。
4、再次点击 保存 按钮保存查询后,点击 回到数据集 按钮,返回新建增强数据集主界面。
设置维度
1、在右侧维度区“Freight”字段上点击 标记为度量 按钮,将销售额字段标记为度量。
2、按照刚才的方法设置其他字段的度量,如图:
3、设置完成后,保存数据集,新建增强数据集完成。
下面可进行数据分析,详情请参考 分析展现 。