ETL高级查询工作流
ETL高级查询工作流必须以数据源为起点,以输出到MPP为终点:从数据源中抽取需要进行处理的数据,通过拖拽内置的预处理方法,之后将处理过的数据存储到目标源中。
定义ETL高级查询
新建私有ETL高级查询
数据基础
数据源中“产品销售表”的数据预览如下:
操作步骤
1、在系统主界面的快捷菜单中选择 数据准备 > 自助ETL,进入“自助ETL”管理界面:> 增强数据集,进入“新建增强数据集”界面:
2、在“自助ETL”管理界面中,选择 新建自助ETL 按钮,进入“新建ETL”定制界面。2、点击底部+添加“自助ETL高级查询”
进入“新建ETL高级查询”设计界面。
数据源
1、将关系数据源节点拖入画布区,在节点配置区设置关系数据源的参数。
2、在关系数据源上右键选择2、在工具栏中点击 执行到此处执行 按钮 ,运行当前节点。,运行关系数据源节点。
需要在表中添加序号,并去除采购金额字段的小数位。
数据预处理
1、将增加序列号节点拖入画布区,连接两个节点,设置序列列名称。1、将空值处理节点拖入画布区,连接两个节点,设置空值处理节点的参数。
添加“销售额”字段到已选字段,点击 确定 按钮后运行节点。
2、将派生列节点拖入画布区,连接两个节点。在节点配置区选择 派生列配置 按钮。
将对应函数和字段分别拖入添加/编辑表达式区,点击 确定 按钮,添加一条“销售额取整”的派生列,点击 确定 按钮后运行节点。
目标源
将处理好的数据输出成一张新的表。
1、将关系目标源家待拖入画布区,选择输出表的数据源、SCHEMA,并选择 新建表 按钮。
使用自助ETL处理数据完成,下面可对产品销售情况进行数据分析,详情请参考
1、连接派生列节点和输出到MPP节点,并运行节点。
2、点击底部 展开 按钮,在列筛选中选择“销售额”、“销售额取整”,查看数据预处理的结果,如图:
3、新建高级ETL查询完成,点击 保存 按钮,保存查询后,点击 回到数据集 按钮,返回新建增强数据集主界面。
设置维度
1、在右侧维度区“销售额取整”字段上点击 标记为度量 按钮,将销售额字段标记为度量。
2、在区域字段上右键更多中,选择“在报表中隐藏”来隐藏字段。
3、按照刚才的方法设置其他字段为度量、在报表中隐藏如图:
设置完成后,保存数据集,新建增强数据集完成。
下面可对产品销售情况进行数据分析,详情请参考 分析展现 。
其他私有查询转换为ETL高级查询
注意 |
---|
注意:其他私有查询可以转换为ETL高级查询,ETL高级查询不能转换为ETL高级查询。 |
1、