页面树结构
转至元数据结尾
转至元数据起始




概述

在合并行的场景中,会有集合操作的需求,具体来说,合并行有多种方式:交集、差集、并集和异或。通过不同的集合操作方式,可以满足多种合并需求场景。

功能配置入口

合并行的集合操作提供四种操作:交集、差集、并集和异或。配置入口如下图所示。

配置

配置参数

说明

交集

交集是两个或多个集合中共有的元素组成的集合。例如,在行合并过程中,会输出两个数据集中行内容完全相同的行

差集

差集是存在于集合A中但不存在于集合B中的元素组成的集合。例如,在行合并过程中,会输出在数据集A中存在且数据集B中不存在的行

并集并集是将两个或多个集合中的所有元素合并到一个新的集合中。例如,在行合并过程中,会输出在数据集A和数据集B中所有行
异或交集是两个或多个集合中非共有的元素组成的集合。例如,在行合并过程中,会输出在数据集A中存在,数据集B中不存在的行和在数据集B中存在,数据集A中不存在的行

应用场景

数据集A如下图所示:

数据集B如下图所示

对数据集A和数据集B进行集合操作

  • 交集操作:输出结果如下图所示,保留了数据集A和数据集B中都完全相同的行。

     

  • 差集操作:输出结果如下图所示,去除了数据集A中数据集A和数据B相同的行。

   

  • 并集操作:输出结果如下图所示,保留了数据集A和数据B中所有的行。

     

  • 异或操作:输出结果如下图所示,保留了数据集A和数据B中非相同的行进行合并输出。

    

注意事项

合并行节点端口在连接线时,不支持跨端口合并,端口必须依次连接,中间不能有空余。

如果存在跨端口的连接方式,会运行报错,如下图所示:

正确的连接方式,如下图所示: