概述
在合并行的场景中,会有集合操作的需求,具体来说,合并行有多种方式:交集、差集、并集和异或。通过不同的集合操作方式,可以满足多种合并需求场景。
功能配置入口
合并行的集合操作提供四种操作:交集、差集、并集和异或。配置入口如下图所示。
配置
配置参数 | 说明 |
---|---|
交集 | 交集是两个或多个集合中共有的元素组成的集合。例如,在行合并过程中,会输出两个数据集中行内容完全相同的行 |
差集 | 差集是存在于集合A中但不存在于集合B中的元素组成的集合。例如,在行合并过程中,会输出在数据集A中存在且数据集B中不存在的行 |
并集 | 并集是将两个或多个集合中的所有元素合并到一个新的集合中。例如,在行合并过程中,会输出在数据集A和数据集B中所有行 |
异或 | 交集是两个或多个集合中非共有的元素组成的集合。例如,在行合并过程中,会输出在数据集A中存在,数据集B中不存在的行和在数据集B中存在,数据集A中不存在的行 |
应用场景
数据集A如下图所示:
数据集B如下图所示
对数据集A和数据集B进行集合操作
- 交集操作:输出结果如下图所示,保留了数据集A和数据集B中都完全相同的行。
- 差集操作:输出结果如下图所示,去除了数据集A中数据集A和数据B相同的行。
- 并集操作:输出结果如下图所示,保留了数据集A和数据B中所有的行。
- 异或操作:输出结果如下图所示,保留了数据集A和数据B中非相同的行进行合并输出。
注意事项
合并行节点端口在连接线时,不支持跨端口合并,端口必须依次连接,中间不能有空余。
如果存在跨端口的连接方式,会运行报错,如下图所示:
正确的连接方式,如下图所示: