概述
在合并行的场景中,需要对列进行匹配,为了使列匹配更加灵活和易用,新增了列匹配机制。
功能配置入口
先择合并行节点,点击配置选择列,进入合并行列配置界面,如下图所示。
配置
输出字段
配置参数 | 说明 |
---|---|
按别名自动配置 | 交集是两个或多个集合中共有的元素组成的集合。例如,在行合并过程中,会输出两个数据集中行内容完全相同的行 |
按真名自动配置 | 差集是存在于集合A中但不存在于集合B中的元素组成的集合。例如,在行合并过程中,会输出在数据集A中存在且数据集B中不存在的行 |
按位置自动配置 | 并集是将两个或多个集合中的所有元素合并到一个新的集合中。例如,在行合并过程中,会输出在数据集A和数据集B中所有行 |
手动配置字段 | 交集是两个或多个集合中非共有的元素组成的集合。例如,在行合并过程中,会输出在数据集A中存在,数据集B中不存在的行和在数据集B中存在,数据集A中不存在的行 |
字段不同时
配置参数 | 说明 |
---|---|
输出所有字段 | 交集是两个或多个集合中共有的元素组成的集合。例如,在行合并过程中,会输出两个数据集中行内容完全相同的行 |
输出公共字段 | 差集是存在于集合A中但不存在于集合B中的元素组成的集合。例如,在行合并过程中,会输出在数据集A中存在且数据集B中不存在的行 |
应用场景
数据集A如下图所示:
数据集B如下图所示
对数据集A和数据集B进行集合操作
交集操作:输出结果如下图所示,保留了数据集A和数据集B中都完全相同的行。
差集操作:输出结果如下图所示,去除了数据集A中数据集A和数据B相同的行。
并集操作:输出结果如下图所示,保留了数据集A和数据B中所有的行。
异或操作:输出结果如下图所示,保留了数据集A和数据B中非相同的行进行合并输出。
注意事项
合并行节点端口在连接线时,不支持跨端口合并,端口必须依次连接,中间不能有空余。
如果存在跨端口的连接方式,会运行报错,如下图所示:
正确的连接方式,如下图所示: