输入 | 只有一个输入端口,用于接收数据集。 |
---|---|
输出 | 只有一个输出端口,用于输出采样结果。 |
随机采样、加权采样、分层采样的参数设置说明如下:
类型 | 参数 | 说明 | ||
---|---|---|---|---|
随机采样 | 抽样比例 | 表示样本占总体的比例,范围是[0,1]的数,默认值为0.5。 | ||
抽样种子 | 作为随机序列的第一个数字,默认值为10。设定抽样种子,可以使随机结果固定,即运行结果在多次运行中保持不变。 | |||
加权采样 | 权重列 | 选择用于加权的列。
| ||
采样方式值 |
| |||
随机种子 | 作为随机序列的第一个数字。设定抽样种子,可以使随机结果固定,即运行结果在多次运行中保持不变。范围是任意整数。 | |||
分层采样 | 分层列 | 选择用于分层的列(能使数据有较大差异的列)。 | ||
采样方式值 |
| |||
随机种子 | 作为随机序列的第一个数字。设定抽样种子,可以使随机结果固定,即运行结果在多次运行中保持不变。 | |||
下采样 | 采样目标列 | 选择需要分类的列。 | ||
设置各类别的采样方式 | 类别值 | 选择需要采样的类别值。
| ||
采样方式值 |
| |||
采样值/采样比例 |
| |||
添加 | 添加一条分类,可满足对多个类别值采样。 | |||
编辑 | 修改采样方式、采样值/采样比例。 | |||
删除 | 删除分类。 | |||
随机种子 | 作为随机序列的第一个数字。设定抽样种子,可以使随机结果固定,即运行结果在多次运行中保持不变。范围是任意整数。 |