页面树结构

版本比较

标识

  • 该行被添加。
  • 该行被删除。
  • 格式已经改变。

概述

WOE值是评分卡模型常用的数据处理步骤,用于对所选特征值进行WOE编码是评分卡模型常用的数据处理步骤,用于对所选特征值进行WOE编码,并计算IV值,且可根据IV值做特征选择。

输入/输出

输入

一个输入端口,用于接收需要进行WOE编码的数据集。

输出

两个输出端口,输出1是用于输出WOE编码转换后的数据集,输出2WOE编码模型。



面板
borderColor#BBBBBB
bgColor#F0F0F0
borderWidth1
borderStylesolid

目录


参数设置

参数名称

说明

备注

选择列

用于选择进行异常值处理设置的字段。

Image Removed

Image Added

必填(特征列中不能含有null

分箱方式

  • 分位数分箱:根据设置的数值算出对应的分位数,按照算出的分位数对字段进行分箱。
  • 自定义分箱:用户可以自定义对字段进行分箱的区间。
  • 不参与分箱:该字段不参与分箱。

 

设置

  • 分位数分箱:将字段分成指定个部分,每一部分作为一个箱。比如设置分箱数为4,则计算出25%50%75%3个分位数,将字段分为四个分箱。
  • 自定义分箱:用户自己定义分箱区间。如-INF,500,1000,INF

当分箱方式为“不参与分箱“,这里不需要设置。

选择标签列

选择做为标签列的字段。

必填

 

示例

Image Added

效果

使用“银行信用贷款预测“,选择”职业“,“婚姻状态”,“教育程度”,“是否有房”,“是否有贷款”,“月”,“是否贷款”这七个字段作为特征列。如下图:

Image Modified

然后通过“特征转换”新增列后缀index,结合“抽取”、“变化”节点之后,生成如下图:

Image Modified

最后接入“WOE编码”节点,即可点击鼠标右键查看分析效果:

Image Modified

到此就完成WOE值和IV值的计算。