第47页,共287页。 显示 2,865 条结果 (0.03 秒)
数据挖掘-相关性分析
示例 使用“鸢尾花数据”,选择4个特征,分析这4个特征之间的相关性。输出结果如下: 图片1.png 鼠标点击右键查看分析结果“可视化”: 图片2.png 结合上图分析得出:特征“Petal_Length”和“Petal_Width”具有较高的相关性。 相关性分析数据挖掘-TF-IDF
没有输入端口 输出 一个输出端口,与抽取、变换节点组合使用。 参数设置 参数名称 说明 备注 特征项数 输入的数值n,代表算法最终会筛选出TF-IDF值最高的n个词 必填 示例 图片3.png 效果 使用“垃圾短信识别”数据,选择分词后的文本列_c2_seg_words_filtered,设置的特征项数为10,进行统计TF-IDF,输出结果如下图: 图片4.png tf-idf数据挖掘-特征离散
该节点与抽取、变换节点组合使用; 图片6.png 示例 使用“银行零售客户流失”数据,将是否代发客户、月均代发金额、性别、最多代发金额等特征进行等距离散化,结果如下图: 图片7.png 特征离散业务需求说明
总结出如下几点内容: 1、 根据流程,应该有两类角色:审批角色和普通角色。 2、 根据审批的要求,结合组织架构,规划用户组织如下: 图片1.png 3、 流程有如下两条运行线路: 普通员工提交请假申请,若小于5天则所属分公司领导审批通过结束。 普通员工提交请假申请,若大于等于5天则需要所属分公司领导和总公司领导都审批通过结束。 图片2.png业务需求说明
总结出如下几点内容: 1、 根据流程,应该有两类角色:审批角色和普通角色。 2、 根据审批的要求,结合组织架构,规划用户组织如下: 图片1.png 3、 流程有如下两条运行线路: 普通员工提交请假申请,若小于5天则所属分公司领导审批通过结束。 普通员工提交请假申请,若大于等于5天则需要所属分公司领导和总公司领导都审批通过结束。 图片2.png数据挖掘-特征离散
该节点与抽取、变换节点组合使用; 图片6.png 示例 使用“银行零售客户流失”数据,将是否代发客户、月均代发金额、性别、最多代发金额等特征进行等距离散化,结果如下图: 图片7.png 特征离散数据答疑-问答使用
补充说明。 添加图片 为提问的问题添加具体的图片帮助理解。 问题标签 为提问的问题添加标签。 设置为私密问题 默认未勾选,如未设置为私密则所有人都可以看到;如果设置为私密问题则需选择被提问人。 回答 1、在列表区中寻找需要回答的问题,点击 回答 按钮,会弹出“回答页数据挖掘-评分卡构建
示例 图片1.png 图为一个评分卡模型的构建过程。通过使用训练完成的逻辑回归模型和WOE编码模型作为输入,“评分卡构建”节点运行后输出一个评分模型,可通过“评分卡输出”节点查看各项特征对评分卡模型的贡献。 评分卡构建可通过查看分析结果查看训练后的模型参数,具体如下: 图片2.png 其中数据挖掘-相关性分析
示例 使用“鸢尾花数据”,选择4个特征,分析这4个特征之间的相关性。输出结果如下: 图片1.png 鼠标点击右键查看分析结果“可视化”: 图片2.png 结合上图分析得出:特征“Petal_Length”和“Petal_Width”具有较高的相关性。 相关性分析数据挖掘-TF-IDF
没有输入端口 输出 一个输出端口,与抽取、变换节点组合使用。 参数设置 参数名称 说明 备注 特征项数 输入的数值n,代表算法最终会筛选出TF-IDF值最高的n个词 必填 示例 图片3.png 效果 使用“垃圾短信识别”数据,选择分词后的文本列_c2_seg_words_filtered,设置的特征项数为10,进行统计TF-IDF,输出结果如下图: 图片4.png tf-idf