第60页,共108页。 显示 1,077 条结果 (0.024 秒)
数据挖掘-GBDT特征选择
概述 特征选择是为算法服务的,选择不同的特征会直接影响到模型的效果。GBDT特征选择,就是使用GBDT算法,来自动选择相关性高的特征。 输入/输出 输入 一个输入端口,用于接收前置节点传下来的数据集。 输出 一个输出端口,用于输出增加了离散后的字段的数据集。 参数设置 参数名称 说明 备注 选择特征列 选择需要的特征列,必须是数值列 必填(特征列中不能含有null) 选择标签列 选择做为标签列的字段 必填 需选择的特征数量 从待选择的特征列中输出特征列的数量 默认值为1,范围是[1数据挖掘-随机森林特征选择
概述 特征选择是为算法服务的,选择不同的特征会直接影响到模型的效果。随机森林特征行选择,就是使用随机森林算法,来自动选择相关性高的特征。 它是一种基于随机森林的封装式特征选择算RFFS,以随机森林算法为基本工具,以分类或回归精度作为准则函数,采用序列后向选择和广义序列后向选择方法进行特征选择。 输入/输出 输入 一个输入端口,用于接收前置节点传下来的数据集。 输出 一个输出端口,用于输出增加了离散后的字段的数据集。 参数设置 参数名称 说明 备注 选择特征列 选择需要的特征列,必须是数值列 必填(特征列中不能含有null数据挖掘-数据清洗
概述 规范化字符串,可移除字符串中空格、标点符号、字母、数字等不必要的字符或设置大小写方式。 2021-09-03_14-54-49.png 输入/输出 输入 一个输入端口,用于接收数据源。 输出 一个输出端口,用于输出数据清洗后的结果。 参数设置 数据清洗配置: 2021-09-03_14-56-27.png 数据清洗配置界面如下: 2021-09-03_14-58-56.png 设置项说明如下: 设置项 说明 已选字段 需要进行数据清洗的字段 处理方式 对字段进行清洗,清洗方式包括移除所有空格、移除首尾空格、移除标点符号、移除数字、移除字母数据挖掘-行过滤
概述 V10.5.12版本中新增了行过滤节点,该节点合并了旧版本的行选择和过滤节点,能够根据不同的筛选或者删除条件,选择对应的行。该节点提供了两种类型的筛选器。基本筛选器可以根据用户需求设置不同的筛选或者删除条件,选择不同数量的行;自定义筛选器通过写SQL语句(片段),对数据按照过滤表达式进行筛选。 image2023-2-3_16-0-41.png 输入/输出 输入 一个输入端口,用于接收数据集。 输出 一个输出端口,用于输出行过滤的结果。 参数设置 设置行过滤的参数: image2023-2-3_15-10-0.png 设置说明如下: 参数数据挖掘-随机森林特征选择
概述 特征选择是为算法服务的,选择不同的特征会直接影响到模型的效果。随机森林特征行选择,就是使用随机森林算法,来自动选择相关性高的特征。 它是一种基于随机森林的封装式特征选择算RFFS,以随机森林算法为基本工具,以分类或回归精度作为准则函数,采用序列后向选择和广义序列后向选择方法进行特征选择。 输入/输出 输入 一个输入端口,用于接收前置节点传下来的数据集。 输出 一个输出端口,用于输出增加了离散后的字段的数据集。 参数设置 参数名称 说明 备注 选择特征列 选择需要的特征列,必须是数值列 必填(特征列中不能含有null数据挖掘-GBDT特征选择
概述 特征选择是为算法服务的,选择不同的特征会直接影响到模型的效果。GBDT特征选择,就是使用GBDT算法,来自动选择相关性高的特征。 输入/输出 输入 一个输入端口,用于接收前置节点传下来的数据集。 输出 一个输出端口,用于输出增加了离散后的字段的数据集。 参数设置 参数名称 说明 备注 选择特征列 选择需要的特征列,必须是数值列 必填(特征列中不能含有null) 选择标签列 选择做为标签列的字段 必填 需选择的特征数量 从待选择的特征列中输出特征列的数量 默认值为1,范围是[1数据挖掘-自动特征组合
等待),特征组合就是假设性别特征是女,时间维度双11,会发现这两个特征组合起来一定是非常强对用户预测是否买东西的组合特征。女性在双十一购买商品的概率非常高,这就是交叉后的非线性的组合特征,非线性的组合特征对数据挖掘非常关键。 输入/输出 输入 一个输入端口,用于接收前置节点传下来的数据集。 输出 一个输出端口,用于输出特征组合过后的数据集。 参数设置 参数名称 说明 备注 选择列 选择需要进行组合的特征列,必须是数值列。 必填 选择标签列 用于选择作为标签列的字段 类别数需小于100 选择方式 用于数据挖掘-行过滤
概述 V10.5.12版本中新增了行过滤节点,该节点合并了旧版本的行选择和过滤节点,能够根据不同的筛选或者删除条件,选择对应的行。该节点提供了两种类型的筛选器。基本筛选器可以根据用户需求设置不同的筛选或者删除条件,选择不同数量的行;自定义筛选器通过写SQL语句(片段),对数据按照过滤表达式进行筛选。 image2023-2-3_16-0-41.png 输入/输出 输入 一个输入端口,用于接收数据集。 输出 一个输出端口,用于输出行过滤的结果。 参数设置 设置行过滤的参数: image2023-2-3_15-10-0.png 设置说明如下: 参数知识库升级失败-版本回退
入 Smartbi配置界面。 b) 根据实际情况修改知识库的信息。如当前你需要连接的数据库类型是Oracle,它的服务器地址为datasvr01、端口号是默认端口、Oracle 作为Smartbi知识库的数据库名字是orcl,连接此库的用户名和密码都是smartbi归因分析部署说明
: http://10.10.35.110:9070/manager/#/login?redirect=%2Fmain http://10.10.35.110:9070/manager/#/login?redirect=%2Fmain(ip地址和端口请根据部署环境替换