第44页,共190页。 显示 1,894 条结果 (0.03 秒)
数据挖掘-GBDT特征选择
。 参数设置 参数名称 说明 备注 选择特征列 选择需要的特征列,必须是数值列 必填(特征列中不能含有null) 选择标签列 选择做为标签列的字段 必填 需选择的特征数量 从待选择的特征列中输出特征列的数量 默认值为1,范围是[1 … 数 取值范围:>=1的整数,默认值为空 这个值用来限制叶子节点最少的样本数,如果某叶子节点数目小于样本数,则会和兄弟节点一起被剪枝。 示例 使用“居民用电数据”,预测是否漏电。特征选择3个特征和一个标签列,需选择的特征数量为2,选择方法为分类(二分类),其他参数默认。结果输出数据挖掘-GBDT特征选择
。 参数设置 参数名称 说明 备注 选择特征列 选择需要的特征列,必须是数值列 必填(特征列中不能含有null) 选择标签列 选择做为标签列的字段 必填 需选择的特征数量 从待选择的特征列中输出特征列的数量 默认值为1,范围是[1 … 数 取值范围:>=1的整数,默认值为空 这个值用来限制叶子节点最少的样本数,如果某叶子节点数目小于样本数,则会和兄弟节点一起被剪枝。 示例 使用“居民用电数据”,预测是否漏电。特征选择3个特征和一个标签列,需选择的特征数量为2,选择方法为分类(二分类),其他参数默认。结果输出透视分析(旧)、组合分析中的筛选项太靠近了怎么调整间距
(本文档仅供参考) 问题说明 组合分析和透视分析中的筛选项太靠近了怎么调整间距,在参数的参数布局里已经设置了格式,但是不生效 2.jpg 1.jpg 解决方案 参数之间的列间距,可以通过参数排版中设置,在两个参数之间插入一列,然后设置列宽,如下图: r-.jpg 参数之间的行间距,需要通过宏代码来设置 r-2.jpg 实现效果: r-3.jpg 筛选器边距 参数边距电子表格⬝ 动态扩展数据告警
的单元格”,输入公式:=IF(OR(COLUMN(B2)=2,COLUMN(B2)=3,COLUMN(B2)=4),B4<10000) ,设置单元格格式为字体颜色为“红色”,如图: image2019-2-28 19:44:38.png 公式说明如下: COLUMN(reference):返回引用的列号 … 值。如果忽略 [value_if_false],则默认为FALSE。 公式“IF(OR(COLUMN(B2)=2,COLUMN(B2)=3,COLUMN(B2)=4),B4<10000)":表示第2列或者第3列或者第4列的销售额小于10000的则满足设置的格式样式。 3、保存查看 预览效果电子表格⬝ 动态扩展数据告警
的单元格”,输入公式:=IF(OR(COLUMN(B2)=2,COLUMN(B2)=3,COLUMN(B2)=4),B4<10000) ,设置单元格格式为字体颜色为“红色”,如图: image2019-2-28 19:44:38.png 公式说明如下: COLUMN(reference):返回引用的列号 … 。如果忽略 [value_if_false],则默认为FALSE。 公式“IF(OR(COLUMN(B2)=2,COLUMN(B2)=3,COLUMN(B2)=4),B4<10000)":表示第2列或者第3列或者第4列的销售额小于10000的则满足设置的格式样式。 3、保存查看 预览效果如图,销售额数据挖掘-假设检验
概述 通过特征变量与目标变量之间的偏差来检验数据之间的相关性或回归分析中的拟合结果。 输入/输出 输入 一个输入端口,用于接收数据集 输出 一个输出端口,用于输出假设检验结果数据集 参数设置 参数名称 说明 备注 选择特征列 用于选择需要检验的字段列 必填 选择标签列 用于选择做为标签列的字段(必须为数值型) 示例 使用“鸢尾花数据”,选择4个特征列和1个标签列,输出结果如下图: 图片6.png 鼠标点击右键查看分析结果: 图片7.png 以上图知:已挑选的特征列的P值都趋近于0数据挖掘-假设检验
概述 通过特征变量与目标变量之间的偏差来检验数据之间的相关性或回归分析中的拟合结果。 输入/输出 输入 一个输入端口,用于接收数据集 输出 一个输出端口,用于输出假设检验结果数据集 参数设置 参数名称 说明 备注 选择特征列 用于选择需要检验的字段列 必填 选择标签列 用于选择做为标签列的字段(必须为数值型) 示例 使用“鸢尾花数据”,选择4个特征列和1个标签列,输出结果如下图: 图片6.png 鼠标点击右键查看分析结果: 图片7.png 以上图知:已挑选的特征列的P值都趋近于0数据挖掘-空值处理
设置空值处理的参数: image2021-9-13_14-3-3.png 参数面板用于设置需要处理空值的列,及空值处理的方式:单击 选择列 按钮,在弹出的窗口进行操作处理。 image2021-9-13_17-0-29.png 其中,处理策略包含如下内容: 最大值:使用本列字段的最大值替换空值,适用于数值型字段。 最小值:使用本列字段的最小值替换空值,适用于数值型字段。 平均值:使用本列字段的平均值替换空值,适用于数值型字段。 中位数:使用本列字段的中位数替换空值,适用于数值型字段。 按空值百分比删除列:若空值超过设置的百分比,则删除整列;适用于字符、数值型字段。 出现频率最多替换:使用本列出现频率最多的值数据挖掘-空值处理
/输出 输入 一个输入端口,用于接收数据集。 输出 一个输出端口,用于输出空值处理的结果。 参数设置 设置空值处理的参数: image2021-9-13_14-3-3.png 参数面板用于设置需要处理空值的列,及空值处理的方式:单击 选择列 按钮,在弹出的窗口进行操作处理。 image2021-9-13_17-0-29.png 其中,处理策略包含如下内容: 最大值:使用本列字段的最大值替换空值,适用于数值型字段。 最小值:使用本列字段的最小值替换空值,适用于数值型字段。 平均值:使用本列字段的平均值替换空值,适用于数值型字段。 中位数:使用本列字段的中位数替换空值,适用于数据挖掘-排序
: image2020-5-29 15:35:36.png 设置说明如下: 参数 说明 排序 用于选择排序字段及排序优先级: image2020-5-29 15:36:42.png 1、添加排序:添加排序字段,可单选或多选排序列。 当选择多列时,平台会根据选择的第一列进行排序,当第一列相同时,再根据第二列进行排序; 如果第一列和第二列都相同,再按照第三列进行排序,以此类推。 2、排序方式: asc:指定列按升序排列; desc:指定列按降序排列。 3、排列字段列表中,越靠前排列优先级越高。 排序