第55页,共190页。 显示 1,894 条结果 (0.036 秒)
数据挖掘-WOE编码
。 参数设置 参数名称 说明 备注 选择列 用于选择进行异常值处理设置的字段。 31.png 必填(特征列中不能含有null) 分箱方式 分位数分箱:根据设置的数值算出对应的分位数,按照算出的分位数对字段进行分箱。 自定义 … ,INF。 当分箱方式为“不参与分箱“,这里不需要设置。 选择标签列 选择做为标签列的字段。 必填 示例 image2020-7-23_17-15-53.png 效果 使用“银行信用贷款预测“,选择”职业“,“婚姻状态”,“教育程度”,“是否有房”,“是否有贷款”,“月数据挖掘 - CBLOF
数据的概率越大。 CBLOF算法适用于当没有已知正常的数据时,对所有输入的新数据进行异常值的辨别。 输入/输出 输入 一个输入端口,接收要异常检测的数据 输出 一个输出端口,用于输出检测后的结果 参数设置 参数名称 说明 备注 选择特征列 选择用于计算的特征列 选择多个列,建议使用标准化后的特征列 绝对多数占比 0到1之间的小数, 用于区分大簇和小簇的阈值 占比和超过这个数值的会被区分为大簇 突降倍数 用于区分大簇和小簇的阈值 大簇和小簇界限间两个簇大小的倍数差 异常占比 异常数据点的占数据挖掘-数据清洗V2
用于选择进行数据清理的字段: image2023-2-3_14-54-39.png 检测方法 数值型列 将空值替换为最大值: 将空值替换为最小值: 将空值替换为平均值: 将空值替换为中位数: 删除控制占比高于百分比的列 将控制替换为出现频率最高的值 将空值替换为指定值 过滤整行空值 值替换 非数值型列 删除控制占比高于百分比的列 将控制替换为出现频率最高的值 将空值替换为指定值 过滤整行空值 移除所有空格 移除首尾空格 移除标点符号 移除数字 移除字母 设为小写 设为大写 首字母大写 值替换 字符串替换 正则替换 指定值数据挖掘-WOE编码
。 参数设置 参数名称 说明 备注 选择列 用于选择进行异常值处理设置的字段。 31.png 必填(特征列中不能含有null) 分箱方式 分位数分箱:根据设置的数值算出对应的分位数,按照算出的分位数对字段进行分箱。 自定义 … ,INF。 当分箱方式为“不参与分箱“,这里不需要设置。 选择标签列 选择做为标签列的字段。 必填 示例 image2020-7-23_17-15-53.png 效果 使用“银行信用贷款预测“,选择”职业“,“婚姻状态”,“教育程度”,“是否有房”,“是否有贷款”,“月数据挖掘-数据清洗V2
用于选择进行数据清理的字段: image2023-2-3_14-54-39.png 检测方法 数值型列 将空值替换为最大值: 将空值替换为最小值: 将空值替换为平均值: 将空值替换为中位数: 删除空值占比高于百分比的列 将空值替换为出现频率最高的值 将空值替换为指定值 过滤整行空值 值替换 非数值型列 删除空值占比高于百分比的列 将空值替换为出现频率最高的值 将空值替换为指定值 过滤整行空值 移除所有空格 移除首尾空格 移除标点符号 移除数字 移除字母 设为小写 设为大写 首字母大写 值替换 字符串替换 正则替换 指定值数据挖掘 - CBLOF
数据的概率越大。 CBLOF算法适用于当没有已知正常的数据时,对所有输入的新数据进行异常值的辨别。 输入/输出 输入 一个输入端口,接收要异常检测的数据 输出 一个输出端口,用于输出检测后的结果 参数设置 参数名称 说明 备注 选择特征列 选择用于计算的特征列 选择多个列,建议使用标准化后的特征列 绝对多数占比 0到1之间的小数, 用于区分大簇和小簇的阈值 占比和超过这个数值的会被区分为大簇 突降倍数 用于区分大簇和小簇的阈值 大簇和小簇界限间两个簇大小的倍数差 异常占比 异常数据点的占宏示例:如何写宏删除线上展示时扩展数据中的边框
: image2018-11-22 10:13:21.png 类型 对象 事件 ClientSide spreadsheetReport onRender /** * 说明:此示例数据列为B列,A列为空白列,C列也为空白,仅供参考,实际报表样式需另作调整 * 类型 … =spreadsheetReport.parseCellIndex(PosList[i])[1]; //获取列号 var rowIndex=spreadsheetReport.parseCellIndex(PosList[i])[0]; //获取行号 //设置A列右边枚举分组示例
分组”,将“发货城市”字段数据分为“一线城市、二线城市、其他城市”三组。 示例效果 image2019-10-18 17_8_51.png 实现步骤 1、创建透视分析 创建透视分析,待选列包含三个字段“产品类别”、“发货城市”和“销售额”。行区选择“产品类别”,列区选择“发货城市”,度量区选择“销售额”。如图: image2019-11-26 14_32_27.png 2、新建分组字段 1)待选列选中“发货城市”字段,右键 > 新建分组字段 ,如图: image2019-10-18 17:2:45.png 进入“自定义分组字段”设置界面: image2019-10-18 17:3:10.png 2)设置“自定义【web电子表格】自由报表
照如下样式在表格中设计好表样: image2021-11-3_11-41-35.png 该静态表表样的样式配置如下: 行高 列宽 标题区域 对齐方式 背景底色 小标题前的方框 19px B列:30px C列:25px D列:5px E列:116px 其它列:73px交叉表组件
概要说明 交叉表是表格展现数据的一种基础报表,是行、列都有分组的报表,支持对度量的汇总。 系统对交叉表的组织方式:列区或行区必须与汇总区结合使用才可以展现数据,且通常列区或行区使用“维度”,汇总区使用“度量”。 入口 图例 2022-02-19_15-39-48.png 下图是常用的一种交叉表,它从产品、时间和区域这三个维度来展示“销售额”和“销售量”的汇总数据。 image2019-7-24 10_48_48.png 特点 支持多维度。 配图建议: 列区:1个或多个维度 行区:1个或多个维度 汇总区:1个或多个维度 数据来源 当交叉表来源于业务主题/自助数据