第138页,共677页。 显示 6,766 条结果 (0.531 秒)
数据挖掘-K均值
概述 K均值算法是一种简单的迭代型聚类算法,采用距离作为相似性指标,从而发现给定数据集中的K个类,且每个类的中心是根据类中所有值的均值得到,每个类用聚类中心来描述。它的聚类目标是以欧式距离作为相似度指标,使得各类的聚类平方和最小。 示例 使用“航空公司客户价值分析”案例数据,分析客户为高价值客户 … 。 标准化 最小最大值归一化 最大绝对值归一化 K值 取值范围是:>=2的整数,默认值为2 期待将数据聚类的数目; 随机种子 参数范围为:任意整数,默认值为:2。 初始化时随机选择类中心点的随机种子。seed设置为固定值,每次聚类结果是稳定数据挖掘-WOE编码
概述 WOE编码是评分卡模型常用的数据处理步骤,用于对所选特征值进行WOE编码,并计算IV值,且可根据IV值做特征选择。 输入/输出 输入 一个输入端口,用于接收需要进行WOE编码的数据集。 输出 两个输出端口,输出1是用于输出WOE编码转换后的数据集,输出2是WOE编码模型。 参数设置 参数名称 说明 备注 选择列 用于选择进行异常值处理设置的字段。 31.png 必填(特征列中不能含有null) 分箱方式 分位数分箱:根据设置的数值算出对应的分位数,按照算出的分位数对字段进行分箱。 自定义mongodb查询没有数据时smartbi查询报错
(本文档仅供参考) 问题说明 同样的语句,在navicat可正常执行,拿到smartbi执行出错 image2023-12-27_16-47-46.pngimage2023-12-27_16-50-9.png 问题原因 这个是因为在默认情况下,smartbi只会取第一行的数据作为所有列名,当获取数据时为空 … Mongo 取列名的逻辑 1、如果有 MONGO_FIELDS 注释,以注释为准,跳过下面的 2 ~ 3 点 2、取 find 的第一行数据的所有列作为列名 3、find 有第二参数 projection a) 遍历 projection 中声明的所有字段 b) 如果字段不存在于第二点中,则添加一列并且数据类型为自助仪表盘通过URL链接电子表格,下载为png/pdf/excel文件时只生成加载数据的动态图标
(本文档仅供参考) 问题现象 在自主仪表盘中通过URL链接引用电子表格资源,预览时界面显示正常,下载为图片、pdf、excel文件时只生成了一个加载数据的动态图标,文件内容空白。 Snipaste.jpg CatchBA21(04-08-(04-08-17-37-54).jpg 问题原因 因为自助仪表盘 … 导出缺少数据 url导出不全汇总求和 - 分组汇总不希望分组合并单元格,但数值型的数据要汇总合计
(本文档仅供参考) 问题 分组 汇总不希望分组合并单元格, 发货区域不希望合并单元格,每个单元格都展示出来,发货区域改成列表,运费汇总失效,麻烦看下如何实现。 3.jpg 解决方案 V87以下版本: 对于可视化查询,可以按如下方法设置: 可以在数据集里设置"运费"字段的聚合方式为:合计,然后在电子表格中将"发货区域"设置为列表即可。 1.jpg 2.jpg 对于原生sql查询、sql查询等,需要自行修改sql语句实现分类汇总。 V87及以上版本: 可直接配置分组不合并单元格即可。 image2022-6-22_12-25-53.png 分组基于oracle的自助数据集,新建计算字段,字段相加结果为空
(本文档仅供参考) 问题说明 在oracle数据库中,有一个表,其中存在2个数值的字段,分别是C_DATA1和C_DATA2,其中C_DATA1有一条数据为空。如下: image2021-4-29_13-59-44.png 在Smartbi中创建自助数据集,新建计算字段,其表达式为 C_DATA1+C_DATA2 image2021-4-29_14-9-44.png 在预览数据时,会发现,C_DATA1为空的那条记录,计算字段的值也为空。如下: image2021-4-29_14-10-31.png 那么,怎么让C_DATA1为空的数据,对应的计算字段值正确显示呢? 解决方案 原因:这个实际上获取sql数据错误:column 'XXX' does not exits
(本文档仅供参考) 问题说明 sql数据集报获取sql数据错误:column 'XXX' does not exits,原生sql数据集正常。 image2023-3-14_9-12-27.png 解决方案 经排查,sql数据集会在外面再进行嵌套,需要对字段设置别名。仪表盘清单表导出数据不全
(本文档仅供参考) 问题说明 仪表盘清单表导出数据不全 解决方案 可检查是否明细数据量超出了【系统运维】-【公共设置】-【Excel2007最大导出行数】限制。 image2024-2-5_18-51-12.png 导出缺少数据 清单表导出少数据sparkline迷你图导致电子表格数据不显示
(本文档仅供参考) 问题: 报表前端不显示数据,但是执行可以执行出来数据,td元素内的节点是img显示sparkline image2024-9-21_17-17-45.png 问题原因: sparkline就是迷你图中的线,在插件端中清除迷你图即可。 image2024-9-21_17-22-23.png 迷你图没数据数据挖掘-线性回归
概述 一种常用的回归方法,它是利用数理统计中回归分析,来确定两种或两种以上变量间相互依赖的定量关系的一种统计方法,通过凸优化的方法进行求解,以达到预测评估的效果。 示例 使用“波士顿房价预测”案例数据,预测波士顿房价。 图片35.png 其中,相关性分析是为了分析特征变量与目标变量的相关性 … 设置指定或范围内的参数值循环调参,匹配出最优的组合。 image2021-9-30_10-13-12.png 自动调参的方式分为两种: 指定值调参:指定一个固定的值进行自动调参。 范围调参:在指定的范围内进行自动调参。 设置项说明如下: 设置项 说明 拆分比例 将选择的数据拆分为两部分