第95页,共561页。 显示 5,606 条结果 (0.097 秒)
数据挖掘-梯度提升回归树
概述 梯度提升回归树是梯度提升树算法,原理是训练多棵回归树,每棵树建立是基于前一课树的残差,基函数为CART树,损失函数为平方损失函数的回归算法。 示例 使用“波士顿房价预测”案例数据,预测波士顿房价。 图片34.png 其中,相关性分析是为了分析特征变量与目标变量的相关性系数,方便特征选择 … 介绍说明。 标准化 最小最大值归一化 最大绝对值归一化 参数 单位标准差归一化 勾选后,归一化后数据的标准差等于1 平均数据中心化 勾选后,归一化后数据的均值等于0 自动调参设置 系统默认的各项参数值范围。 必须结合“启用数据挖掘-分词
概述 分词就是将连续的字序列按照一定的规范重新组合成词序列的过程。它是对句子进行精确分词,在词库中进行搜索匹配,将句子根据匹配的结果分成那些常见的词组或者单词。常用于做文本挖掘分析。 输入/输出 输入 一个输入端口,用于接收数据集 输出 一个输出端口,用于输出分词后 … : Ansj(默认):可直接根据系统词库分出人名、机构等信息。但多单词英文姓名无法分出,且使用自定义词典时,系统词典还是优先被使用。适用于不使用自定义词典的场景。 Hanlp:可分出多单词的英文名称,且词典数据可包含空格。添加自定义词典的速度较慢。 启用全局词典 使用全局词典中的词辅助进行分词。配置全局V10.5版本电子表格右侧数据集面板空白
(本文档仅供参考) 问题 V10.5版本中,电子表格登录插件之后,右侧数据集面板空白,如下图所示。 图1.png 解决方案 此问题是因为10.5版本中,默认是需要进行新建“模型查询 ”或“SQL查询”进行制作电子表格的,关于电子表格数据来源可查看此wiki:电子表格⬝ 数据来源 如需展示对应资源树的数据集资源,有三点需要注意: 1、V10.5 版本中,旧数据集资源的显示和使用统一通过 License 控制。若是希望在V10.5版本中继续使用旧的数据集,则需更新授权包含旧数据集的 License 文件; 2、在系统运维—>系统选项—>高级设置 中添加"DISABLE_OLD_DATASET_NEW_ENTRY镜像部署如何配置数据库域名映射
(本文仅供参考) 问题现象 知识库用域名配置连接不成功,提示smartbi容器无法解析这个域名。 image2024-8-31_15-13-54.png image2024-8-31_15-32-47.png 方案 需要将域名的地址解析写到容器内,即smartbi的yaml文件需要配置一下数据库域名的解析 hostAliases: - ip: 数据库IP hostnames: - 数据库域名 示例如下,注意要替换成实际的域名解析的IP地址,并且注意层级 image2024-8-31_15-36-6.png数据模型中使用系统函数示例
(本文档仅供参考) 问题 数据模型中的计算度量和计算列要获取用户ID如何使用? 方案 可通过系统函数GetUserID()获取当前用户的ip,在数据模型的计算度量和计算列中,注意用单引号将系统函数括起来 计算度量: image2024-10-14_16-51-55.png 计算列: image2024-10-14_16-54-27.png 仪表盘中使用对应字段效果: image2024-10-14_16-56-58.png 数据模型系统函数数据挖掘-假设检验
概述 通过特征变量与目标变量之间的偏差来检验数据之间的相关性或回归分析中的拟合结果。 输入/输出 输入 一个输入端口,用于接收数据集 输出 一个输出端口,用于输出假设检验结果数据集 参数设置 参数名称 说明 备注 选择特征列 用于选择需要检验的字段列 必填 选择标签列 用于选择做为标签列的字段(必须为数值型) 示例 使用“鸢尾花数据”,选择4个特征列和1个标签列,输出结果如下图: 图片6.png 鼠标点击右键查看分析结果: 图片7.png 以上图知:已挑选的特征列的P值都趋近于0数据挖掘-假设检验
概述 通过特征变量与目标变量之间的偏差来检验数据之间的相关性或回归分析中的拟合结果。 输入/输出 输入 一个输入端口,用于接收数据集 输出 一个输出端口,用于输出假设检验结果数据集 参数设置 参数名称 说明 备注 选择特征列 用于选择需要检验的字段列 必填 选择标签列 用于选择做为标签列的字段(必须为数值型) 示例 使用“鸢尾花数据”,选择4个特征列和1个标签列,输出结果如下图: 图片6.png 鼠标点击右键查看分析结果: 图片7.png 以上图知:已挑选的特征列的P值都趋近于0with as的写法,数据集预览报错
server数据库进行创建,设置了获取总行数的情况下sql server数据库的with as不支持select count(*)进行外层封装, 由于目前产品逻辑获取总行数需要进行select count(*)进行封装,如需获取总行数建议更换sql的写法实现with as的效果,如下图: InsertPic_(07-30-14-41-38).png 目前测试在数据库是oracle的情况下可以支持with as开头的写法,但是大部分的数据库都是不支持的。 as with数据模型-两个字符型字段排序
(文档仅供参考) 问题描述: 用户有两个字段,一个是年,为字符串类型,还有另一个是项目名称,想同时进行排序。年按大到小,项目名称按照自定义顺序。 目前使用直接使用sql排序,总有一个不是想要的顺序 问题解决: 在使用模型时,多个字段排序如下。 image2023-8-15_13-56-24.png image2023-8-15_13-56-3.png 注:该写法只在仪表盘生效,用excel的话,同一个命名集会拼接起来。如下图: image2023-8-15_14-1-2.png 字符串排序 数据模型多个字符串排序数据预警 - 勾选了携带“来源报表”的访问链接后跳转的地址不对
。 image2025-3-3_15-26-21.png 数据预警来源报表的访问链接异常