第131页,共677页。 显示 6,766 条结果 (0.578 秒)
数据模型-计算度量引擎隐藏字段,新建计算度量为空
(本文档仅供参考) 问题说明 数据模型中新建计算度量中,如果被引用的字段设置了在报表中隐藏,则该计算度量在预览时返回为空: image2024-8-27_9-31-0.png image2024-8-27_9-31-10.png 解决方案: 用于控制计算度量的表达式是否能使用报表隐藏的字段。设置为true时,计算度量表达式能使用这些报表中隐藏字段;设置为false 时,则不支持 image2024-8-27_9-32-35.png 计算度量为空数据挖掘-梯度提升回归树
概述 梯度提升回归树是梯度提升树算法,原理是训练多棵回归树,每棵树建立是基于前一课树的残差,基函数为CART树,损失函数为平方损失函数的回归算法。 示例 使用“波士顿房价预测”案例数据,预测波士顿房价。 图片34.png 其中,相关性分析是为了分析特征变量与目标变量的相关性系数,方便特征选择 … 介绍说明。 标准化 最小最大值归一化 最大绝对值归一化 参数 单位标准差归一化 勾选后,归一化后数据的标准差等于1 平均数据中心化 勾选后,归一化后数据的均值等于0 自动调参设置 系统默认的各项参数值范围。 必须结合“启用数据挖掘-梯度提升回归树
概述 梯度提升回归树是梯度提升树算法,原理是训练多棵回归树,每棵树建立是基于前一课树的残差,基函数为CART树,损失函数为平方损失函数的回归算法。 示例 使用“波士顿房价预测”案例数据,预测波士顿房价。 图片34.png 其中,相关性分析是为了分析特征变量与目标变量的相关性系数,方便特征选择 … 介绍说明。 标准化 最小最大值归一化 最大绝对值归一化 参数 单位标准差归一化 勾选后,归一化后数据的标准差等于1 平均数据中心化 勾选后,归一化后数据的均值等于0 自动调参设置 系统默认的各项参数值范围。 必须结合“启用数据挖掘-分词
概述 分词就是将连续的字序列按照一定的规范重新组合成词序列的过程。它是对句子进行精确分词,在词库中进行搜索匹配,将句子根据匹配的结果分成那些常见的词组或者单词。常用于做文本挖掘分析。 输入/输出 输入 一个输入端口,用于接收数据集 输出 一个输出端口,用于输出分词后 … : Ansj(默认):可直接根据系统词库分出人名、机构等信息。但多单词英文姓名无法分出,且使用自定义词典时,系统词典还是优先被使用。适用于不使用自定义词典的场景。 Hanlp:可分出多单词的英文名称,且词典数据可包含空格。添加自定义词典的速度较慢。 启用全局词典 使用全局词典中的词辅助进行分词。配置全局数据挖掘-OneHot编码
用于设置在原字段名后追加后缀生成新的列,默认后缀为:OneHot; 该节点与抽取、变换节点组合使用; image2020-9-8_9-48-8.png 非法数据处理策略 选择对非法数据进行处理的策略,非法数据指空值或未进模型的类别值。 自动过滤:在转换时,对在抽取时未出现的类别或空值进行删除; 特殊编码:在转换时,对在抽取时未出现的类别以一种特殊编码进行转换; 非法检测:在转换时,对在抽取时未出现的类别进行报错提示。 示例 使用“银行零售客户流失数据”,选取性别列转换为OneHot编码,输出结果为数组组形式展示,(2,[1],[1.0])表示为总共有2个类别,索引为1的位置V10.5版本电子表格右侧数据集面板空白
(本文档仅供参考) 问题 V10.5版本中,电子表格登录插件之后,右侧数据集面板空白,如下图所示。 图1.png 解决方案 此问题是因为10.5版本中,默认是需要进行新建“模型查询 ”或“SQL查询”进行制作电子表格的,关于电子表格数据来源可查看此wiki:电子表格⬝ 数据来源 如需展示对应资源树的数据集资源,有三点需要注意: 1、V10.5 版本中,旧数据集资源的显示和使用统一通过 License 控制。若是希望在V10.5版本中继续使用旧的数据集,则需更新授权包含旧数据集的 License 文件; 2、在系统运维—>系统选项—>高级设置 中添加"DISABLE_OLD_DATASET_NEW_ENTRY镜像部署如何配置数据库域名映射
(本文仅供参考) 问题现象 知识库用域名配置连接不成功,提示smartbi容器无法解析这个域名。 image2024-8-31_15-13-54.png image2024-8-31_15-32-47.png 方案 需要将域名的地址解析写到容器内,即smartbi的yaml文件需要配置一下数据库域名的解析 hostAliases: - ip: 数据库IP hostnames: - 数据库域名 示例如下,注意要替换成实际的域名解析的IP地址,并且注意层级 image2024-8-31_15-36-6.png数据模型中使用系统函数示例
(本文档仅供参考) 问题 数据模型中的计算度量和计算列要获取用户ID如何使用? 方案 可通过系统函数GetUserID()获取当前用户的ip,在数据模型的计算度量和计算列中,注意用单引号将系统函数括起来 计算度量: image2024-10-14_16-51-55.png 计算列: image2024-10-14_16-54-27.png 仪表盘中使用对应字段效果: image2024-10-14_16-56-58.png 数据模型系统函数数据挖掘-假设检验
概述 通过特征变量与目标变量之间的偏差来检验数据之间的相关性或回归分析中的拟合结果。 输入/输出 输入 一个输入端口,用于接收数据集 输出 一个输出端口,用于输出假设检验结果数据集 参数设置 参数名称 说明 备注 选择特征列 用于选择需要检验的字段列 必填 选择标签列 用于选择做为标签列的字段(必须为数值型) 示例 使用“鸢尾花数据”,选择4个特征列和1个标签列,输出结果如下图: 图片6.png 鼠标点击右键查看分析结果: 图片7.png 以上图知:已挑选的特征列的P值都趋近于0数据挖掘-假设检验
概述 通过特征变量与目标变量之间的偏差来检验数据之间的相关性或回归分析中的拟合结果。 输入/输出 输入 一个输入端口,用于接收数据集 输出 一个输出端口,用于输出假设检验结果数据集 参数设置 参数名称 说明 备注 选择特征列 用于选择需要检验的字段列 必填 选择标签列 用于选择做为标签列的字段(必须为数值型) 示例 使用“鸢尾花数据”,选择4个特征列和1个标签列,输出结果如下图: 图片6.png 鼠标点击右键查看分析结果: 图片7.png 以上图知:已挑选的特征列的P值都趋近于0