第5页,共561页。 显示 5,602 条结果 (0.039 秒)
部署Smartbi数据挖掘/SmartbiETL集群
配置数据挖掘连接地址后,需重启Smartbi,数据挖掘地址会自动转换为数据挖掘服务器的主机名。 … 数据挖掘组件介绍 部署Smartbi 数据挖掘引擎集群需要部署以下组件: 服务名称 简介 数据挖掘-执行引擎 负责接收Smartbi 发送执行请求。 通过解析执行定义,生成spark 计算任务或python计算任务,分别发送给计算节点。 本身并不承担计算任务,只负责计算任务的调度跟分发数据挖掘-数据的输入和输出
、Java数据集、多维数据集。 编辑已选数据集 用于编辑选择的数据集,单击按钮后,会跳转到指定数据集的编辑界面。 数据更新设置 用于设置数据集是否需要重新抽取:“更新抽取数据”表示需要重新抽取;“使用已抽取数据”表示不需要重新抽取。 数据查询 概述 数据查询是指将选择的数据查询转换成二维宽表 … 在数据挖掘的流程中,数据的输入和输出也是必不可少的。 因为需要导入数据才可以进行后续的数据预处理、分析、建模等;以及将最后的结果数据,导出保存在指定的目标库。 所以Smartbi分别提供数据源和目标源节点,满足数据的输入和输出。 数据源 Smartbi提供了几种数据源用于数据输入,分别是文本数据源、Kafka回写 - 回写报表绑定多选参数回写参数的真实值到数据库后如何转为显示值
(本文档仅供参考) 问题 回写报表绑定多选参数回写参数的真实值到数据库后如何转为显示值 解决办法 增加辅助列把多选的真实值对应的显示值也回写的数据库,然后再通过转换规则转换成显示值。 大致步骤见下图: 1、使用辅助列通过公式获取显示值,并把对应的显示值回写的指定字段 image2024-11-15_13-43-8.png 2、创建转换规则 image2024-11-15_13-43-19.png 3、把转换规则应用到数据集上,并且数据集需设置禁止缓存。 image2024-11-15_13-43-34.png 注:若禁止缓存后显示值无法立即更新,需手动清空系统缓存才更新,则可以更新数据挖掘-行转列/列转行
概述 将数据表中的行转换成列或将列转换成行。 行转列 {html}<div style="border-bottom: 0.5px solid #dfe1e5;color:#2D5C8C;padding-bottom: 0.5px;font-size: 24px; height: 5px;"> </div>{html} 概述 行转列是用于实现将数据结果的行转换成列。 image2020-6-1 17:57:59.png 输入/输出 输入 一个输入端口,用于接收数据集。 输出 一个输出端口,用于输出行转列的结果。 参数设置 设置行转列的参数Smartbi数据挖掘引擎/SmartbiETL安装前准备
会报错, 主机名不能以数字开头,且不能含有下划线, Smartbi配置数据挖掘连接地址后需重启Smartbi,数据挖掘地址会自动转换为数据挖掘服务器的主机名。 … 数据挖掘组件介绍 部署Smartbi 数据挖掘引擎单机需要部署以下组件: 服务名称 简介 备注 数据挖掘-实验引擎 负责接收smartbi 发送实验执行请求。 数据挖掘-服务引擎 提供模型预测服务给第三方系统调用 Python执行节点 python自助ETL-数据查询
1. 概述 数据查询,是指将选择的Smartbi“数据查询”转换成二维宽表,供后续节点使用。 “数据查询”节点的部分查询类型执行依赖于高速缓存库,如果高速缓存库连接信息未正常配置,该节点无法正常执行。 高速缓存库配置的 url 地址建议使用 ip 方式连接,不推荐使用域名的方式连接。 必选依赖“高速缓存库”的节点(见下图红色框标记):存储过程查询、生成日期表、java查询,脚本查询; 不依赖“高速缓存库”的节点(见下图蓝色框标记):“sql查询”,“可视化sql查询”,“模型明细查询”,“模型汇总查询”;其中前面2个(“sql查询”,“可视化sql查询”),如果sql依赖的原始数据库ETL不支持,则还是会依赖“高速缓存库数据挖掘-OneHot编码
用于设置在原字段名后追加后缀生成新的列,默认后缀为:OneHot; 该节点与抽取、变换节点组合使用; image2020-9-8_9-48-8.png 非法数据处理策略 选择对非法数据进行处理的策略,非法数据指空值或未进模型的类别值。 自动过滤:在转换时,对在抽取时未出现的类别或空值进行删除; 特殊编码:在转换时,对在抽取时未出现的类别以一种特殊编码进行转换; 非法检测:在转换时,对在抽取时未出现的类别进行报错提示。 示例 使用“银行零售客户流失数据”,选取性别列转换为OneHot编码,输出结果为数组组形式展示,(2,[1],[1.0])表示为总共有2个类别,索引为1的位置组合分析数据类型变更生效问题
(本文档仅供参考) 问题说明 可视化查询中有一个字段(指标值_数值)设置为整型,变更为系统默认的浮点型后,显示的实际数值还是整型,只是在小数点后加了两位小数00,为什么没生效呢? 1、指标值_数值 字段数据类型设置为整型时预览结果: 0.png 1.jpg2.png 2、数据类型改为浮点型后预览结果: 3.png 4.jpg5.png 解决方案 问题原因:是由于在业务主题中设置了【指标值_数值】的表达式为:ROUND(指标值),使用该函数时未指定小数位数,则默认四舍五入后保留的小数位为0,因此实际该数据在业务主题中已被转换为了整型,后续可视化查询再引用时,数据格式设置为浮点型,小数点后都将Excel数据导入能导入带公式的Excel文件吗
(本文档仅供参考) 问题描述: excel模板导入的时候 有一列是公式计算的值 可以导入到数据库里面吗?例如:vlookup函 image2020-12-29_13-52-33.png 解决方案: 目前不支持存在公式的单元格Excel数据导入。建议转换成值之后,再进行导入。或者考虑通过数据处理类的方式,导入时转换为值再进行导入。 数据处理类处理方式:需结合实际应用场景自行开发写数据处理类,对于数据处理类调用包逻辑可参考wiki文档:https://history.wiki.smartbi.com.cn/pages/viewpage.action部署数据挖掘-集群
/hosts文件中, 数据挖掘组件之间的通信会使用到主机名,如果未配置主机名和地址映射,数据挖掘在运行过程中会报错, Smartbi配置数据挖掘连接地址后,需重启Smartbi,数据挖掘地址会自动转换为数据挖掘服务器的主机名。 … 数据挖掘组件介绍 部署Smartbi 数据挖掘引擎集群需要部署以下组件: 服务名称 简介 备注 数据挖掘-实验引擎 负责接收smartbi 发送实验执行请求。 通过解析实验定义,生成spark 计算任务或python计算任务,分别发送给spark集群或python集群。 本身并不