第113页,共595页。 显示 5,949 条结果 (0.067 秒)
数据模型-界面介绍
数据模型属于数据准备模块,具体系统中使用操作如下: 功能入口 打开数据模型编辑界面有如下三个入口: 入口一:左侧资源树,数据集目录节点右键菜单或更多菜单,选择 新建 > 数据模型,进入数据模型编辑页面。 入口二:顶部 新建 按钮,在下拉菜单选择 数据模型,进入数据模型编辑页面; 入口三:数据准备模块主界面,选择 数据模型 快捷入口。 image2021-8-10_10-54-6.png 数据模型编辑界面 数据模型编辑面板,大致分为以下五个区域,如下图: image2022-2-3_17-25-37.png image2022-8-5_16-9-24.png私有查询分页区:以TAB页的方式显示私有数据挖掘-组合查询
概述 组合查询是通过直接从输入的数据集中拖拽字段,并且支持对字段进行聚合计算。 使用组合查询节点前提条件: 在工作流设计界面,缓存设置项中,选缓存 image2021-8-6_13-42-37.png 首次使用时,请移步至数据挖掘配置中配置Tuna数据源 image2023-5-10_19-43-50.png image2021-7-9_15-0-52.png 输入/输出 输入 一个输入端口,用于接收数据集。 输出 一个输出端口,用于输出查询后的结果。 参数设置 组合查询的参数面板,用于设置对前一节点返回的数据集中,选择字段进行聚合迁移资源时更改数据源以后存储过程数据集无法打开并报错
(本文档仅供参考) 问题说明 迁移资源时更改数据源以后存储过程数据集无法打开并报错,数据集运行时错误:引用的字段不存在。 image2020-6-5 10:38:15.png 问题原因 此问题是由于目前Smartbi在切换数据源时sqlserver是不支持加载schame的,以致更换数据源时没有指定schame。 image2020-6-5 10:46:18.png 解决方案 在更改数据源时手动输入schame。 image2020-6-5 10:47:49.png数据模型-计算应用
1、占比计算 可查看仪表盘:占比。 2、排名计算 可查看仪表盘:排名。 3、时间计算 可查看仪表盘:时间计算。 1 概述 数据模型支持在自助仪表盘的计算应用,主要包含:占比计算、排名计算和时间计算。 数据模型在自助仪表盘中使用计算应用的前提是:行、列字段必须含有时间层次下的时间字段。 在了解计算内容前 … 中所占的比重,常用百分比表示。 自助仪表盘中主要内置了如下两种占比计算: 全局占比:指当前对象数据在所有数据总和中所占的比重,其计算公式为:(单元格数据/全局数据总和)%。 组内占比:指当前对象数据在其组内数据和中所占的比重,其计算公式为:(单元格数据/组内数据总和)%。 在自助仪表盘中,进行占比计算操作⬝ 卸载数据挖掘
firewall-cmd --reload ③删除安装目录及hadoop数据目录即可完成卸载 3、卸载数据挖掘服务 3.1. Linux部署 ①停止数据挖掘实验引擎和数据挖掘实验服务 进入数据挖掘安装目录,执行脚本停止数据挖掘服务,参考如下: cd /opt/smartbi-mining-engine-bin/engine/sbin ./experiment-daemon.sh stop ./service-daemon.sh stop ②如果部署数据挖掘服务时开启了防火墙端口,则需要关闭对应的端口,参考如下: firewall-cmd --zone=public --remove-port=8899/tcp卸载数据挖掘
firewall-cmd --reload ③删除安装目录及hadoop数据目录即可完成卸载 3、卸载数据挖掘服务 3.1. Linux部署 ①停止数据挖掘实验引擎和数据挖掘实验服务 进入数据挖掘安装目录,执行脚本停止数据挖掘服务,参考如下: cd /opt/smartbi-mining-engine-bin/engine/sbin ./experiment-daemon.sh stop ./service-daemon.sh stop ②如果部署数据挖掘服务时开启了防火墙端口,则需要关闭对应的端口,参考如下: firewall-cmd --zone=public --remove-port=8899/tcp数据挖掘-自动特征组合
等待),特征组合就是假设性别特征是女,时间维度双11,会发现这两个特征组合起来一定是非常强对用户预测是否买东西的组合特征。女性在双十一购买商品的概率非常高,这就是交叉后的非线性的组合特征,非线性的组合特征对数据挖掘非常关键。 输入/输出 输入 一个输入端口,用于接收前置节点传下来的数据集。 输出 一个输出端口,用于输出特征组合过后的数据集。 参数设置 参数名称 说明 备注 选择列 选择需要进行组合的特征列,必须是数值列。 必填 选择标签列 用于选择作为标签列的字段 类别数需小于100 选择方式 用于[下载源数据信息]-ETL自动化过程下载源数据信息支持全选所有表
概述 在新建ETL自动化过程 https://wiki.smartbi.com.cn/pages/viewpage.action?pageId=111759684中,进入下载源数据信息窗口,在选择来源数据源后,加入一个全选按钮,用于全选所有表。 功能配置入口 点击数据准备,选择ETL自动化,点击新建,打开ETL自动化,入口如下图所示。 image2023-12-11_13-58-28.png 点击下载源数据信息 image2023-12-11_14-2-38.png 操作演示 整个操作流程如下图所示,选择一个来源数据源,选择一个目标数据源,点击勾选全选按钮,便可以选择全部表Excel融合分析线上线下数据混合时数据量大,线下数据很卡该怎么办?
1. 背景 数据量太大,底层宽表超过1亿,没法加载到Excel中分析 PC端计算慢:Excel计算公式复杂,前端Excel打开至少需要20分钟 2. 解决方案 数据准备: 通过 透视分析 + SmartbiMpp 将数据初步汇总,1亿行 <= 30万 报表运算:支持个人Excel端运算,也支持在服务器(集群)运算 定时报表:后端自动刷出报表,导出不含公式的Excel文件 image2020-8-27_9-59-53.png 你还可以参考其他处理方式Excel融合分析线上线下数据混合时数据量大,线下数据很卡该怎么办?
1. 背景 数据量太大,底层宽表超过1亿,没法加载到Excel中分析 PC端计算慢:Excel计算公式复杂,前端Excel打开至少需要20分钟 2. 解决方案 数据准备: 通过 透视分析 + SmartbiMpp 将数据初步汇总,1亿行 <= 30万 报表运算:支持个人Excel端运算,也支持在服务器(集群)运算 定时报表:后端自动刷出报表,导出不含公式的Excel文件 image2020-8-27_9-59-53.png 你还可以参考其他处理方式