第87页,共561页。 显示 5,606 条结果 (0.037 秒)
数据挖掘-SQL脚本
概述 SQL脚本支持手动输入SQL语言完成对数据进行处理和查询的任务。 输入/输出 输入 有4个输入端口 输出 只有一个输出端口,用于输出通过服务获取的数据。 参数设置 参数名称 说明 备注 视图名称 显示每个端口对应的表名 表名可修改 SQL脚本 编写SQL脚本的窗口 必填 示例 1) 拖动SQL脚本节点,并连接鸢尾花数据数据源。 image2021-9-23_17-52-4.png 2)更改表名为t0, 编写SQL脚本并点击确定保存. image2021-9-23_18-0-37.png 3实现参数允许为空且为空时查询不到数据
(本文档仅供参考) 问题 希望实现文本框没输入值,既要不报错,还要不输入查询不到数据,而不是获取全部数据 解决方案 注:以下示例以MYSQL为例,其他数据库需要自行调试 select `ProductName` from `products` where case when {[ 参数 is null ]} then 1 = 2 else {[ `ProductName` = 参数 ]} end image2023-11-10_17-52-2.png 实现效果数据挖掘-聚类算法
聚类算法常用于无监督学习问题。例如:客户价值细分:高价值客户,一般客户,低价值客户。 聚类:对大量未知标注的数据集,按数据的内在相似性将数据集划分为多个类别,使类别内的数据相似度较大,而类别间的数据相似度较小。 聚类算法数据挖掘-聚类算法
聚类算法常用于无监督学习问题。例如:客户价值细分:高价值客户,一般客户,低价值客户。 聚类:对大量未知标注的数据集,按数据的内在相似性将数据集划分为多个类别,使类别内的数据相似度较大,而类别间的数据相似度较小。 聚类算法如何连接与使用明道云数据源?
一、概述 在使用明道云做数据分析,需要先部署需要下面两个文件:明道云插件包、明道云节点压缩包。 序号 名称 描述 V10版本最新插件包 1 MingDaoYun.ext 明道云插件包 MingDaoYunV10.5.ext 2 MDYun.zip … 的扩展包以及是否启用,如下图: image2022-3-21_14-15-59.png 如启用,会加载成功,点击可连接数据源界面; 2.2 加载挖掘引擎部署 1.在smartbi平台打开系统运维-数据挖掘配置-上传自定义java扩展包上传MDYun.zip, 提示上传成功即表示明道云节点压缩包部署成功自助仪表盘-线图的数据点个数
(本文档仅供参考) 问题说明 自助仪表盘线图中,发现线图中的小圆点个数并不是根据数据量大小来生成的,有的时候数据量很大,但是圆点个数反而更少,而小数据量时,圆点个数反而更多。 而且也并不是一条数据对应一个圆点,或者一个坐标轴数据对应一个圆点的,请问这个小圆点的个数是怎么来确定的,能否在不影响x轴显示步长的情况下,设置他显示的频度? 解决方案 自助仪表盘的图形<数据点>是根据图形画布的大小以及输出行数,自适应地显示的个数(如下图所示),目前还没有办法去控制数据点的显示个数与频度。 同样的输出行数,在画布较大的情况,此时数据点个数会比画布较小的时候更多的。 image2018-12-3 10:41:5.pngExcel融合分析如何处理超大数据量
1. 背景 一线的业务人员获取Excel明细表,原始数据量动辄几十万上百万条;虽然Excel是一款深受青睐、广泛使用的数据处理工具,但是Excel自身在处理大数据量情况下存在性能问题;并且当大数据量的Excel分析报表展现在web上会占用太多缓存,会容易撑爆内存导致宕机。 基于上述背景,本文将介绍在创建大数据量的Excel融合分析报表过程中,应该采取哪些操作方案,能够有效避免大数据量导致卡顿、提升查询性能。 2. 操作步骤 2.1 数据准备方式 在创建Excel融合分析报表前的数据准备阶段,我们可参考如下两个方式操作: 查询情况 操作要点 效果 单表查询 创建透视分析数据集Excel融合分析如何处理超大数据量
1. 背景 一线的业务人员获取Excel明细表,原始数据量动辄几十万上百万条;虽然Excel是一款深受青睐、广泛使用的数据处理工具,但是Excel自身在处理大数据量情况下存在性能问题;并且当大数据量的Excel分析报表展现在web上会占用太多缓存,会容易撑爆内存导致宕机。 基于上述背景,本文将介绍在创建大数据量的Excel融合分析报表过程中,应该采取哪些操作方案,能够有效避免大数据量导致卡顿、提升查询性能。 2. 操作步骤 2.1 数据准备方式 在创建Excel融合分析报表前的数据准备阶段,我们可参考如下两个方式操作: 查询情况 操作要点 效果 单表查询 创建透视分析数据集存储过程预览数据报错:Data Duration
(本文档仅供参考) 问题现象 存储过程数据集点击预览数据集,报错:获取总行数sql错误,Data Duration,而通过参数筛选缩小选择范围,则成功查询。 image2021-4-9_13-59-47.pngimage2021-4-9_14-0-1.png 问题原因 部分数据长度范围超过了数据库表字段设定的长度限制。 解决方案 排查查询的数据是否在数据库表字段的长度范围内,若数据量较大,建议可通过二分法或者添加参数值过滤的方式锁定有问题的数据范围,加大字段长度或更改有问题的数据,确保数据长度不超过字段长度即可解决此问题。V10.5 License控制旧数据集设置问题
(本文档仅供参考) 问题说明 V10.5 版本中,旧数据集资源的显示和使用统一通过 License 控制。若是希望在V10.5版本中继续使用旧的数据集,则需更新授权包含旧数据集的 License 文件。 注意:因java数据源做出来的数据集都是旧数据集,故本地数据源中java数据源创建入口也受"DISABLE_OLD_DATASET_NEW_ENTRY=false" 配置项控制。 解决方案 若无法新建旧数据集,则可在系统运维>系统选项>高级设置 中添加"DISABLE_OLD_DATASET_NEW_ENTRY=false",表示开启旧数据集创建入口。 如果找不到入口,可以直接搜索【系统选项】,点击进入对应的界面