第48页,共70页。 显示 697 条结果 (0.023 秒)
数据挖掘-过滤
概述 根据用户需求,通过写SQL语句(片段)的方式,对数据集中指定字段进行条件筛选过滤。 image2020-9-8_9-10-20.png 输入/输出 输入 一个输入端口,用于接收数据集。 输出 一个输出端口,用于输出过滤的结果。 参数设置 设置过滤与映射的参数: image2020-5-21 13:58:29.png 设置说明如下: 参数 说明 过滤器 对数据的指定字段进行过滤。 image2020-5-21 11:42:59.png 示例 1、原先示例数据源的输出结果有150条数据,对其进行过滤交互式仪表盘 ⬝ 使用流程
1 创建流程 liucheng01.png 2 功能介绍 具体功能和相关文档如下所示: 序号 步骤 功能或场景 参考文档 1 选择及处理数据 选择仪表盘的数据来源,根据需求创建分组字段、计算度量等 选择及处理数据 2 创建可视化组件 创建多类型组件来定义仪表盘资源 创建可视化组件 3 分析数据 基于原始业务数据深入分析,比如设置数据排序、占比、时间计算、条件格式等 分析数据 4 交互设计 设置组件之间的筛选、联动、下钻和跳转交互 交互设计 5 样式设置 设置图表样式、组件样式和仪表盘主题样式 样式设置 6 设计仪表盘存储过程预览数据报错:Data Duration
(本文档仅供参考) 问题现象 存储过程数据集点击预览数据集,报错:获取总行数sql错误,Data Duration,而通过参数筛选缩小选择范围,则成功查询。 image2021-4-9_13-59-47.pngimage2021-4-9_14-0-1.png 问题原因 部分数据长度范围超过了数据库表字段设定的长度限制。 解决方案 排查查询的数据是否在数据库表字段的长度范围内,若数据量较大,建议可通过二分法或者添加参数值过滤的方式锁定有问题的数据范围,加大字段长度或更改有问题的数据,确保数据长度不超过字段长度即可解决此问题。多条件参数备选值全选电子表格查询参数过滤问题
(本文仅供参考) 描述: 给模型参数添加全部的备选值,然后在模型处SQL查询执行正常,拖到电子表格处预览参数不能正常筛选,不论是映射参数还是通过系统数据集的方式直接拖取模型字段都是一样。 image2024-5-16_19-28-42.png 模型查询处正常过滤监控到的后台执行SQL: image2024-5-16_19-31-7.png 电子表格过滤异常情况下后台监控的SQL: image2024-5-16_19-32-26.png 解决方案: 多个and or条件,每个and后的条件需要单独括号括起来,防止相互影响。 多条件过滤异常 多个参数sql异常系统监控-日志
该页面用于监控所有会话的服务器端日志 image2021-8-26_14-26-1.png 集群环境下导出指定节点的系统日志: 集群环境下导出指定节点的日志在V10.5.15及以上版本支持。 日志导出是后端导出,前端是否开始监控及过滤操作不影响日志的导出。 (1)在 分析报表 > system > 分析报表 > 操作日志表 中首先根据“操作类型”和“开始结束时间”筛选出用户的 登录 记录。 https://wiki.smartbi.com.cn/download/attachments/44500294/33.png?version=1&modificationDate=1689564936000&api=v2演示平铺勾选面板控件
本例演示创建一个平铺勾选面板参数,并在透视分析中勾选备选值内容进行数据筛选。 实现步骤 1、新建“产品类别_平铺勾选”参数,数据类型选择“字符串”,控件类型选择“平铺勾选面板”,并设置标题宽度、参数宽度等,不勾选列宽自适应。 image2021-8-28_17-11-14.png 2、点击下一步,注意要勾选“允许多选”,参数设置如下图: image2021-8-28_17-16-37.png 3、创建可视化数据集,可使用该参数控件进行数据过滤。 1825.png 由于参数设为了允许多选,所以这里使用了“字段in(参数)”的表达式,在表达式两端加上{[]}是用于当不选参数值时忽略该参数,进行全部查询的意思。具体多维分析-过滤
过滤是指根据用户显示数据的需要将当前数据列进行条件筛选的一类分析方法。 只有列区最内存维度才会有过滤功能。 操作入口: 在列上最内成员上点击更多菜单image2019-11-1 14:57:20.png,在弹出的选项中,选择 过滤 功能。 image2019-11-1 14:57:9.png 总入口:在当前多维分析表格区选中的数据列的列按钮中单击 过滤 按钮,弹出过滤下拉菜单。 定制过滤:在过滤下拉菜单中选择 定制过滤,弹出“自定义过滤”对话框,选择 值过滤 后,自定义过滤条件。TopN过滤和BottomN过滤请参见 TopN分析 和 累计百分比分析 章节。 取消过滤:在过滤下拉菜单中选择 取消过滤。 前/后数据挖掘-TF-IDF
概述 一种统计方法,TF意思是词频,IDF意思是逆文本频率指数,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。 TF-IDF值越高,说明该词越重要。 输入/输出 输入 没有输入端口 输出 一个输出端口,与抽取、变换节点组合使用。 参数设置 参数名称 说明 备注 特征项数 输入的数值n,代表算法最终会筛选出TF-IDF值最高的n个词 必填 示例 图片3.png 效果 使用“垃圾短信识别”数据,选择数据挖掘-卡方特征选择
概述 卡方特征选择与特征选择的功能类似,都是用于筛选特征到算法节点。卡方特征选择是根据卡方检验的数据相关性对特征变量进行排序,然后选择与目标变量相关性较大的特征变量。不同之处是卡方特征选择只设置需要选择的特征数量,然后该节点会根据目标字段列自动选择最相关的特征。 输入/输出 输入 一个输入端口,用于接收前置节点传下来的数据集。 输出 一个输出端口,用于输出接收到的数据集。 参数设置 参数名称 说明 备注 选择特征列 用于设置待选择的特征列(人工选择可能相关的特征列) 必填(特征列中不能含有null) 选择标签列 用于设置Excel融合分析如何通过透视分析进行数据处理
1. 背景 IT人员可以通过业务主题将数据库中的数据进行逻辑建模,便于业务用户理解数据,同时设置好数据访问权限;业务用户基于Smartbi透视分析功能对清单数据进行自定义的数据处理,可从千万清单数据中筛选出Excel所需的汇总数据结果,并生成透视分析结果集。 2. 透视分析的优势 透视分析的结果一般已经比较小了,如果统计性能不够快,可以通过SmartbiMPP做性能加速。 透视分析的结构可以避免SybaseIQ的统计慢的问题。 可以实现动态参数化,比如通过日期过滤,只汇总最近12个月的数据。 具体操作如下图,查看详情; image2020-8-17_16-29-37.png 3. Excel