第79页,共563页。 显示 5,625 条结果 (0.213 秒)
数据挖掘-异常值处理
概述 异常值检测和处理是数据挖掘中常用的数据处理方法,添加异常值检测节点,满足数据处理、欺诈行为检测等应用场景。 用户可以针对异常值选择相应的填充策略进行异常值的替换。 image2020-7-3 16:58:36.png 输入/输出 输入 一个输入端口,用于接收数据集 … :1.png 检测方法 四分位距:将数据按数值从小到大分成四等分,分隔点为Q1、Q2、Q3,四分位距则为上四分位值Q3与下四分位值Q1两者之差。 标准差法:假定数据是服从正态分布的,计算数据的标准差,对偏离标准差的数据进行处理如用均值、上下界数值、指定值替换。 自定义检测:可以自定义上下界,对异常值进行样式 - 电子表格设置数据条为左对齐,预览之后非0数值并没有左对齐
(本文档仅供参考) 问题说明 在excel里面预览是正常的,所有数据都是居左显示 image2019-10-8 18:26:57.png 但是发布预览之后,非0数值并没有左对齐 image2019-10-8 18:28:56.png 解决方案 该问题是第三方插件的bug,可以通过宏规避 如果是静态数据,可直接通过以下客户端宏来进行规避: image2019-10-9 9:39:53.png ClientSide spreadsheetReport onRender function main(spreadsheetReport, isAjaxRefreshCallback数据挖掘-行过滤
概述 V10.5.12版本中新增了行过滤节点,该节点合并了旧版本的行选择和过滤节点,能够根据不同的筛选或者删除条件,选择对应的行。该节点提供了两种类型的筛选器。基本筛选器可以根据用户需求设置不同的筛选或者删除条件,选择不同数量的行;自定义筛选器通过写SQL语句(片段),对数据按照过滤表达式进行筛选。 image2023-2-3_16-0-41.png 输入/输出 输入 一个输入端口,用于接收数据集。 输出 一个输出端口,用于输出行过滤的结果。 参数设置 设置行过滤的参数: image2023-2-3_15-10-0.png 设置说明如下: 参数数据挖掘-行过滤
概述 V10.5.12版本中新增了行过滤节点,该节点合并了旧版本的行选择和过滤节点,能够根据不同的筛选或者删除条件,选择对应的行。该节点提供了两种类型的筛选器。基本筛选器可以根据用户需求设置不同的筛选或者删除条件,选择不同数量的行;自定义筛选器通过写SQL语句(片段),对数据按照过滤表达式进行筛选。 image2023-2-3_16-0-41.png 输入/输出 输入 一个输入端口,用于接收数据集。 输出 一个输出端口,用于输出行过滤的结果。 参数设置 设置行过滤的参数: image2023-2-3_15-10-0.png 设置说明如下: 参数自助数据集-筛选器
筛选器作用等同于过滤或者参数,用于查询出符合条件的数据结果。 自助数据集的筛选器用于:当数据集数据量比较大时,可添加筛选器,对数据集的数据进行筛选过滤,以便用户能够快速获取其所需的数据。 自助数据集中通过筛选器设置的多个条件表达式之间只能是“and”关系。 操作步骤 1.新建一个自助数据集,在右上方有筛选器入口。 筛选器入口.png 2.点击 "+" 后会弹出编辑界面。 image2018-9-27 10:16:28.png 编辑界面设置项说明如下: 选项 描述 可选列 显示当前数据集中包含的所有字段。 条件 显示逻辑运算符,比如“=、>、<、<>、LIKE、NOT LIKE数据源管理时,sql server数据库中的表的别名(注释)为什么同步不过来
(本文档仅供参考) 问题 mysql ,oracle的数据库表字段注释中有内容,smartbi通过数据库管理将表添加进来时能获取到并生成字段的别名,客户这边用的sql server ,添加的注释并不能获取到,这是什么原因呢? 解决方案 SQL server 数据库自身是没有注释的概念,只是通过数据库自身定义的一个属性来作为注释,但对于jdbc驱动来说,并不具备注释调用的接口,若是需要对此数据库提获取到作为注释的属性,需单独定制扩展包进行处理。 无法获取注释 注释获取不了数据模型多表建模实现先对维表限制条件在进行表关联
(本文档仅供参考) 期望在数据模型多表建模时,实现先在子查询中过滤数据,在进行多表关联。 生成的sql简化后类似于:select xxx from A left join (select xxx from B where xxx=xxx) on A.xxx =B.xxx 场景: 先取顾客表数据日期为前一天的数据,取到数据后再与订单表做建模关联。这样就不建议直接在数据模型中引用数据源表了,建议通过SQL查询进行提前过滤,或者通过可视化SQL查询进行过滤。 image2024-11-21_16-21-8.png 以下步骤介绍了通过可视化SQL查询实现对维表限制条件在进行表关联 步骤一:在数据模型中新建可视化连接SQL Server数据库命名实例
新建关系数据源连接时,可以直接选择“MS SQL Server”类型数据库,连接 SQL Server 数据库默认实例。但是对于 SQL Server 的命名实例,就连接不上了,请参照如下方法进行设置。 新建关系数据源 创建入口:在smartbi中选择 数据连接 > 关系数据库 > MS SQL Server … Server命名实例又该如何连接呢?“数据库类型”选择“MSSQL”,“服务器地址”设置为IP、端口,再加上 instanceName。详细配置如下图所示。 image2019-11-18 16:24:57.png 如果“测试连接”过程中,总是提示“连接池初始化失败”,“显示栈信息”中说明:CausedBI笔记之---增量方式处理多维数据集
本文将模拟一个数据仓库系统,其中有用户数据,产品数据以及订单数据。根据这些数据结构建立多维数据集,并且以增量更新的方式对其进行处理。 之所以强调增量的方式,是考虑到事实表中数据的增长,假设以后增长到几十亿,全量处理就变得很不现实,所以方案中着重演示以增量方式处理多维数据集的方案。 增量处理多维数据集的关键是要将事实数据分为两部分处理,一个是增量事实表,一个是历史事实表,多维数据集第一次处理历史事实表中的数据,以后每次周期性的处理都是处理增量表中的数据。 本文中提及的SQLServer和Visual Studio都是2008版本,2005版本同样也适用。 数据假设:一张用户表,一张产品表,一张订单表,订单里记录的是谁买了什么电子表格⬝ 数据集面板
电子表格中,新增报表数据集: 数据集面板用于新建、展示电子表格可用的资源,数据来源包括报表数据集、系统数据集: image2022-2-19_18-19-17.png 注意: 1、报表数据集相关定义及说明,详见:电子表格⬝ 数据来源。 2、“系统数据集”和“报表数据集”两种类型的数据集之间不能混合使用。如图用户将报表数据集字段拖拽到报表设计区后,不能再修改数据来源。 image2022-2-20_21-58-57.png 如果用户想要修改数据来源,则需要重新建一个工作簿。 3、用户可通过系统设置项控制是否开启或关闭Excel“系统数据集”入口,详情请查看 设置电子表格excel插件显示旧资源数据集