搜索

Help

第137页,共618页。 显示 6,172 条结果 (0.141 秒)

  1. 数据挖掘-FP-Growth

           生活中的数据本身包含着各种联系,大数据的出现给我们带来了一种新的思维方式,那就是跳出先因后果的思维方式,用大量的数据统计结果去倒推原因,找到无关因素间的隐蔽联系,例如众人皆知的营销案例 "啤酒和尿布”。本文将介绍目前业界经典关联规则算法 FP-Growth,借助分析购物篮中商品数据,找出商品之间的关联关系,帮助用户挖掘出数据最大的价值,获得更大的经营收益。 FP-Growth 简介 FP-Growth(Frequent Pattern Growth)作为一种经典的关联规则算法,可以高效自动地从数据中挖掘出频繁集合,进而挖掘出潜在的关联规则,这些在企业营销决策的制定过程中具有重要的参考价值。另外,FP-Growth
  2. 5、测试数据挖掘及其组件

    本节介绍smartbi连接数据挖掘、Spark、Hadoop、Python以及测试服务是否正常运行。 单机部署数据挖掘组件环境如下: 服务器IP 主机名 组件实例 部署目录 10.10.204.248 10-10-204-248 数据挖掘 /data 10.10.204.249 10-10-204-249 Spark,Hadoop /data 10.10.204.250 10-10-204-250 Python /data 请根据实际部署环境替换相关的配置信息。 1. 配置连接信息 配置数据挖掘连接信息前,请确认数据挖掘已正常部署和启动。部署文档参考:部署数据挖掘
  3. 数据挖掘-异常值处理

    概述 异常值检测和处理是数据挖掘中常用的数据处理方法,添加异常值检测节点,满足数据处理、欺诈行为检测等应用场景。 用户可以针对异常值选择相应的填充策略进行异常值的替换。 image2020-7-3 16:58:36.png 输入/输出 输入 一个输入端口,用于接收数据集 … :1.png 检测方法 四分位距:将数据按数值从小到大分成四等分,分隔点为Q1、Q2、Q3,四分位距则为上四分位值Q3与下四分位值Q1两者之差。 标准差法:假定数据是服从正态分布的,计算数据的标准差,对偏离标准差的数据进行处理如用均值、上下界数值、指定值替换。 自定义检测:可以自定义上下界,对异常值进行
  4. 数据挖掘-异常值处理

    概述 异常值检测和处理是数据挖掘中常用的数据处理方法,添加异常值检测节点,满足数据处理、欺诈行为检测等应用场景。 用户可以针对异常值选择相应的填充策略进行异常值的替换。 image2020-7-3 16:58:36.png 输入/输出 输入 一个输入端口,用于接收数据集 … :1.png 检测方法 四分位距:将数据按数值从小到大分成四等分,分隔点为Q1、Q2、Q3,四分位距则为上四分位值Q3与下四分位值Q1两者之差。 标准差法:假定数据是服从正态分布的,计算数据的标准差,对偏离标准差的数据进行处理如用均值、上下界数值、指定值替换。 自定义检测:可以自定义上下界,对异常值进行
  5. 数据挖掘-行过滤

    概述 V10.5.12版本中新增了行过滤节点,该节点合并了旧版本的行选择和过滤节点,能够根据不同的筛选或者删除条件,选择对应的行。该节点提供了两种类型的筛选器。基本筛选器可以根据用户需求设置不同的筛选或者删除条件,选择不同数量的行;自定义筛选器通过写SQL语句(片段),对数据按照过滤表达式进行筛选。 image2023-2-3_16-0-41.png 输入/输出 输入 一个输入端口,用于接收数据集。 输出 一个输出端口,用于输出行过滤的结果。 参数设置 设置行过滤的参数: image2023-2-3_15-10-0.png 设置说明如下: 参数
  6. 数据挖掘-行过滤

    概述 V10.5.12版本中新增了行过滤节点,该节点合并了旧版本的行选择和过滤节点,能够根据不同的筛选或者删除条件,选择对应的行。该节点提供了两种类型的筛选器。基本筛选器可以根据用户需求设置不同的筛选或者删除条件,选择不同数量的行;自定义筛选器通过写SQL语句(片段),对数据按照过滤表达式进行筛选。 image2023-2-3_16-0-41.png 输入/输出 输入 一个输入端口,用于接收数据集。 输出 一个输出端口,用于输出行过滤的结果。 参数设置 设置行过滤的参数: image2023-2-3_15-10-0.png 设置说明如下: 参数
  7. 水球图目标值数据格式说明

    (该文档仅供参考) 问题描述: 分别给水球图指标值和目标值设置数据格式,仅指标值发生了变化,目标值字段未发生变化 水球图目标值数据格式_20240605090537.png 原因说明: 水球图的目标值是需要在前端经过表达式计算的,计算时只能使用真实值,而目前产品的数据格式都是后端生成的,前端是没办法直接应用数据格式; 处理方案: 通过宏的方式修改目标值数据格式。宏示例,以下示例仅供参考: 宏模块水球图目标值_20240704154454.png 代码内容如下: /* 效果:修改目标值数据格式 类型:ClientSide 对象:水球图 事件:onAfterRender */ function main
    FAQ中心七月 04, 2024
  8. 5、测试数据挖掘集群

    本节介绍smartbi连接数据挖掘执行引擎集群、服务引擎集群、Spark、Hadoop、Python以及测试服务是否正常运行。 集群部署数据挖掘组件环境如下: 服务器IP 主机名 组件实例 部署目录 10.10.35.64 10-10-35-64 数据挖掘-1,Zookeeper-1,Python-1 /data 10.10.35.65 10-10-35-65 数据挖掘-2,Spark-1,Hadoop-1 /data 10.10.35.66 10-10-35-66 Spark-2,Zookeeper-2,Hadoop-2 /data 10.10.35.67
    Smartbi Insight V10帮助中心十一月 02, 2023
  9. excel导入模板通过proxy代理批量导入数据报错问题

    (本文档仅供参考) 问题说明         proxy代理批量导入数据报错,excel表里条数少的话可以,条数多了就报未知的错误(如下图),但是单节点访问批量导入没有问题。 image2023-12-29_17-52-34.png 解决方案         需要在部署proxy的Tomcat(Tomcat/conf/server.xml)配置文件里添加 maxPostSize="-1" (如下图),因为单节点smartbi部署的Tomcat配置文件里添加了 maxPostSize="-1",所以单节点访问批量导入没有问题。         image2023-12-29_17-56-27.png
    FAQ中心六月 24, 2025
  10. 数据模型-计算度量引擎隐藏字段,新建计算度量为空

    (本文档仅供参考) 问题说明 数据模型中新建计算度量中,如果被引用的字段设置了在报表中隐藏,则该计算度量在预览时返回为空: image2024-8-27_9-31-0.png image2024-8-27_9-31-10.png 解决方案: 用于控制计算度量的表达式是否能使用报表隐藏的字段。设置为true时,计算度量表达式能使用这些报表中隐藏字段;设置为false 时,则不支持 image2024-8-27_9-32-35.png 计算度量为空
    FAQ中心六月 24, 2025