搜索

Help

第46页,共586页。 显示 5,854 条结果 (0.498 秒)

  1. 数据挖掘-数据清洗V2

    概述 新版本的数据清洗合并了旧版本中的空值处理、值替换、数据清理节点。通过该节点,可以实现以下几点功能: (1)空值替换为均值、最大频数或者用户自定义的值等,实现空值的填充或者过滤; (2)移除字符串中空格、标点符号、字母、数字等不必要的字符,或设置大小写方式。 image2023-2-3_14-52-13.png 输入/输出 输入 一个输入端口,用于接收数据集。 输出 一个输出端口,用于输出数据清洗的结果。 参数设置 设置异常值处理的参数:  image2023-2-3_14-52-53.png 设置说明如下: 参数 说明 选择字段
  2. 数据预警常见问题

    1、数据预警通过钉钉推送到用户,推送失败。且失败日志中原因为“单应用给单人推送重复消息超限,给同一员工一天只能发送一条内容相同的消息通知。” 预警常见问题01.png 解决方案:这是钉钉自身的限制,给用户发送消息时,一天内不能够重复发送内容相同的消息。若数据预警需要通过钉钉推送到用户时,建议消息内容增加 “检测时间”函数,以此来改变每次推送时的消息内容,从而避免触发钉钉的限制。 预警常见问题02.png
  3. 数据模型抽取模式下如何展示实时数据

    (本文档仅供参考) 问题: 数据模型中java查询、存储过程查询等子查询默认会走抽取模式,抽取模式需要定时抽取才会展示新的数据,但是实际数据变化时不规律的,无法定时抽取,如何展示实时数据? 解决方案: 可采用时间参数+按次抽取方式实现,由于每次打开参数默认值不一样从而触发抽取,最终达到展示实时数据效果。 以脚本查询为例,操作步骤: 1、创建时间参数,参数默认值设置为获取当前系统时间,具体到秒 image2024-7-30_17-8-5.png 2、创建脚本查询,查询中需引入时间参数 image2024-7-30_17-11-53.png 3、设置为按次抽取
    FAQ中心七月 30, 2024
  4. 基于数据模型预览数据时字段重复出现

    (此文档仅供参考) 问题现象 基于数据模型进行数据预览时候字段重复出现 如下图: image2024-8-6_9-7-38.png 解决方案: 当前是通过以下方式进行解决: (1)导出后,删除原模型,再导入,可能可以解决 (2)如果原模型没有影响到其他资源,可有复制一个出来,复制出来的是没问题的 (3)如果以上都不行,就需要手动删除一下节点了 当前已通过方法1修复。 注:    其原因是因为资源树上有垃圾数据,关于数据模型层次在资源树上的节点,是根据模型定义中的levels创建的,但当前发现存在以下情况,    仅是根据t_restree 与 tx_augmented_level去做系统检查,可能会有新的脏
    FAQ中心八月 06, 2024
  5. 关系型数据源-Gbase 8A数据连接

    1   概述 Gbase 8A是南大通用公司面向海量数据分析型应用领域,以列存储,压缩和智能索引技术为基础,自主研发的一款高性能数据库产品。具有满足各个数据密集行业日益增大的数据分析、数据挖掘、数据备份和即席查询等需求的能力。并且提供完备的数据存储和数据管理功能。 本文介绍如何在 Smartbi V10.5 中连接 Gbase 8A 数据库。 2  数据连接 2.1 配置信息 驱动程序类 连接字符串 驱动程序存放目录 支持数据库版本 com.gbase.jdbc.Driver jdbc:gbase://<servername>:<port>/<dbName> 产品内置 Gbase 8A
  6. MariaDB 数据连接

    1   概述 MariaDB数据库管理系统是MySQL的一个分支,主要由开源社区在维护,采用GPL授权许可 MariaDB的目的是完全兼容MySQL,包括API和命令行,使之能轻松成为MySQL的代替品。 2  数据连接 2.1 配置信息 驱动程序类 连接字符串 驱动程序存放目录 支持数据库版本 … =GBK&zeroDateTimeBehavior=convertToNull 产品内置 mariadb 5.4 mariadb 5.5 连接字符串主要信息说明:         <servername>:数据库的地址;         <port>:数据库端口;         <database>:数据库名称
  7. 部署数据挖掘-集群

    数据挖掘组件介绍 部署Smartbi 数据挖掘引擎集群需要部署以下组件: 服务名称 简介 备注 数据挖掘-实验引擎 负责接收smartbi 发送实验执行请求。 通过解析实验定义,生成spark 计算任务或python计算任务,分别发送给spark集群或python集群。 本身并不承担计算任务,只负责计算任务的调度跟分发。 数据挖掘-服务引擎 提供模型预测服务给第三放系统调用 Spark 分布式计算平台,主要承担实验引擎发送过来的计算任务,其中Worker实例可以横向扩展 可选 Zookeeper 用于实现数据挖掘实验引擎和数据挖掘服务引擎的高
  8. 关系型数据源-Hadoop-hive数据连接

    1   概述  Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。  Hive是建立在 Hadoop 上的数据仓库基础构架。它提供了一系列的工具,可以用来进行数据提取转化加载(ETL),这是一种可以存储、查询和分析存储在 Hadoop 中的大规模数据的机制。 本文介绍如何在smartbi V9.5以上版本中连接Hadoop-hive数据库。 2  数据连接 2.1 配置信息 驱动程序类 连接字符串 驱动程序存放目录 支持数据库版本
  9. 关系型数据源-Gbase 8S_V8.8 数据连接

    1   概述 GBase 8s是具有完全自主知识产权的安全数据库产品,全面达到国标第三级的安全模型和安全要求。产品采用国产密码算法采用硬件加密技术,提供包括数据存储加密、数据传输加密、安全标签、强制访问控制、三权分立、安全审计等在内的主要安全功能。 本文介绍如何在smartbi V10.5以上版本中连接 Gbase 8S V8.8 数据库。 2  数据连接 2.1 配置信息 驱动程序类 连接字符串 驱动程序存放目录 com.informix.jdbc.IfxDriver jdbc:informix-sqli://<host>:9088/<database>: INFORMIXSERVER
  10. 部署数据挖掘-单机

    数据挖掘组件介绍 部署Smartbi 数据挖掘引擎单机需要部署以下组件: 服务名称 简介 备注 数据挖掘-实验引擎 负责接收smartbi 发送实验执行请求。 通过解析实验定义,生成spark 计算任务或python计算任务,分别发送给spark集群或python集群。 本身不承担计算任务,只负责计算任务的调度跟分发。 数据挖掘-服务引擎 提供模型预测服务给第三放系统调用 Spark 分布式计算平台,主要承担实验引擎发送过来的计算任务,其中Worker实例可以横向扩展 可选 Hadoop 分布式系统基础平台,主要存储计算任务的中间结果数据