搜索

Help

第12页,共561页。 显示 5,602 条结果 (0.049 秒)

  1. 数据模型-连接模式

    连接模式类型 数据模型的数据连接模式有两种: 直连:连接到业务库,直接从业务库中取数。 抽取:连接到高速缓存库,从缓存库中取数;抽取模式可以保证秒级获取大级别量的数据结果,提高系统性能。 连接模式选择入口 在数据模型的“表关系区”右上角含有连接模式切换键:连接模式的选中状态以蓝底显示。 image2022-2-5_15-36-2.png 连接模式选择原则 类型 原则 直连 数据模型中的数据源表、SQL查询、即席查询,若来源于相同的数据源,则可以选择直连模式; 数据模型中仅含SQL查询,当点击保存后,若检测到连接的数据库允许该SQL查询作为子查询,则允许直连模式; 抽取
  2. 数据挖掘 – 相似集计算(LSH)

    该功能为V10.5版本功能。 概述 使用训练好的LSH模型,对两份数据中的向量进行相似度匹配,把相似度距离低于预设阈值的组合输出到结果。 输入/输出 输入 三个输入端口,输入1接收训练好的LSH模型,输入2和3接收要进行匹配的数据。 输出 一个输出端口,用于输出匹配后的结果。 参数设置 参数名称 说明 备注 相似阈值 设置相似度距离阈值 距离低于阈值的组合才会被输出 示例 相似集1.png 效果 分别接入LSH模型,数据1和数据2,其中数据1和数据2都已使用词向量模型对其文本进行转换。把相似阈值设为0.45,输出
  3. 数据挖掘 – 相似集计算(LSH)

    该功能为V10.5版本功能。 概述 使用训练好的LSH模型,对两份数据中的向量进行相似度匹配,把相似度距离低于预设阈值的组合输出到结果。 输入/输出 输入 三个输入端口,输入1接收训练好的LSH模型,输入2和3接收要进行匹配的数据。 输出 一个输出端口,用于输出匹配后的结果。 参数设置 参数名称 说明 备注 相似阈值 设置相似度距离阈值 距离低于阈值的组合才会被输出 示例 相似集1.png 效果 分别接入LSH模型,数据1和数据2,其中数据1和数据2都已使用词向量模型对其文本进行转换。把相似阈值设为0.45,输出
  4. 数据挖掘-决策树

    节点所代表的类别即是当前测试样本的预测类别。 优势:可直接查看决策树分析的可视化效果,如下图: 图片21.png 示例 使用“糖尿病预测”案例数据,预测是否有糖尿病。 image2020-6-4 16:59:46.png 特征转换是为了将各变量中的类别型变量变换成数值型变量,类别型无法进入模型,转换后方便算法模型学习; 参数设置 决策树的参数如下: 参数名称 值 说明 自动调参设置 系统默认的各项参数值范围。 必须结合“启用自动调参”功能使用。系统将对设置指定或范围内的参数值循环调参,匹配出最优的组合。详情请参考  。 启用自动调参 勾选该项
  5. 数据挖掘-决策树

    节点所代表的类别即是当前测试样本的预测类别。 优势:可直接查看决策树分析的可视化效果,如下图: 图片21.png 示例 使用“糖尿病预测”案例数据,预测是否有糖尿病。 image2020-6-4 16:59:46.png 特征转换是为了将各变量中的类别型变量变换成数值型变量,类别型无法进入模型,转换后方便算法模型学习; 参数设置 决策树的参数如下: 参数名称 值 说明 自动调参设置 系统默认的各项参数值范围。 必须结合“启用自动调参”功能使用。系统将对设置指定或范围内的参数值循环调参,匹配出最优的组合。详情请参考  。 启用自动调参 勾选该项
  6. 计算度量-根据日期参数获取“前日/上月/去年同期”数据

    (本文档仅供参考) 问题描述 在数据模型中创建日期参数,根据日期参数值(默认2021-03-05)获取 ①前日数据 ②上月数据(系统默认的前期数据是上月整月数据,需要获取2021-02-01至2021-02-05的汇总值 ③去年数据(系统默认的同期数据是去年全年数据,需要获取2020-01-01至2021-03-05的汇总值 解决方案 1、新建时间层次维度 image2023-7-4_9-56-26.png 2、新建日期参数并设定默认值 image2023-7-4_10-11-27.png 3、新建度量“前日数据”并验证 image2023-7-4_10-39-29.png
    FAQ中心昨天4:24 下午
  7. Smartbi V10.5.12-数据准备

    数据模型以及交互式仪表盘中轻松创建计算度量。 功能介绍 (1)在数据模型支持创建计算度量,支持四则运算、时间计算、文本转换、命名集集合等。 (2)仪表盘支持创建私有计算度量。(只对当前报表生效,不会存在数据模型中)。 例如,查看各个区域、省份的销售额、前期值、同期值: 向导新特性2 (1).gif … /image2023-1-14_17-20-0.png?version=1&modificationDate=1673688000000&api=v2 +【ETL】增加日期时间节点 背景介绍 用户在录入日期类型数据时,经常会遇到日期格式不统一的问题。 功能简介 新版本为了更方便用户统一日期时间格式,提供了日期类型字符转换功能
  8. 命名集-使用命名集获取组内排名第一数据

    (本文档仅供参考) 问题描述 使用数据模型处理数据时,期望实现获取组内排名第一的数据。 例如下图示例数据,期望获取在【发货区域】、【省份】维度下,【shipvia】值最大的数据。 image2023-11-27_15-7-57.png 解决方案 使用数据模型【自定义命名集】实现此效果。 step 1:在数据模型界面【新建命名集】,创建方式选择【函数】。 image2023-11-27_15-13-9.png step 2:参考下图编写函数表达式,层次结构选择【发货区域】,点击确定并保存数据模型。 (注意函数中引用的【发货区域】和【省份】,为字段列表中【发货区域】和【省份】展开后的对象
    FAQ中心昨天5:41 下午
  9. 使用group_concat函数后数据乱码

    (本文档仅供参考) 问题说明 在数据模型执行sql查询,走的是sql引擎,执行出来的使用了group_concat函数的输出字段出来的结果是乱码 image2024-9-6_14-45-17.png 在数据库直接查询显示的是正常中文 image2024-9-6_14-46-19.png 解决方案 group_concat的结果不一定是字符串,可能是长文本,在SQL查询里面将group_concat结果类型转换成varchar。
    FAQ中心九月 06, 2024
  10. 数据挖掘-RFM

    概述 通过对选择的特征列按照阈值进行二分(可按均值、指定值、中值),将客户数据划分为不同的客群。 输入/输出 输入 一个输入端口,用于接收前置节点传下来的数据集。 输出 一个输出端口,用于输出接收到的数据集。 参数设置 参数名称 说明 备注 选择特征列 可选列:选择需要进行划分的字段,仅可选数值型字段; 划分方法:可按均值、中值和指定值进行二分; 指定值:当划分方法选择指定值时,用于设置划分的阈值; 必填 示例 使用“航空公司客户价值分析”数据,划分结果生成两个标签列BinaryClass和RFMClass