搜索

Help

第88页,共579页。 显示 5,785 条结果 (0.125 秒)

  1. 数据挖掘-采样

    采样就是按照某种规则从数据集中挑选样本数据。 在Smartbi中支持五种类型的采样:随机采样、加权采样、分层采样、下采样、SMOTE。 概述 类型 说明 image2020-5-21 10:44:46.png 按照随机的原则,从总体数据中随机地抽取部分数据,保证总体样本中每一个样本都有已知的、非零的概率被选入为研究对象,以保证样本的代表性。 image2020-5-21 10:44:18.png 以加权方式生成采样数据。先从总体中,选择用于加权的列,然后按照该列值的大小进行采样,权重值越大,抽取的概率越大。 image2020-5-21 10:42
  2. 数据挖掘-采样

    采样就是按照某种规则从数据集中挑选样本数据。 在Smartbi中支持五种类型的采样:随机采样、加权采样、分层采样、下采样、SMOTE。 概述 类型 说明 image2020-5-21 10:44:46.png 按照随机的原则,从总体数据中随机地抽取部分数据,保证总体样本中每一个样本都有已知的、非零的概率被选入为研究对象,以保证样本的代表性。 image2020-5-21 10:44:18.png 以加权方式生成采样数据。先从总体中,选择用于加权的列,然后按照该列值的大小进行采样,权重值越大,抽取的概率越大。 image2020-5-21 10:42
  3. 数据挖掘 – 相似集计算(LSH)

    该功能为V10.5版本功能。 概述 使用训练好的LSH模型,对两份数据中的向量进行相似度匹配,把相似度距离低于预设阈值的组合输出到结果。 输入/输出 输入 三个输入端口,输入1接收训练好的LSH模型,输入2和3接收要进行匹配的数据。 输出 一个输出端口,用于输出匹配后的结果。 参数设置 参数名称 说明 备注 相似阈值 设置相似度距离阈值 距离低于阈值的组合才会被输出 示例 相似集1.png 效果 分别接入LSH模型,数据1和数据2,其中数据1和数据2都已使用词向量模型对其文本进行转换。把相似阈值设为0.45,输出
  4. 数据挖掘 – 相似集计算(LSH)

    该功能为V10.5版本功能。 概述 使用训练好的LSH模型,对两份数据中的向量进行相似度匹配,把相似度距离低于预设阈值的组合输出到结果。 输入/输出 输入 三个输入端口,输入1接收训练好的LSH模型,输入2和3接收要进行匹配的数据。 输出 一个输出端口,用于输出匹配后的结果。 参数设置 参数名称 说明 备注 相似阈值 设置相似度距离阈值 距离低于阈值的组合才会被输出 示例 相似集1.png 效果 分别接入LSH模型,数据1和数据2,其中数据1和数据2都已使用词向量模型对其文本进行转换。把相似阈值设为0.45,输出
  5. 数据模型-创建度量

    度量是描述或衡量对象的数据数据模型的度量来源有两种:标记度量 https://wiki.smartbi.com.cn//pages/viewpage.action?pageId=69737551#id-%E5%A2%9E%E5%BC%BA%E6%95%B0%E6%8D%AE%E9%9B%86%E5%88%9B … %95%B0%E6%8D%AE%E9%9B%86%E5%88%9B%E5%BB%BA%E5%BA%A6%E9%87%8F-%E8%AE%A1%E7%AE%97%E5%BA%A6%E9%87%8F。 标记度量 标记度量是指对已含有数据信息的字段标记成度量字段。 我们只需要在”维度面板“中将字段标记成度量字段即可
  6. 数据模型-累计系列

    累计通常是在时间周期内对数据的汇总求和。 累计通常用聚合函数“Aggregate()”实现,其表达式为:Aggregate(<Set>, <Numeric Expression>),其中: <Set>:用于设置成员集合,表示聚合的分组; <Numeric Expression>:用于设置数值表达式,表示聚合 … : image2022-2-7_17-31-28.png 上年累计 上年累计表示上一年1月份到12月份的数据逐一汇总。 下图显示了上年销售量累计的情况:由于没有2012年的数据,因此2013的上年累计值为空;2014年的累计值为2013年的累计值。 image2021-11-17_11-7-34.png 上图的上年累计表达式设置如下
  7. 仪表盘中如何筛选非空数据(实际数据为空白)

    问题说明 产品筛选器中的非null或者null是拼is not null或者is null的。但如果实际数据并不是null,而是空白,即希望实现"字段" != '',应该如何实现? image2024-2-28_18-37-37.png image2024-2-28_18-47-58.png 解决方案 建议是可以新建一个计算列,在该计算列中计算该字段长度,即length(字段)。然后拖这个计算列当筛选器,筛选大于0的。 image2024-2-28_18-49-25.png 筛选不为空数据 筛选有值的数据
    FAQ中心二月 28, 2024
  8. 数据挖掘-聚合

    概述 聚合可根据用户的需求对数据进行各种聚合运算,包括分组、求均值、最大值、最小值、求和、统计、去重统计等等。用户可以根据不同数据类型使用不同的聚合函数以及生成的新特征名称。 image2020-5-29 16:5:11.png 输入/输出 输入 一个输入端口,用于接收数据集 … 除重复数据。 Collect_set:将指定列转为一个数组返回,去除重复数据。 数值类型字段: Group:根据一个或多个列对结果集进行分组。 Count:对包含非空值的列进行计数。 DistinctCount:对列中的非重复值数目进行计数。 Min:返回指定列的最小值。 Max:返回指定列
  9. 数据挖掘-聚合

    概述 聚合可根据用户的需求对数据进行各种聚合运算,包括分组、求均值、最大值、最小值、求和、统计、去重统计等等。用户可以根据不同数据类型使用不同的聚合函数以及生成的新特征名称。 image2020-5-29 16:5:11.png 输入/输出 输入 一个输入端口,用于接收数据集 … 除重复数据。 Collect_set:将指定列转为一个数组返回,去除重复数据。 数值类型字段: Group:根据一个或多个列对结果集进行分组。 Count:对包含非空值的列进行计数。 DistinctCount:对列中的非重复值数目进行计数。 Min:返回指定列的最小值。 Max:返回指定列
  10. 加载文件数据用户权限说明

    数据的载体除了有库表之外,还有文件,如excel文件、txt文件等。如何将这些记录在文件中的数据转化成数据库表就是Smartbi加载文件数据要解决的。 使用加载文件数据功能导入数据表操作必须满足如下两个前提条件: 加载的文件数据的目标数据源必须支持“允许加载Excel数据”。设置详情请参见:允许加载Excel数据 https://wiki.smartbi.com.cn/pages/viewpage.action?pageId=62292818#id-%E5%8A%A0%E8%BD%BD%E6%96%87%E4%BB%B6%E6%95%B0%E6%8D%AE%E7%94%A8%E6%88%B7%E6%9D%83%E9%99