搜索

Help

第45页,共108页。 显示 1,077 条结果 (0.022 秒)

  1. 数据挖掘-变换

    概述 变换就是将所有特征经过某种变化,提取隐含信息。 运用抽取所提取的模型来变换特征。 输入/输出 输入 两个输入端口,用于接收抽取的特征规律。 输出 一个输出端口,用于输出特征处理结果。 参数设置 参数名称 说明 备注 名称 节点名称为“转换” 使用时与抽取、特征选择组合使用 示例 根据抽取节点左侧接入的相应特征提取算法输出的结果也有所不同。 变换
  2. 数据挖掘-聚类训练

    概述 聚类训练是基于选择的特征,对聚类算法的模型进行聚类训练, 输出训练后的模型。 输入/输出 输入 两个输入端口:左边输入为待训练的聚类算法,右边输入则为特征选择的结果。 输出 一个输出端口,用于 输出训练后的模型。 示例 以K均值算法为例:如下图 image2022-10-25_11-26-39.png 鼠标右键点击聚类训练节点,可保存聚类训练后的模型。 聚类训练 SMS-40825【文档问题反馈】数据挖掘-聚类训练文档问题
  3. 数据挖掘-模型系数

    概述 算法经过训练之后,会明确每个特征(自变量)对于标签(因变量)的影响系数。模型系数就是将每个特征的系数输出。目前适用于线性回归、二分类、FP-Growth等。 输入/输出 输入 一个输入端口,用于接收算法训练结果。 输出 一个输出端口,用于将每个特征的系数输出。 示例 以逻辑回归算法为例,如下图:  图片46.png 点击右键查看模型系数的分析效果,可查看特征选择中每个特征的系数输出,如下图所示:  图片47.png 模型系数
  4. 数据挖掘-评分预测

    概述 评分预测使用训练好的评分卡模型对具体数据进行预测,用于输出最终的信用评分。 输入/输出 输入 两个输入端口,输入1接收训练好的评分卡模型,输入2接收训练数据 输出 一个输出端口,用于输出预测结果 示例 图片1.png 查看输出可看到具体的预测结果: 图片2.png 注意事项 评分预测接入的数据必须为WOE编码之前的数据,且选取的特征应与进行WOE编码的特征相同。
  5. 数据挖掘-词频统计

    概述 用于统计词在文本出现的次数。该节点只能选取数组类型的数据。常用于展示词云图。 输入/输出 输入 一个输入端口,用于接收分词后的数据集 输出 一个输出端口,用于输出词在文本出现的次数 参数设置 参数名称 说明 备注 选择标签列 选择需要统计的标签列 必填 示例 使用“深圳企业信息”示例数据,选择分词和停用词处理后的列(企业名称_seg_words_filtered),输出结果如下图所示: 图片5.png 词频统计
  6. 数据挖掘-评分预测

    概述 评分预测使用训练好的评分卡模型对具体数据进行预测,用于输出最终的信用评分。 输入/输出 输入 两个输入端口,输入1接收训练好的评分卡模型,输入2接收训练数据 输出 一个输出端口,用于输出预测结果 示例 图片1.png 查看输出可看到具体的预测结果: 图片2.png 注意事项 评分预测接入的数据必须为WOE编码之前的数据,且选取的特征应与进行WOE编码的特征相同。
  7. 数据挖掘–移动平均

    概述 移动平均是一个时间序列算法节点。移动平均可以消除序列中突发因素的影响,对数据总体走势进行平滑。 输入/输出 输入 一个输入端口,接收要进行预测的数据 输出 一个输出端口,用于输出预测后的结果 示例 如图,移动平均节点输入端接入数据,可以使用对应的模型对输入数据进行转换。 image2023-1-15_0-31-53.png image2023-1-15_0-32-6.png 输出的数据列名增加前缀,输出结果经过了移动平均算法的平滑处理。 image2023-1-15_0-32-17.png
  8. 基于impala数据源创建原生SQL查询报错

    (本文档仅供参考) 问题说明          测试impala连接成功后,尝试使用原生sql查询,查询数据,有一张表查询报错,日志如下,帮忙看下是何问题?         image2019-5-22 17:21:40.png         image2019-5-22 17:22:14.png 解决方案          此错误是JDBC驱动抛出的异常,有可能有如下两个原因:          1、数据库文件损坏,需要找数据库管理员分析问题。          2、对应数据库的端口号没有开放,需要找数据管理员开放相关端口
    FAQ中心八月 05, 2021
  9. Smartbi V10.1-数据准备

    。 ^【数据模型/自助ETL/数据挖掘】新增小批量执行策略 背景介绍 在实际应用中,有的用户在使用自助ETL时,遇到数据量很大的情况,即使设置了缓存,但第一次运行速度仍然很慢,而且非常消耗性能。为了解决以上问题,新版本产品新增小批量执行策略,能够以极小数据量执行连接的节点,运行速度很快,便于调试时数据试运行。 功能简介 1、运行按钮新增“小批量”执行策略,当数据量过大时,可使用小批量运行功能试跑1000行数据,减少等待时间。 小批量1.png 2、完善的功能如下 : 1)调整节点右键菜单顺序:将常用功能放到前面。 小批量2.png 2)优化执行逻辑:在已经配置缓存的情况下,对于已经执行过节点,再次执行(选择从头执行或右键
  10. Smartbi V10-数据准备

    关系 +【数据准备】新增多表JOIN节点,支持同时接入多个数据源并设置表关系 +【数据准备】新增组合查询节点,支持去重、聚合、计新建算字段等高级功能 ^【数据准备】新建或编辑计算度量、成员、命名集支持参数设置 <【数据准备】取消支持Infobright作为高速缓存库 +【数据准备】新增 … 、数据挖掘中,新增组合查询节点。 image2021-9-1_16-22-32.png 支持灵活的选择字段和去重、条件筛选、聚合筛选、聚合、排序、修改别名、新建计算字段、批量选择列、取消选择列等高级功能。 组合查询2.png 注意事项 组合查询节点只支持使用ClickHouse21及以上版本作为高速缓存