搜索

Help

第128页,共256页。 显示 2,551 条结果 (0.124 秒)

  1. 数据挖掘-高维数据可视化

    概述 将数据用图形展示(散点图/平行坐标图),实现对数据或结果可视化分析。 散点图常用在因变量随自变量而变化的趋势,进而找到变量之间的函数关系。 平行坐标图常用在反映变化趋势和各个变量间相互关系,它具有良好的数学基础,其射影几何解释和对偶特性使它很适合用于可视化数据分析。 输入/输出 输入 一个输入端口,用于接收数据集。 输出 没有输出端口,允许可视化查看分析结果。 参数设置 参数名称 说明 备注 选择列 用于选择需要绘制图形的字段列 必填 采样比例 用于对输入数据按比例进行抽样,抽样结果用于绘图
  2. 数据挖掘-分词

    概述 分词就是将连续的字序列按照一定的规范重新组合成词序列的过程。它是对句子进行精确分词,在词库中进行搜索匹配,将句子根据匹配的结果分成那些常见的词组或者单词。常用于做文本挖掘分析。 输入/输出 输入 一个输入端口,用于接收数据集 输出 一个输出端口,用于输出分词后的结果。 参数设置 参数名称 说明 备注 字段选择 选择需要分词的字段列(必须是文本型字段) 必填 自定义词典 说明:按行填写词列表,每行一词,最多支持一万词。 支持两种方式输入自定义词: 手动输入,每行填写一个自定义词
  3. 数据挖掘-OneHot编码

    概述 OneHot编码是将类别变量转换为机器学习算法易于利用的一种形式的过程。它是分类变量作为二进制向量的表示。这首先要求将分类值映射到整数值。然后,每个整数值被表示为二进制向量,除了整数的索引之外,其它都是零值,它被标记为1。(即:标记位置为1,其他位置为0)我们编码后的结果是一个稀疏向量,稀疏向量就是有特征数量,特征索引和特征值组成。 image2020-9-11_16-15-16.png 输入/输出 输入 没有输入端口。 输出 一个输出端口,用于接入下一个节点,与抽取节点组合使用。 参数设置 参数名称 说明 备注 新增列后缀
  4. 电子表格回写刷新后回写字段仍然显示

    该宏示例在 V10.5上 验证通过 提示:本文档的示例代码仅适用于本文档中的示例报表/场景。若实际报表/场景与示例代码无法完全适配(如使用功能不一致,或多个宏代码冲突等),需根据实际需求开发代码。 示例说明 在回写时绑定参数的报表中,若是先回写,再切换参数,则之前回写的字段会消失,下面示例中的宏可以规避这种问题,如下图: image2020-6-12 17:22:19.png 设置方法           1、首先在电子表格设计器(Microsoft Office Excel)中,创建电子表格报表。           2、在浏览器的“分析展现”节点下,选中电子表格,右键选择 编辑宏 进入
  5. 数据挖掘-WOE编码

    概述 WOE编码是评分卡模型常用的数据处理步骤,用于对所选特征值进行WOE编码,并计算IV值,且可根据IV值做特征选择。 输入/输出 输入 一个输入端口,用于接收需要进行WOE编码的数据集。 输出 两个输出端口,输出1是用于输出WOE编码转换后的数据集,输出2是WOE编码模型。 参数设置 参数名称 说明 备注 选择列 用于选择进行异常值处理设置的字段。 31.png 必填(特征列中不能含有null) 分箱方式 分位数分箱:根据设置的数值算出对应的分位数,按照算出的分位数对字段进行分箱。 自定义
  6. 数据挖掘-值替换

    概述 在数据预处理中,值替换用于对字段中指定的值进行替换。 image2021-3-18_15-58-26.png 10.5.15版本后,左侧资源树不再显示值替换节点,但是旧的值替换节点仍能正常使用,建议使用最新的数据清洗节点完成替换操作。 输入/输出 输入 一个输入端口,用于接收数据集。 输出 一个输出端口,用于输出值替换后的结果。 参数设置 值替换配置: image2021-3-22_10-25-7.png 值替换配置界面如下: image2021-3-22_10-32-47.png 设置项说明如下: 参数 说明 已选字段 选择进行值替换的字段
  7. 数据挖掘 – LSH

    度匹配。 输入/输出 输入 没有输入端口。 输出 一个输出端口,与抽取、变换节点组合使用。 参数设置 参数名称 说明 备注 相似度计算方法 相似度距离度量 欧式距离和杰卡德距离 哈希存储桶的长度 每个哈希表内的哈希桶
  8. 模型即席查询宏-接口介绍

    /iparampanel.html 参数面板接口 IParam https://wiki.smartbi.com.cn/api/modelquery/interfaces/iparam.html 参数接口 IFilterPanel https://wiki.smartbi.com.cn/api
  9. 数据挖掘-孤立森林

    概述 孤立森林是一个异常检测算法节点,需要配合特征选择、训练、预测节点使用(异常检测算法为无监督学习,不需要评估节点)。孤立森林对正常数据进行采样,训练时随机生成决策树对数据进行划分。在预测未知数据时,决策树划分出某单个数据点需要的划分次数越少,对应的异常分数越高,该数据点为异常数据的概率越大。 孤立森林适用于用已知为正常的数据作为训练数据,然后对未知的新数据作预测,检测新数据中的异常数据。 参数设置 参数名称 说明 备注 树的个数 生成的决策树的数量 树的数量,整数 子采样集大小 生成每个决策树时用的子数据集的大小 整数,推荐用2的n次幂 异常值阈值
  10. 系统选项-移动端

    的限制,其说明如下: 设置项 说明 默认值 参数枚举最大数量 用于设置参数枚举的最大数量。 50 最大翻页数量 用于设置翻页的最大数量。 10