搜索

Help

第45页,共90页。 显示 897 条结果 (0.024 秒)

  1. 数据挖掘-过滤

    概述 根据用户需求,通过写SQL语句(片段)的方式,对数据集中指定字段进行条件筛选过滤。 image2020-9-8_9-10-20.png 输入/输出 输入 一个输入端口,用于接收数据集。 输出 一个输出端口,用于输出过滤的结果。 参数设置 设置过滤与映射的参数: image2020-5-21 13:58:29.png 设置说明如下: 参数 说明 过滤器 对数据的指定字段进行过滤。 image2020-5-21 11:42:59.png 示例 1、原先示例数据源的输出结果有150条数据,对其进行过滤
  2. 数据挖掘-最小最大归一化

    概述 最小最大值归一化是对原始数据的线性变换,使结果映射到[0,1]区间。设minA和maxA分别为特征A的最小值和最大值,将A的一个原始值x通过MinMaxScaler映射到区间[0,1]间,公式为:x' = (x-minA)/(maxA-minA)。 输入/输出 输入 没有输入端口 输出 一个输出端口,与抽取、变换节点组合使用 参数设置 参数名称 说明 备注 新增列后缀 用于设置在原字段名后追加后缀生成新的列,默认后缀为:Normalized; 必填 图片1.png 示例 使用“鸢尾花数据”,特征选择4个特征
  3. 数据挖掘-最大绝对值归一化

    概述 最大绝对值归一化通过除以每个特征内的最大绝对值将每个特征映射到[-1,1]的范围;它不会移动和中心化数据,因此不会破坏任何的稀疏性。 输入/输出 输入 没有输入端口 输出 一个输出端口,与抽取、变换节点组合使用 参数设置 参数名称 说明 备注 新增列后缀 用于设置在原字段名后追加后缀生成新的列,默认后缀为:Normalized; 必填 图片3.png 示例 使用“鸢尾花数据”,特征选择4个特征列,最大绝对值归一化为[-1,1]范围的数据,输出结果如下图: 图片4.png 最大绝对值归一化
  4. 数据挖掘-假设检验

    概述 通过特征变量与目标变量之间的偏差来检验数据之间的相关性或回归分析中的拟合结果。 输入/输出 输入 一个输入端口,用于接收数据集 输出 一个输出端口,用于输出假设检验结果数据集 参数设置 参数名称 说明 备注 选择特征列 用于选择需要检验的字段列 必填 选择标签列 用于选择做为标签列的字段(必须为数值型) 示例 使用“鸢尾花数据”,选择4个特征列和1个标签列,输出结果如下图: 图片6.png 鼠标点击右键查看分析结果: 图片7.png 以上图知:已挑选的特征列的P值都趋近于0
  5. 数据挖掘-词袋

    概述 词袋是为了对句子进行分词,根据分隔符将句子分割开来,分成一个个独立的词语或者单词。常用于英文文本分割语句。 输入/输出 输入 一个输入端口,用于接收数据集 输出 一个输出端口,用于输出分隔后的结果 参数设置 参数配置 说明 备注 选择文本项 选择需要分割的文本列 必填 分隔符 输入指定的分隔符 必填 示例 使用“垃圾短信识别”数据,选择需要分割的文本列,设置”/”分隔符进行分割,输出结果如下图: image2020-6-4 11_11_16.png 词袋
  6. 数据挖掘-停用词处理

    概述 停用词处理是由于有些词频很高,但对文章却没有太多意义的语气词和助词等等,比如这、我、你们、吗等等,对这些词进行去掉处理以便能够更好的分析语义。常用于关键词提取分析。 输入/输出 输入 一个输入端口,用于需要过滤停用词的字段。 输出 一个输出端口,用于输出去掉停用词之后的结果。 参数设置 参数名称 说明 备注 字段选择 选择需要去除停用词的列 必填 停用词列表 在对话框填写停用词,每行填写一个停用词 必填 示例 使用“深圳企业信息”示例数据,选择分词后去除停用词的列(企业名称
  7. 数据挖掘-评分卡输出

    概述 评分卡输出用于查看已训练的评分卡模型中,各个变量离散后各分箱的WOE值,iv值及其对评分分数的贡献,可作为对评分卡模型的分析。 输入/输出 输入 一个输入端口,接收训练好的评分卡模型 输出 一个输出端口,用于输出评分卡分析结果 示例 图片3.png 评分卡输出节点的输出结果具体如下: 图片4.png 其中,前三列为各个变量的分箱信息;woe值和IV值反映了该变量分箱的预测偏向和能力;最后两列为该变量分箱对应的转换前和转换后的评分分数,由评分卡模型输出。
  8. 如何在作业流成使用“参数输出"节点

    概念 将取到的数据输出为参数,供下游分支条件判断时使用。 应用场景:将取到的数据输出为参数,供下游分支条件判断时使用。 输入/输出 输入 一个输入端口,用于连接节点。 输出 一个输出端口,将取到的数据输出为参数,供下游分支条件判断时使用。 示例 1、拖入参数输出节点,用于输出参数,控制执行分支 2、配置参数输出节点 图片2.png 3、参看执行参数  图片3.png 图片4.png   4、设置分支条件 image2024-4-25_11-20-6.png  图片5.png 5、运行,不满足条件的分支将不会执行,同时整个作业流不会因为不满足条件而执行报错
  9. Oracle作为知识库时如何支持SERVICE_NAME(服务名)的连接

    (本文档仅供参考) 问题现象           部署知识库为oracle数据库时会提示连接不可用,但是在其他工具上测试连接可用,在smartbi中连接时会出现如下提示: image2018-10-23 10:37:7.png 解决方案          这是由于在smartbi中默认的连接方式是 192.168.1.10:1521:oracl 的方式进行连接(即端口号和实例是用冒号分开的),而有时候oracle需要用service_name的方式进行连接,即端口号和服务是用斜杠分开的,此时在smartbi中如需支持service_name,数据库名称需以/开头: image2018-10-23 10:52
    FAQ中心八月 13, 2021
  10. Shell脚本节点

    1概述 Shell脚本节点通过ssh方式登陆远程服务器并运行该服务器上指定路径下的脚本文件。 2节点参数说明 image2023-12-19_16-33-4.png image2023-12-19_16-33-32.png 参数说明: 1.主机:必填项,可以是远程主机主机名或ip,需保证挖掘引擎能访问该主机名或ip 2.端口:必填项,ssh登陆的端口 3.用户名:必填项,ssh登陆用户名 4.密码:必填项,ssh登陆密码 5.脚本路径:必填项,在远程主机上的可运行的脚本文件绝对路径,需注意登陆用户要有该文件运行权限。
    Smartbi Insight V11帮助中心十二月 19, 2023