第44页,共108页。 显示 1,077 条结果 (0.022 秒)
数据挖掘-增加序列号
概述 增加序列号节点是在数据表第一列追加ID列。 image2020-5-29 15:52:22.png 输入/输出 输入 一个输入端口,用于接收数据集。 输出 一个输出端口,用于输出增加序列号的结果。 参数设置 设置增加序列号的参数: image2020-5-29 15:50:8.png 序列列名称:新增序列号的名称。默认是:row_number。 增加序列号数据挖掘-聚类训练
概述 聚类训练是基于选择的特征,对聚类算法的模型进行聚类训练, 输出训练后的模型。 输入/输出 输入 两个输入端口:左边输入为待训练的聚类算法,右边输入则为特征选择的结果。 输出 一个输出端口,用于 输出训练后的模型。 示例 以K均值算法为例:如下图 image2022-10-25_11-26-39.png 鼠标右键点击聚类训练节点,可保存聚类训练后的模型。 聚类训练数据挖掘-模型系数
概述 算法经过训练之后,会明确每个特征(自变量)对于标签(因变量)的影响系数。模型系数就是将每个特征的系数输出。目前适用于线性回归、二分类、FP-Growth等。 输入/输出 输入 一个输入端口,用于接收算法训练结果。 输出 一个输出端口,用于将每个特征的系数输出。 示例 以逻辑回归算法为例,如下图: 图片46.png 点击右键查看模型系数的分析效果,可查看特征选择中每个特征的系数输出,如下图所示: 图片47.png 模型系数数据挖掘-抽取
概述 抽取是按照一定的标准对特征列进行编码。 左侧接相应特征提取算法,右侧接数据,从数据中统计和学习抽取规律。当抽取完后,在预测过程中需要保存已学习到的规律作为模型。 输入/输出 输入 两个输入端口,用于接收特征处理方法(目前支持特征离散/特征转换)和特征选择。 输出 一个输出端口,用于输出抽取的特征规律。 参数设置 参数名称 说明 备注 名称 节点名称为“拟合” 使用时与特征离散/特征转换和特征选择组合使用。 抽取数据挖掘-变换
概述 变换就是将所有特征经过某种变化,提取隐含信息。 运用抽取所提取的模型来变换特征。 输入/输出 输入 两个输入端口,用于接收抽取的特征规律。 输出 一个输出端口,用于输出特征处理结果。 参数设置 参数名称 说明 备注 名称 节点名称为“转换” 使用时与抽取、特征选择组合使用 示例 根据抽取节点左侧接入的相应特征提取算法输出的结果也有所不同。 变换数据挖掘-增加序列号
概述 增加序列号节点是在数据表第一列追加ID列。 image2020-5-29 15:52:22.png 输入/输出 输入 一个输入端口,用于接收数据集。 输出 一个输出端口,用于输出增加序列号的结果。 参数设置 设置增加序列号的参数: image2020-5-29 15:50:8.png 序列列名称:新增序列号的名称。默认是:row_number。 增加序列号数据挖掘-词频统计
概述 用于统计词在文本出现的次数。该节点只能选取数组类型的数据。常用于展示词云图。 输入/输出 输入 一个输入端口,用于接收分词后的数据集 输出 一个输出端口,用于输出词在文本出现的次数 参数设置 参数名称 说明 备注 选择标签列 选择需要统计的标签列 必填 示例 使用“深圳企业信息”示例数据,选择分词和停用词处理后的列(企业名称_seg_words_filtered),输出结果如下图所示: 图片5.png 词频统计数据挖掘-元数据编辑
概述 元数据编辑可用于修改数据集中字段的一些属性,包括名称、别名、数据类型及字段顺序等。 image2020-5-22 9:57:51.png 输入/输出 输入 一个输入端口,用于接收数据集。 输出 一个输出端口,用于输出元数据编辑的结果。 参数设置 设置元数据编辑的参数: image2020-5-22 9:59:43.png 设置说明如下: 参数 说明 属性 用于修改各字段的名称、别名、数据类型及字段顺序: image2021-3-18_10-30-56.png 元数据编辑数据挖掘-训练
概述 训练是基于选择的特征,对各种分类和回归算法的模型进行训练。输出训练后的模型。 输入/输出 输入 两个输入端口:左边输入为待训练的算法,右边输入则为训练集。 输出 一个输出端口,用于输出训练后的模型。 示例 以逻辑回归算法为例:如下图 图片39.png 训练节点点击鼠标右键,可查看模型分析结果以及保存模型。 注:需要和“特征选择”节点联合使用,参考数据挖掘-聚类训练 训练数据挖掘-抽取
概述 抽取是按照一定的标准对特征列进行编码。 左侧接相应特征提取算法,右侧接数据,从数据中统计和学习抽取规律。当抽取完后,在预测过程中需要保存已学习到的规律作为模型。 输入/输出 输入 两个输入端口,用于接收特征处理方法(目前支持特征离散/特征转换)和特征选择。 输出 一个输出端口,用于输出抽取的特征规律。 参数设置 参数名称 说明 备注 名称 节点名称为“拟合” 使用时与特征离散/特征转换和特征选择组合使用。 抽取