...
名称 | 说明 | 详细介绍 |
---|---|---|
数据源 | 数据源中的节点是数据挖掘实验数据输入节点,目前有文本数据源,关系数据源,数据集,以及产品内置示例数据源。 | 数据源节点 |
目标源 | 目标源中的节点是数据挖掘实验结果输出节点,目前支持将结果输出至关系目标源,或导出数据到HDFS。 | 目标源节点 |
已训练模型 | 已训练的模型是用户将训练并运行通过后的模型封装保存为节点对象,支持复用,可以简化用户定制工作流的操作。 | |
数据预处理 | 数据预处理中是提供对'脏'数据清洗,初步加工等一系列处理功能的节点,具体内容参考详细介绍。 | 数据预处理节点 |
特征工程 | 特征工程中包括常见特征工程方法节点。通过特征工程,能够最大限度地从原始数据中提取特征,以供算法和模型使用。 | 特征工程节点 |
统计分析 | 统计分析中包括基础数理统计方法,用以数据的分析统计。 | 统计分析节点 |
文本分析 | 文本分析中包括进行文本分析前,对文本数据加工处理的一系列节点。 | 文本分析节点 |
机器学习 | 产品提供常见的机器学习算法节点按照算法类别,分别放在分类算法,回归算法,聚类算法,关联规则文件夹中。而训练,预测,评估均为模型搭建中必须的节点,需搭配算法节点使用。 | 机器学习算法节点 |
脚本模块 | 目前产品提供的算法节点不能够涵盖所有算法,故提供PYTHON脚本、SQL脚本扩展产品的算法能力。 | 脚本节点 |
自定义模块 | 自定义模块存放用户保存自行编写的PYTHON脚本、SQL脚本节点。 | |
服务 | 组合使用服务中的两个节点,可以将数据挖掘实验发布为web服务,提供接口,应用程序可以实时调用数据挖掘实验,并能同步获取执行结果。 | 服务节点 |
实验信息栏
实验信息栏位显示的内容依次为实验名称,导入导出功能按钮,和实验运行情况,如下图:
...
样式 | 名称 | 说明 |
---|---|---|
查看历史 | 实验每次执行的评估结果作为历史信息都被记录下来,在历史信息页面展示,方便用户对比多次实验结果,进而选取出最优实验。 | |
保存 | 该按钮用于保存新建实验、实验流程变动等。 | |
另存为 | 可将实验另存。 | |
运行 | 执行实验流程。 | |
部署服务 | 将数据挖掘实验发布为web服务。 | |
设置模型自学习 | ||
模型批量预测 |
...