页面树结构
转至元数据结尾
转至元数据起始


数据挖掘-实验引擎

负责接收smartbi 发送实验执行请求。

通过解析实验定义,生成spark 计算任务或python计算任务,分别发送给spark集群或python集群。

本身并不承担计算任务,只负责计算任务的调度跟分发。

数据挖掘-服务引擎提供模型预测服务给第三方系统调用。
Python执行节点

python 执行环境,主要承担实验引擎发送过来的python计算任务。

可以横向扩张,实验引擎会根据负责均衡策略把python计算任务分发到不同节点。

Spark分布式计算平台,主要承担实验引擎发送过来的计算任务。
Hadoop分布式系统基础平台,主要存储计算任务的中间结果数据
Zookeeper用于实现数据挖掘实验引擎和数据挖掘服务引擎的高可用。

+部署数据挖掘引擎-单机

+部署数据挖掘引擎-集群

  • 无标签