数据挖掘包含两大部分:数据挖掘执行引擎、数据挖掘服务引擎

数据挖掘执行引擎:

数据挖掘服务引擎:

集群部署数据挖掘组件环境如下:

服务器IP主机名组件实例部署目录
10.10.35.6410-10-35-64数据挖掘-1,Zookeeper-1,Python-1/data
10.10.35.6510-10-35-65数据挖掘-2,Spark-1,Hadoop-1/data
10.10.35.6610-10-35-66Spark-2,Zookeeper-2,Hadoop-2/data
10.10.35.6710-10-35-67Spark-3,Zookeeper-3,Hadoop-3,Python-2/data