页面树结构

版本比较

标识

  • 该行被添加。
  • 该行被删除。
  • 格式已经改变。

...

注意
title文档环境

集群部署数据挖掘组件环境如下:

服务器IP主机名组件实例部署目录
10.10.35.6410-10-35-64数据挖掘-1,Zookeeper-1,Python1Zookeeper-1,Python-1/data
10.10.35.6510-10-35-65数据挖掘-2,2Spark-1,Hadoop-1/data
10.10.35.6610-10-35-66Spark-2,ZookeeperZookeeper-2,2Hadoop-2/data
10.10.35.6710-10-35-67Spark-3,ZookeeperZookeeper-3,Hadoop-3,Python-2/data


1、系统环境准备

...

2.开启防火墙

相关服务及端口对照表:

服务名需要开放端口
执行引擎

8899,4040,7777, 8899,4040,7777,,[30000-65535]

服务引擎8900
Zookeeper2181,2888,3888

如果确实需要打开防火墙安装,需要给防火墙放开以下需要使用到的端口
开启端口:8900,8899,4040,7777, [30000-65535]

代码块
languagebash
linenumberstrue
firewall-cmd --zone=public --add-port=8899/tcp --permanent
firewall-cmd --zone=public --add-port=8900/tcp --permanent
firewall-cmd --zone=public --add-port=4040/tcp --permanent
firewall-cmd --zone=public --add-port=7777/tcp --permanent
firewall-cmd --zone=public --add-port=30000-65535/tcp --permanent
firewall-cmd --zone=public --add-port=2181/tcp --permanent
firewall-cmd --zone=public --add-port=2888/tcp --permanent
firewall-cmd --zone=public --add-port=3888/tcp --permanent

配置完以后重新加载firewalld,使配置生效

代码块
languagebash
linenumberstrue
firewall-cmd --reload

...

代码块
languagebash
10.10.35.64 10-10-35-64
10.10.35.65 10-10-35-65
10.10.35.66 10-10-35-66
10.10.35.67 10-10-35-67

...

2、部署数据挖掘-执行引擎(高可用)

注意
title数据挖掘执行引擎-高可用 节点说明

数据挖掘执行引擎需要依赖zookeeper,故而文档环境部署zookeeper集群。

主机名角色
10-10-35-64执行引擎(主),Zookeeper-1
10-10-35-65执行引擎(备)
10-10-35-66Zookeeper-2
10-10-35-67Zookeeper-3


2.1 部署Zookeeper集群

1、登陆zookeeper-1节点执行操作。

①上传zookeeper安装包到服务器,并解压到指定目录:

代码块
languagebash
tar -zxvf zookeeper-3.4.13.tar.gz -C /data/


②创建zookeeper数据目录、日志目录

代码块
languagebash
cd /data/zookeeper-3.4.13
mkdir {data,log}


③修改zookeeper配置文件

代码块
languagebash
cd /data/zookeeper-3.4.13/conf
mv zoo_sample.cfg zoo.cfg       #重命名配置文件
vi zoo.cfg                      #编辑配置文件

zookeeper配置文件参考:

代码块
languagebash
tickTime=2000
initLimit=10
syncLimit=5
#修改数据目录和日志目录
dataDir=/data/zookeeper-3.4.13/data
dataLogDir=/data/zookeeper-3.4.13/log
clientPort=2181
#保留20个文件
autopurge.snapRetainCount=20
#保留48小时
autopurge.purgeInterval=48  
#zookeeper集群信息
server.1=10-10-35-64:2888:3888    
server.2=10-10-35-66:2888:3888   
server.3=10-10-35-67:2888:3888 


④将Zookeeper安装包分发到其他节点

假设当前的系统用户为root命令如下:

代码块
languagebash
scp -r /data/zookeeper-3.4.13  root@10-10-35-66:/data/
scp -r /data/zookeeper-3.4.13  root@10-10-35-67:/data/


2、创建myid文件,并写入ID,集群中每个节点mysqid不能相同

代码块
languagebash
echo 1 > /data/zookeeper-3.4.13/data/myid        #zookeeper-1节点执行
echo 2 > /data/zookeeper-3.4.13/data/myid        #zookeeper-2节点执行
echo 3 > /data/zookeeper-3.4.13/data/myid        #zookeeper-3节点执行


3、启动Zookeeper集群

所有节点启动Zookeeper服务

代码块
languagebash
cd /data/zookeeper-3.4.13/bin
./zkServer.sh start


4、查看每个节点Zookeeper状态

代码块
languagebash
cd /data/zookeeper-3.4.13/bin
./zkServer.sh status

其中有一个leader节点,两个follower节点

zookeeper集群部署完成。

2.2 部署执行引擎(主节点)

1、解压Smartbi-engine安装包到指定的目录

代码块
languagebash
linenumberstrue
tar -zxvf SmartbiMiningEngine-V10.0.64186.21183.tar.gz -C /data

2、启动数据挖掘执行引擎

代码块
languagebash
linenumberstrue
cd /data/smartbi-mining-engine-bin/engine/sbin/
chmod +x *.sh
./experiment-daemon.sh start


注意
title注意事项

首次启动执行引擎只是为了生成相关配置文件


3、修改执行引擎配置文件

进入配置文件目录,注意:下面的配置文件是执行引擎首次启动时生成的。

代码块
languagebash
linenumberstrue
cd /data/smartbi-mining-engine-bin/conf
vi experiment-application.properties

experiment-application.properties配置文件具体修改如下图:

Image Added



3、部署数据挖掘服务引擎(负载均衡)