页面历史

Python节点主要用于机器学习的DBSACN算法和自定义模块的Python脚本扩展。如果没有用到这两个功能模块，可以不用部署python节点。

注意

title	文档环境

单机部署数据挖掘组件环境如下：

服务器IP	主机名	组件实例	部署目录
10.10.204.248	10-10-204-248	数据挖掘	/data
10.10.204.249	10-10-204-249	Spark，Hadoop	/data
10.10.204.250	10-10-204-250	Python	/data

1. 系统环境准备

注意

title	温馨提示

配置防火墙，selinux相关操作，需要管理员权限。

1.1. 防火墙配置

为了便于安装，建议在安装前关闭防火墙。使用过程中，为了系统安全可以选择启用防火墙，但必须启用服务相关端口。

1.1.1. 关闭防火墙

临时关闭防火墙（立即生效）

代码块

linenumbers	true

systemctl stop firewalld

永久关闭防火墙（重启后生效）

代码块

linenumbers	true

systemctl disable firewalld

查看防火墙状态

代码块

linenumbers	true

systemctl status firewalld

1.1.2. 开启防火墙

2. Python计算机点单机部署

2.1. 安装前配置

注意

title	温馨提示

配置本地yum源，主机名映射，需要管理员权限。

① 配置本地yum源，参考文档：https://jingyan.baidu.com/article/fdbd4277a508e8b89e3f4807.html

注意

title	注意事项

Centos7.4 以上，可不设置本地yum源。

② 配置主机名映射

将数据挖掘组件中的服务器主机名映射到hosts文件中

代码块

language	bash

vi /etc/hosts

文件末尾添(根据实际环境信息设置)：

代码块

language	bash

10.10.204.248 10-10-204-248
10.10.204.249 10-10-204-249
10.10.204.250 10-10-204-250

③ 安装javva环境

解压jdk到指定目录：

代码块

language	bash

tar -zxvf jdk-8u181-linux-x64.tar.gz -C /data

添加环境变量

代码块

language	bash

vi /etc/profile

在文件末尾添加下面内容：

代码块

language	bash

export JAVA_HOME=/data/jdk1.8.0_181
export JAVA_BIN=$JAVA_HOME/bin
export CLASSPATH=:$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar
export PATH=$PATH:$JAVA_BIN

让配置生效

代码块

language	bash

source /etc/profile

验证安装

代码块

language	bash

java -version

2.2. 安装Python主程序

上传安装包到服务器的/data目录

① 安装依赖包

代码块

language	bash
linenumbers	true

rpm -ivh bzip2-1.0.6-13.el7.x86_64.rpm
yum install gcc

注意

title	注意事项

Centos7.4 以上，无需安装依赖包

② 安装Anaconda3并指定安装目录为/data/anaconda3

2.2.1. 安装Python

1、上传安装包到服务器

2、解压安装包至指定目录

代码块

language	bash
linenumbers	true

cdtar /data
chmod +x Anaconda3-2019.10-Linux-x86_64.sh
bash Anaconda3-2019.10-Linux-x86_64.sh -b -p /data/anaconda3

③

-zxvf python-3.9.13.tar.gz -C  /usr/local/

Image Added

3、配置环境变量

代码块

language	bash
linenumbers	true

vi /etc/profile

在末尾添加以下内容：

代码块

language	bash
linenumbers	true

export PATH=/data/anaconda3usr/local/python-3.9.13/bin:$PATH

使配置生效，查看python版本

代码块

language	bash
linenumbers	true

source /etc/profile
python --version

显示Python 3.7.4 表示安装成功。

2.3. 离线安装Python插件包

① 上传离线压缩包到服务器/data目录，并解压

2.2.2. 验证Python程序

1、查看python版本

代码块

language	bash
linenumbers	true

cd /data
unzip plugin.zip

② 批量安装

安装时需指定解压出来的目录“./plugin”和文件“requirements.txt”的路径

python --version

Image Added

2、查看pip版本验证

代码块

language	bash
linenumbers	true

cd /data
pip install --no-index --find-links=./plugin/ -r requirements.txt

2.4

-V

Image Added

3、pip查看安装插件列表

代码块

language	bash
linenumbers	true

pip list

Image Added

2.3. 部署数据挖掘引擎包

上传安装包到服务器，并解压到指定目录

代码块

language	bash
linenumbers	true

tar -zxvf SmartbiMiningEngine-V10.0.64186.21183.tar.gz -C /data

注意

title	注意事项

数据挖掘引擎包版本需要与Smartbi版本一致。

2.

5

4. 创建Python执行用户

注意

title	温馨提示

1、创建用户需要使用管理员权限，如果已经是普通用户执行部署操作，可以不用再创建用户。

创建用户组、用户并设置密码

代码块

language	bash
linenumbers	true

groupadd mining                   #创建mining组
useradd -g mining mining-ag       #创建启动用户(mining-ag)并指定用户组为mining
passwd mining-ag                  #设置mining-ag用户密

给引擎安装目录附权限(为了使用mining-ag用户启动执行代理程序时候，有权限创建agent-data跟agent-logs目录)

代码块

language	bash
linenumbers	true

chgrp mining -R  /data/smartbi-mining-engine-bin
chmod 775 -R /data/smartbi-mining-engine-bin

2.

6

5. 启动Python执行代理

① 浏览器访问Smartbi，打开系统运维–数据挖掘配置–引擎设置，复制Python代理器启动命令

注意

title	注意事项

复制Python代理器启动命令前，请确认数据挖掘引擎能正常测试连接成功

② 登录到部署Python节点机器，并切换到mining-ag用户

注意

title	注意事项

为了避免出现安全问题，一定要切换到mining-ag用户去启动执行代理服务，不要使用root用户安装或带有sudo权限的用户来启动执行代理服务ag用户去启动执行代理服务，不要使用root用户安装或带有sudo权限的用户来启动执行代理服务，因为执行代理服务是会去执行在界面上定义的python脚本，如果执行用户权限过大，会存在安全问题。

代码块

language	bash
linenumbers	true

su - mining-ag

进入引擎启动目录

代码块

linenumbers	true

cd /data/smartbi-mining-engine-bin/engine/sbin

把拷贝命令粘贴，并执行，例如：

代码块

linenumbers	true

./agent-daemon.sh start --master http://10-10-204-248:8899 --env python

若有换包更新数据挖掘版本，需要重启python代理

启动完成后可参考：测试数据挖掘及其组件运行数据挖掘实验

③停止python节点

登录到部署Python节点机器，并切换到mining-ag用户

注意

title	注意事项

为了避免出现安全问题，一定要切换到mining-ag用户去启动执行代理服务，不要使用root用户安装或带有sudo权限的用户来启动执行代理服务，因为执行代理服务是会去执行在界面上定义的python脚本，如果执行用户权限过大，会存在安全问题。

代码块

language	bash
linenumbers	true

su - mining-ag

进入引擎启动目录

代码块

linenumbers

2.7

true

cd /data/smartbi-mining-engine-bin/engine/sbin

把拷贝命令粘贴，并执行，例如：

代码块

linenumbers	true

./agent-daemon.sh stop

2.6. 运维操作

① 更新Python数据挖掘引擎包

Smartbi更新war包版本时，Python执行节点需要同步更新对应版本的数据挖掘引擎。

页面树结构

版本比较

旧版本 10

新版本当前版本

标识

1. 系统环境准备

1.1. 防火墙配置

2. Python计算机点单机部署

2.1. 安装前配置

2.2. 安装Python主程序

2.2.1. 安装Python

2.3. 离线安装Python插件包

2.2.2. 验证Python程序

2.

4. 创建Python执行用户

2.

5. 启动Python执行代理

2.6. 运维操作

页面树结构

页面历史

版本比较

旧版本 10

新版本 当前版本

标识

1. 系统环境准备

1.1. 防火墙配置

2. Python计算机点单机部署

2.1. 安装前配置

2.2. 安装Python主程序

2.2.1. 安装Python

2.3. 离线安装Python插件包

2.2.2. 验证Python程序

2.

4. 创建Python执行用户

2.

5. 启动Python执行代理

2.6. 运维操作

新版本当前版本