页面树结构

版本比较

标识

  • 该行被添加。
  • 该行被删除。
  • 格式已经改变。

...

注意
title文档环境

集群部署数据挖掘组件环境如下:

服务器IP主机名组件实例部署目录
10.10.35.6410-10-35-64数据挖掘-1,Zookeeper-1,Python-1/data
10.10.35.6510-10-35-65数据挖掘-2,Spark-1Hadoop-1/data
10.10.35.6610-10-35-66Spark-2,Zookeeper-2,Hadoop-2/data
10.10.35.6710-10-35-67Spark-3,Zookeeper-3Hadoop-3,Python-2/data
10.10.204.25010-10-204-250Smartbi-Proxy/data


1、系统环境准备

1.1防火墙配置1 防火墙配置

为了便于安装,建议在安装前关闭防火墙。使用过程中,为了系统安全可以选择启用防火墙,但必须启用服务相关端口。

1.关闭防火墙

临时关闭防火墙临时关闭防火墙(立即生效)

代码块
languagebash
linenumberstrue
systemctl stop firewalld

永久关闭防火墙永久关闭防火墙(需重启后生效)

代码块
languagebash
linenumberstrue
systemctl disable firewalld

...

代码块
languagebash
linenumberstrue
systemctl status firewalld

2.开启防火墙

相关服务及端口对照表:

服务名需要开放端口
Hadoop

9864,9866,9867,9868,9870,9000

如果确实需要打开防火墙安装,需要给防火墙放开以下需要使用到的端口
开启端口:9864,9866,9867,9868,9870

...

代码块
languagebash
linenumberstrue
sed -i 's/=enforcing/=disabled/g'  /etc/selinux/config

1.2取消打开文件限制2 取消打开文件限制

修改/etc/security/limits.conf文件在文件的末尾加入以下内容:

...

代码块
languagebash
export JAVA_HOME=/data/jdk1.8.0_181


Image Modified

找到"export HDFS_NAMENODE_OPTS", 在下面添加一行

代码块
languagebash
export HDFS_NAMENODE_OPTS="-XX:+UseParallelGC -Xmx4g"

Image Modified

添加启动用户, 在文件最后添加以下内容

代码块
languagebash
export HDFS_DATANODE_USER=root
export HDFS_NAMENODE_USER=root
export HDFS_SECONDARYNAMENODE_USER=root

Image Modified

注意
title关于启动用户

启动用户可根据实际环境替换成实际的用户名

...

代码块
languagebash
10-10-35-65
10-10-35-66
10-10-35-67

Image Modified

将Hadoop安装包分发到其他节点

...

①在浏览器输入: http://Hadoop管理节点IP:9870/dfshealth.html#tab-overview    检查集群状态

Image Modified

Image Modified


②检查mining目录是否创建成功

代码块
languagebash
hdfs dfs -ls /    #显示创建的/mining即表示创建成功

Image Modified

2.5 运维操作

在管理节点执行(10-10-35-65).

...