1、硬件建议

LLM⼤模型基座组件

❖ 该组件推荐硬件配置要求

CPU:X86架构,建议跟随GPU显卡去调配CPU等硬件最低配置

组件配置CPU内存硬盘
大模型最低配置X86架构 32核128G1TB+

GPU(重点关注):

配置显卡
最低配置8*4090 24G
推荐配置2*A100 80G

2、操作系统及环境要求

1.1. 服务器配置清单

注意:小模型版本-目前已经暂停发布小模型版本

组件配置CPU内存硬盘

AIChat核心服务

最低配置

X86架构 16核

32G

1TB+

推荐配置X86架构 32核128G1TB+

(1) 服务器CPU要求支持AVX指令集,否则无法安装 TensorFlow;

(2) 由于 arm64 所使用的指令集缺少对 docker 和深度学习的支持,因此不支持 arm64架构 的CPU,仅支持X86架构的CPU

(3) 不建议将AIChat 和 Smartbi 部署在同一台服务器上,由于 NLA 对计算和内存资源的使用量均较高,会抢占资源导致卡顿、死机、进程被杀死等问题。

(4) 当服务器配置为推荐配置时,即32核128GB。并发数推荐为30个左右,最高不应超过40个。

30用户并发情况(每用户登录5次,每次登录执行5次查询)(不同大模型表现不一样,对速度会有很大影响;查询内容不同,也会影响大模型响应时间)

1.2. 系统环境要求

AIChat是采用docker容器部署的

因此服务器的系统环境需要支持 docker24.02及以上 和 docker-compose 2.21.0 +

以下系统版本支持部署 AIChat:

操作系统

系统

版本

Ubuntu操作系统

Ubuntu

Ubuntu-16.04.3以上

CentOS操作系统Centos

CentOS-7以上

银河麒麟操作系统KylinOS

KylinOS-10以上

1.3. Smartbi版本要求

 版本要求

License

Smartbi V11 及以上

License 需要包含“自然语言分析”相应权限

具体Smartbi的环境可参考准备操作系统

1.4. 第三方组件版本要求

AIchat的组件内置了mongodb, mysql, redis,如何需要替换为云服务,版本要求如下:

 组件

版本要求

Mysql

>=5.7
Redis>=5.0
mongodb>=4

3、默认开通端口

单节点:

服务名端口
AIChat9060、9081


集群:

服务名端口

AIChat

9060、9081

Docker Swarm

2377、2376、5000、7946、4789、5001

GlusterFs

24007、24008、24009、49152、49153、49154、49155、49156、38465、38466、38467、111