页面树结构

版本比较

标识

  • 该行被添加。
  • 该行被删除。
  • 格式已经改变。

...

○ 建议⽣产显卡⽤:A100A800H100H800 (显卡可买多张)。

○ 显卡配置相关补充:(价格预计20-50万每张,具体硬件客户⾃⼰采购,50万每张,具体硬件客户⾃⼰采购,采购可能需考虑美制裁管控后对公⽆法购买的问题)。

采购可能需考虑美制裁管控后对公⽆法购买的问题)。

型号

H100 80GB SXM5

H800 80GB SXM5

H100 80G PCle

H800 80G PCle

A100 80GB SXM5

A800 80GB SXM5

A100 80G PCle

A800 80G PCle

应用场景

  AI/HPC科学计算HPC   科学计算

AI

AI/HPC

科学计算

AI

  AI/

HPC

HPC   科学计算

科学计算

  AI/

HPC

HPC   科学计算

科学计算

AI/HPC

科学计算

AI/HPC

科学计算

GPU架构

Hopper

HopperHopperHopperAmpereAmpereAmpereAmpere

GPU核心版本

GH100GH100GH100GH100GH100GH100GH100GH100
单精度浮点核心(CUDA Core)168961689614592145926912691269126912
显存容量80GB HBM380GB HBM380GB HBM2e80GB HBM2e80GB HBM2e80GB HBM2e80GB HBM2e80GB HBM2e
显存带宽3.35TB/s3.35TB/s2TB/s2TB/s2039GB/s2039GB/s1935GB/s1935GB/s

NVLink

NVLink 4.0 NVSwitch 900GB/s

NVLink 4.0 NVSwitch 400GB/sNVLink bridge 600GB/sNVLink bridge 400GB/sNVLink 3.0 NVSwitch 600GB/sNVLink 3.0 NVSwitch 400GB/sNVLink bridge 600GB/sNVLink bridge 400GB/s
张量运算核心(Tensor Core)528(4代)528(4代)456(4代)456(4代)432432432432
光线追踪核心(RT Core)--------





性能指标
(PEAK)

FP64浮点(TFLOPS)341260.89.79.79.79.7
FP32浮点(TFLOPS)6760515119.519.519.519.5
FP64 Tensor Core (TFLOPS)6760515119.519.519.519.5
TF32 Tensor Core (TFLOPS)989989756756156156156156
BF16 Tensor Core (TFLOPS)1979197915131513312312312312
FP16 Tensor Core (TFLOPS)1979197915131513312312312312
INT8 Tensor Core (TFLOPS)3958395830253025624624624624
INT4 Tensor Core (TFLOPS)----1248-12481248
最大功耗700W700W350W350W400W400W300W300W

...

AIChat是采用docker容器部署的

❖ 该组件基础软件环境要求

     ➢ 系统 :Linux 64-bit Ubuntu 20.04,AI机器学习系统⼀般使⽤Ubuntu

...

    ➢ Docker容器:⽀持docker19.03 以上docker-compose 1.24.* +

    ➢ Nvidia-docker2: 要求版本 2.13.0 +

...