华为将推出 CloudMatrix 384,据称可提供 2× NVIDIA GB200 NVL72 吞吐量
据经济日报报道,华为计划于 2025 年世界人工智能大会(WAIC)首次推出其 CloudMatrix 384 系统,该大会将于 26 日在上海开幕。正如 Tom’s Hardware 所强调的那样,CloudMatrix 384 是一个机架级 AI 系统,由 384 个 Ascend 910C 处理器组成,通过全光、全互连的网状网络互连。
尽管单个 Ascend 910C 芯片的性能仅约为 NVIDIA Blackwell 的三分之一,但报告指出华为通过在每个系统中部署大量芯片来弥补这一限制。这种方法使 CloudMatrix 384 实现了约 300 PFLOPs 的密集 BF16 计算能力——几乎是 NVIDIA GB200 NVL72 的两倍,该报告强调后者提供约 180 PFLOPs。
Tom’s Hardware 还指出,该系统提供了 2.1 倍的内存总带宽和超过 3.6 倍的高带宽内存(HBM)容量,同时依赖于 HBM2E 内存。
同时,与依赖铜线互连的传统系统不同,CloudMatrix 使用全光基础设施进行机架内和机架间的通信,从而实现极高的总带宽。CloudMatrix 384 是一款可扩展的企业级系统,配备容错功能,适合高要求的 AI 工作负载,正如 Tom’s Hardware 所指出的。
CloudMatrix 384 的效率挑战
然而,它的效率较低:每 FLOP 功耗是 NVIDIA 解决方案的 2.3 倍,每 TB 内存带宽效率是 1.8 倍,每 TB HBM 内存效率是 1.1 倍,正如 Tom’s Hardware 所述。尽管如此,Tom’s Hardware 指出,在中国,能源丰富但先进硅片获取有限,华为的人工智能战略似乎与当地条件非常契合。
正如 Igor’s Lab 引用 Financial Times 所指出的,CloudMatrix 384 的单价为 800 万美元。其高昂的价格和巨大的功耗需求使得中小企业难以负担。因此,该系统预计将主要作为大型企业的优质解决方案。报告还称,据报道已有十家中国主要企业采用了该系统,并将其集成到现有的数据中心基础设施中。

加入微信
获取电子行业最新资讯
搜索微信公众号:EEPW
或用微信扫描左侧二维码