陈立武:英特尔将在AI硬件上与英伟达竞争

智能计算 时间:2025-04-01来源:半导体产业纵横

据报道,英特尔新任 CEO 陈立武在最新提交的年报中表示,「我们无疑须开发具竞争力的机柜级系统解决方案,借此强化云端 AI 数据中心的市场地位,这将是我跟团队的优先要务。」

据悉,陈立武瞄准的竞争产品,是英伟达目前最顶级的 GB200 NVL72 Blackwell AI 系统。一名英特尔前高层曾表示,英伟达这套系统是 AI 计算领域的「终极掠食者」(apex predator)。GB200 NVL72 在一台服务器机柜内部连接了 72 颗 GPU,远多于上一代的 8 颗 GPU,能在有限空间内提供前所未见的算力密度。

目前,英伟达在 AI 数据中心市场居于霸主地位,占据接近 90% 的 AI 芯片市场份额。AMD 在 2024 年也实现了超过 50 亿美元的 AMD Instinct 加速器收入。相比之下,英特尔在 AI 市场的表现却欠佳。

2024 年 10 月,英特尔公司就曾坦承旗下 Gaudi 系列 AI 加速器无法达成之前设定的 2024 年 5 亿美元营收目标。今年 1 月,英特尔新一代 AI 数据中心产品「Falcon Shores」被传难产,将转而研发另一款 AI 数据中心解决方案「Jaguar Shores」。

无法达成预期营收的 Gaudi

Gaudi 系列 AI 加速器是英特尔推出的用于人工智能计算的产品。2024 年 4 月,英特尔宣布将推出 Gaudi 3 AI 加速器,其在芯片架构和性能提升方面的表现受到外界关注。

相较于上一个版本 Gaudi 2,Gaudi 3 制造工艺从台积电 7nm 升级到台积电 5nm,MME(矩阵乘法引擎) 从 2 个增加到 8 个,虽然每个 MME 内部的 TPC(张量处理核心) 从 12 个减少到 8 个,但是总数从 24 个大幅增加到了 64 个,媒体解码器差从 8 个增至 14 个,内置 SRAM 缓存容量翻番至 96MB,带宽翻倍至 12.8TB/s。

核心性能方面,MME BF16/FP8 都是 1835 TFlops,矢量 BF16 则是 28.8 TFlops,分别提升了 3.2 倍、1.1 倍、1.6 倍。HBM2E 高带宽内存容量从 96GB 增加到 128GB(八颗),带宽也顺应增加来到惊人的 3.7TB/s。24 个 200Gb RDMA 网络接口,双向网络互连带宽 1.2TB/s,主机接口峰值双向带宽 128GB/s,系统总线升级为 PCIe 5.0 x16。

按照官方说法,Gaudi 3 对比 NVIDIA H100,LLM 大模型推理性能领先 50%、训练时间快 40%,性价比则是对手的 2 倍。在产品推出的同时,英特尔就宣布 Supermicro 和 Dell 等主流服务器供应商已经开始支持 Gaudi 3 系统,并且与 IBM 展开全球合作,IBM 的 watsonx AI 和数据平台中将率先支持 Gaudi 3。

英特尔对 Gaudi 3 未来发展充满信心。同月,英特尔发布财报预计 Gaudi AI 芯片产品线将带来 5 亿美元销售收入。但可惜结果并不乐观,稍后在 2024 年第三季度财报电话会议上,英特尔首席执行官帕特・盖辛格表示,尽管 Gaudi 3 加速器已于本季度推出,但因产品从 Gaudi 2 向 Gaudi 3 的过渡以及软件易用性问题影响了采用率,整体市场接受度低于预期,无法实现 2024 年 Gaudi 收入达到 5 亿美元的目标。

永远停留在实验室阶段的 Falcon Shores

Falcon Shores 是英特尔下一代 GPU,并将整合英特尔 Gaudi 的技术。但 Falcon Shores 从设计到量产,一路都很坎坷,最后甚至被取消。

起初,Falcon Shores 设计规划是 XPU,集成 x86 架构 CPU 与 GPU,但是这一设计面临致命缺陷,CPU 模块性能不足且功耗过高,无法与 AMD Instinct MI300A 等竞品竞争。2023 年,英特尔被迫放弃 XPU 方案,转向纯 GPU 架构,导致开发周期延长。

Falcon Shores 与台积电合作,运用 3nm 和 5nm 工艺生产,并结合 CoWoS 先进封装技术,这既提升了芯片性能与集成度,又提高了生产效率与产品质量。该 GPU 预计集成 288GB 的 HBM3 内存,运行速度可达 9.8TB/s 吞吐量,还支持 FP8 和 FP16 浮点精度,能满足 AI 及其他工作负载的不同精度计算需求。

Falcon Shores 原本计划于 2024 年推出,但后来推迟到 2025 年。2025 年 2 月,在财报电话会议上,英特尔临时联合 CEO Michelle Johnston Holthaus 透露,原计划于今年推出、旨在结合 Intel Xe 图形能力和 Gaudi AI 性能优势的 Falcon Shores 项目将永远停留在实验室阶段。「我们计划仅将 Falcon Shores 用作内部测试芯片,不会推向市场。」

全力押注机架级解决方案 Jaguar Shores

在经历一系列挫折之后,英特尔重新评估了其战略,认为与其推出单一芯片,不如整合 Gaudi 加速器、Xeon CPU 和网络技术,打造 Jaguar Shores 机架级解决方案。

Jaguar Shores 由 Habana Labs 主导开发,采用 Intel 18A 工艺与背面供电技术,强调机架级优化。其放弃了 Falcon Shores 的纯 GPU 路线,转向混合架构,可能集成 Gaudi ASIC 与 Xe-HPC GPU 技术,兼顾通用性与 AI 加速。其中,Falcon Shores 部分技术(如液冷设计、CoWoS 封装)将被移植到 Jaguar Shores。

根据规划,英特尔将在 2025 年推出 Jaguar Shores 样品,2026 年量产,未来 Jaguar Shores 会替代 Gaudi 3 成为英特尔 AI 数据中心主力产品,与英伟达 GB200 NVL72 展开竞争。

关键词: GPU

加入微信
获取电子行业最新资讯
搜索微信公众号:EEPW

或用微信扫描左侧二维码

相关文章

查看电脑版