FuriosaAI携手博通联合研发推理芯片
推理芯片厂商FuriosaAI已与博通(Broadcom)达成合作,共同研发第三代人工智能加速器,这款新品预计将于2028 年上半年开始送样。
本次合作将 Furiosa 自研的张量收缩处理器(TCP)架构升级为多裸片芯粒系统,打造专为全球超大规模算力集群高并发 Token 处理需求设计的 AI 推理引擎。
双方将融合 Furiosa 的 AI 芯片架构,以及博通的 AI 网络产品与以太网交换机技术,搭建一体化推理平台,兼顾架构创新与基础设施技术优势。
此次合作基于 FuriosaAI 现役数据中心推理芯片RNGD展开。该芯片目前已实现量产,采用台积电 5 纳米工艺制造,功耗 180 瓦,基于 PCIe 接口,专为大语言模型与智能体 AI 等高负载场景打造。
三星 SDS、LG 人工智能研究院等行业头部企业已在实际业务环境中完成对 RNGD 的落地验证,证明 TCP 架构在常规风冷数据中心场景下具备出色的运行效率。
RNGD 在功耗受限的条件下,实现了高吞吐与低延迟表现,也为双方联合研发的第三代平台奠定了架构基础。
博通半导体解决方案事业部总裁查理・卡瓦斯博士表示:“如今,推理性能不再单纯取决于原始算力,服务器与机柜间的数据复用效率、通信效率愈发关键。我们将 Furiosa 的 TCP 架构,与博通业内领先的异构处理器技术、知识产权平台、以太网扩容及交换网络相结合,打造全新平台,攻克大规模智能体 AI 场景中的核心性能瓶颈。”
Furiosa 新一代芯片将采用2 纳米计算裸片,搭配第四代高带宽内存(HBM4/HBM4E),并依托博通先进封装技术,将多颗裸片集成为高性能片上系统。
芯片集成博通以太网与 PCIe 技术,可在超大型 AI 算力集群中实现机柜级高带宽网络互联。
Furiosa 联合创始人兼首席执行官白俊(June Paik)表示:“结合博通的基础设施技术、Furiosa 的张量收缩处理器架构以及行业标杆级软件栈,我们得以跳出单一芯片的局限,面向Token 工厂时代提供全栈解决方案。”
“基于已量产的第二代芯片 RNGD,我们充分验证了自研架构的性能与能效优势。接下来推出的第三代推理方案,将面向超大型、高复杂度前沿 AI 模型及智能体任务,打造业界领先的每瓦性能表现。”
该芯片针对高强度模型后训练采样等严苛的实际 AI 负载完成专项优化。不同于 GPU 侧重线程调度的设计思路,这款芯片以高带宽数据流转为核心,相较当前主流 GPU,可实现更高的能效比与 Token 处理密度。
Furiosa 配套完整软件栈,帮助开发者快速完成部署,满足严苛的吞吐与延迟指标,同时可便捷适配各类前沿新模型与优化方案。
传统平台每迭代一款新模型,都需要对计算内核进行大量手动调优;而 Furiosa 软件开发工具包(SDK)搭载通用编译器,可将高层级 PyTorch 代码自动映射至硬件执行。若开发者需要更精细化的控制,Furiosa 虚拟指令集(Virtual ISA)提供声明式编程模型,既能实现硬件管控,又规避了传统 GPU 编程中存在的不确定性与复杂问题。
加入微信
获取电子行业最新资讯
搜索微信公众号:EEPW
或用微信扫描左侧二维码