英伟达H20芯片解禁!还将推出新款中国特供版GPU
7月14日,英伟达新闻室发布恢复向中国销售H20芯片,并宣布推出全新完全合规的中国特供版GPU。
黄仁勋还向客户更新了最新进展,指出英伟达正在重新提交销售H20 GPU的申请,美国政府已向英伟达保证将发放许可证,公司希望尽快开始交付。最后,黄仁勋宣布推出一款全新完全合规的RTX PRO GPU,称其“是智能工厂和物流领域数字孪生人工智能应用的理想选择”。
H20芯片是英伟达为绕过美国出口管制、专门为中国市场定制的“降配版”AI加速器,虽性能不及H100或B100,但仍远超大多数国产GPU,且在大模型训练和推理场景中拥有实战价值。4月,美国政府叫停专为中国市场研发的H20芯片出口许可,导致英伟达超百亿美元的损失。黄仁勋曾多次强调中国市场的重要性。根据英伟达最新的年度报告,在截至2024年1月26日的财年中,中国市场为其创造了170亿美元的营收,占其总销售额的13%,是英伟达实现增长的关键市场。
有消息称,H20替代版B30在性能再度缩水之后将于9月发售,其FP16性能大致在80出头,FP8接近200出头,互连带宽约为1.5–1.6TB。从整体性能看,B30显然并不适合用于训练,虽然H20勉强还能用于训练(比如靠内存解决方案、FP8精度以及传统方法),尚非完全不可行,但B30的训练能力较弱。在模型推理方面,例如图像、语音等当前主要应用,可能还有部分文本模块推理,B30具备一定确定性,尤其是未来整合多模态处理(图像、语音、视频)等方向上。
值得注意的是,随着机架式方案逐渐出现,类似互连架构的推理部署方案成为一个不错的选项,但是GB30的情况尚不明确,机架式方案的实际推进时间也未可知,仍存在较多不确定性。目前最合理的方向,仍是推动算力租赁,如果算力租赁全面放开,将是未来公司算力供给架构的重大转变。
因而,对比B30的不确定性,一旦H20确认出口放行,不仅将为英伟达在华业务打开重要缺口,为英伟达业绩增长带来强劲动能,还可缓解中国AI大模型企业的算力焦虑。

加入微信
获取电子行业最新资讯
搜索微信公众号:EEPW
或用微信扫描左侧二维码