英伟达:要取代我?其实CUDA也支持RISC-V
第五届RISC-V中国峰会于2025年7月16至19日在上海张江科学会堂隆重举办,在峰会的圆桌讨论中,主持人曾经提出这样一个问题:你认为RISC-V未来会取代GPU吗?在现场观众投票中,支持会取代的现场观众占据将近半数。不过在随后的主题演讲中,英伟达副总裁 Frans Sijstermanns特别提到了英伟达在自家的计算平台实现了RISC-V应用处理器部署。
在做这次演讲准备的时候,Frans Sijstermanns会议自己参加过的由上海交通大学和英伟达联合举办的“2017年RISC-V工作坊”,当时是北美地区以外第一个RISC-V的工作间。英伟达作为目前高性能计算架构的领导者,CUDA是英伟达成功的关键之一, CUDA是C语言和C++语言的拓展,现在CUDA只在x86和Arm上得以部署,还没有在RISC-V上面部署,但是Frans Sijstermanns表示,英伟达也正在向外界传达一个信息——我们要将CUDA也移植到RISC-V的架构上。
CUDA包含两个组成部分:一是Toolkit(工具箱),二是驱动器。CUDA的Toolkit像是一个编译器一样,它有非常好的编译功能。将CUDA移植到RISC-V,这个部分我们现在是正在做这样的一个移植工作。比如一个完整的应用运行,有应用软件、还有第三方的软件、还有OS系统。OS系统就是一个很好的例子,在这个图表当中就是用的PyTorch作为例子,还有CUDA KMD、还有CUDA UMD。英伟达现在正在做绿色部分的移植,此外还有第三方的软件或者是应用软件,当然也是需要进行移植到RISC-V。
CUDA库也是非常重要的,在所有的行业中可能都需要有自己的一个库。比如说英伟达有一个FT的库能够加速推理,与此同时我们还有相关的数据分析库等等。还有加速芯片制造的库,甚至还有相关的一些不同行业和垂类的这些库。英伟达在这一行业已经深耕了20年之久,建立了900多个不同的库。通过加速不同的行业技术发展日新月异这就是我们的目标,有了RISC-V之后我们就能落地所有的这些库,与此同时能够让大家更快的创新方式进行相关的设计及技术迭代。
我们现在面临的各种各样的挑战有哪些?RISC-V在过去几年中实际上是实现了非常长足的进展,比如说2022年大家已经用了非常多的RISC-V,在2025年至少有10个新的规格已经自2022年开始得到了获批,很重要的一点无疑就是RVA23,同时服务器SoC也获批了,这就是英伟达的进展过程。在软件层其实英伟达也取得了非常多的进展,如果看一看RISC-V国际基金会官网会看到其中有75个不同的软件包,其实它们都已经在RISC-V上面进行“运行”了。像Linux这样的一些操作程序这是非常重要的,甚至于一些工具链其实都已经推出。所有的这些还包括数据库网络虚拟机等等,他们所有的这些其实都完成了,但是无论怎么样我们在这方面可能还需要进一步的改善和微调,只有这样英伟达才能够更好的把所有的这样一些软件包给推出来,甚至有必要会进行相关的补丁。的确英伟达在这方面取得了长足的进展,为此Frans Sijstermanns也想感谢整个RISC-V组织及生态合作伙伴,其实他们真的是做了一些非常重要的基础性工作。比如说像一些编译器的工作、模拟的工作、工具链的工作,只有他们的工作做到位了我们才能够进一步的发展。
现在英伟达遇到的问题是什么呢?就是它的可用性,或者说整个CPU的板卡使用,对于CUDA版可能要进行相关的开发,不仅要有CPU、还要有相关的GPU。比如用到阿里巴巴C920,其实对于英伟达而言在开发层面已经很好了,现在还没有对标RVA23或者是刚刚获批的SoC,在这一方面英伟达可能会需要统一的虚拟内存,这是非常重要的。只有这样才能够进一步的去分享CPU和GPU内存之间的这样一些数据,甚至在这两者之间进行数据的复制和粘贴,并且保证一致性,英伟达需要保证通过所有的抓手整体的用户体验是非常好的。还有我们这样的一个虚拟监管器同样也会需要我们进一步去进行改善,无论怎么样通过不断的改善我们的板卡、我们能够最终去落地这样一些RVA23相关的一些技术的细节和规格。
现在英伟达要做的是什么呢?就是现在和整个生态系统中的合作伙伴精诚合作,希望能够把CUDA进行进一步的改善。当然了,与此同时我们也会希望把这样一个标准文本的CUDA版本推出来同样兼容RISC-V,只有这样才能够更好的符合服务器的平台规范及Linux操作系统的RISC-V标准。英伟达会希望整个CPU去进行相关的开发,把所有的这些问题在整个系统中移除解决之后再进行发布。当然了,我也会希望和大家共同合作,也倡导大家去倾力协作。
还有一点就是NVLink Fusion。这是完全基于英伟达组件的,并且有CPU、还有相关的GPU,因此CPU、GPU都提在这里了。与此同时,英伟达还有非常多的组件及网络,以及转接的开关处理器,甚至还有相关的软件集成在其中,因此是一个非常完整的设计了。英伟达正在做一种整合即希望能够用加速器去取代GPU或者是用相关的RISC-V去替代CPU。比如大家看一看如果有一个好的CPU的话,英伟达会需要有一个比较整合式的架构能够让整个数据中心能够更好的去工作、更加快速的工作。
Frans Sijstermanns总结英伟达对RISC-V的兼容进程:整个英伟达业务聚焦于加速计算,其实不在乎CPU具体是什么,无论是x86、Arm或者是RISC-V,英伟达都能够兼容这些。但是英伟达理解的一点,就是要让人们和用户开发者有自己的选择。CUDA能够很好的帮助英伟达去跟RISC-V服务器借助英伟达通信处理器实现加速,并且更好的提出相关的全套硬件解决方案,当然在这方面有非常多的工作要做。

加入微信
获取电子行业最新资讯
搜索微信公众号:EEPW
或用微信扫描左侧二维码