数据中心加速器芯片年增50%,Achoronix联手BittWare推出FPGA加速卡

嵌入式系统   作者:王莹 时间:2019-11-07来源:电子产品世界

数据中心加速器的芯片市场预测

数据中心市场的加速芯片主要包括CPU、GPU、FPGA和ASIC等。据Semico Research于2019年5月的预测,从2018年到2023年的5年间,数据中心加速器市场预计将从28.4亿美元增长211.9亿美元,年均增长率为49.47%。其中,FPGA预计将是年均增长率最高的细分市场(如下图),该增长将由企业级工作负载加速应用驱动。

1573118545227812.png

数据加速可以分成计算、网络和存储三大类。有一部分是GPU可以做的,但是另外很大一部分更适合于用FPGA来做加速。

业界普遍认为的性能对比显示,相比于传统CPU,FPGA提升的性能是10~100倍,倍数变化主要来自不同的应用。不仅如此,在提高性能的同时,FPGA的功耗也会大幅降低。

从市场上来看,这几年FPGA加速卡的应用越来越多。从下图右可以看出,FPGA加速卡和服务器是新的技术,目前正处于上升期。

1573118579776761.png

业界的Tier 1客户,诸如亚马逊和微软的数据中心在二三年前就已经把FPGA加速方案用到他们的数据中心。只不过因为他们是Tier 1,工程师资源和软件都有雄厚的实力,所以可以把芯片直接做进服务器主板里,即嵌入到他们的硬件系统中。但是对于很多Tier 2和Tier 3的OEM(生产商),或一些小型的数据中心及纯做软件的客户,并不具备这样的工程资源,所以可以通过采购基于标准的PCIe接口的FPGA加速卡,快速地部署到自己的业务和应用中。

数据中心部署FPGA加速方案有很多好处。①效率方面,FPGA相对于GPU和CPU有更高的能效比。②FPGA可以根据客户的特殊需求重新配置。③FPGA加速卡可以快速部署,使客户的实验室应用快速地推向市场,而无需把更多的精力和资源放在底层的开发上。④对于hyperscaler(超大规模厂商),也可以做大规模的部署。

采用Speedster7t独立FPGA芯片的VectorPath加速卡

2019年10月,基于FPGA的数据加速器件和高性能嵌入式FPGA(eFPGA)半导体知识产权(IP)的领导性企业Achronix半导体公司,与Molex旗下的一家领先企业级FPGA加速器产品供应商BittWare联合宣布:推出面向高性能计算和数据加速应用的FPGA加速卡。

1573118666713177.png

新推出的VectorPath S7t-VG6加速卡搭载了Achronix采用7nm工艺打造的Speedster7tAC7t1500独立FPGA芯片,它在同类PCIe FPGA加速卡中,提供了目前业界最高性能的接口。这些高性能接口包括1x400GbE和2x100GbE接口,以及总带宽为4Tbps的8组GDDR6的板上存储器,使该加速卡成为高带宽数据加速应用的理想选择。

为此,Achronix市场营销副总裁Steve Mensor和Molex副总裁Sam Bichara向电子产品世界记者介绍了其特色。

1573118695749293.png

图 从左至右:Achronix市场营销副总裁Steve Mensor,Molex副总裁Sam Bichara

VectorPath加速卡是基于Achronix新一代的7t的高性能,针对高带宽优化的一个FPGA。优势有两点:①二维的高速片上网络,②针对人工智能、机器学习优化的MLR单元(如下图)。

1573118731569161.png

因此,数据中心开发人员可以不用关注硬件,只要采用现成可用的硬件,加上自己的软件、算法就可实现应用,这样就可以大大加速部署和开发。

Achronix的合作伙伴BittWare非常有实力:有约30年的FPGA加速卡的设计和生产制造经验,于2018年被Molex收购,成为更大规模公司——Molex的子公司,可以充分利用Molex更广阔的技术支持和销售团队服务客户。

VetcorPath加速卡所具有的功能

VectorPath加速卡系专为高性能和高带宽数据应用而设计,具有以下硬件功能:400GbE QSFP-DD和100GbE QSFP56接口;8组GDDR6存储器可提供4 Tbps的总带宽;1组带有错误检查和纠正(ECC)功能的、运行频率为2666MHz的DDR4存储器;Speedster7t FPGA芯片集成了带宽为20 Tbps的二维片上网络(NoC);692K的6输入查找表(LUT);40K Int8 MAC提供高于80 TOps的算力;OCuLink – 用于连接扩展卡的4通道PCIe Gen 4连接器。

VectorPath加速卡包括一整套Achronix的ACE开发工具,以及BittWare的基板管理控制器和开发工具包,其中包括API、PCIe驱动程序、诊断自测和应用示例设计,以提供快速的、开箱即用的体验。

TeraBox FPGA服务器

TeraBox是基于FPGA的服务器(如下图)。在过去BittWare注意到,客户在买独立的FPGA芯片,或者是基于FPGA板卡的加速卡时,独立的板卡放在服务器中进行设计,但是对于很多Tier 2、Tier 3甚至更小的客户,没有时间、精力以及工程资源去把FPGA卡给集成到服务器中,因此有一部分客户需要更高的集成,这样客户只需简单的配置就可以应用起来。

1573118788192859.png

TeraBox主要有两大类客户,一类是有特殊需求的客户,他需要把上层软件快速部署到业务中,或客户需要快速地去展示他们的软件。另一类是对于一些IT经理,他的技术水准不是那么深,因此无需关注底层,还可以降低风险,同时可以简单部署,缩短整个业务的上线时间。

采购TeraBox的另一优势是:传统的FPGA加速卡,一般只提供一年的质保和技术服务,但是服务器一般是3年。

与竞品的差异化

除了Achronix之外,另外两大FPGA厂商此前已推出了加速卡;2019年下半年,两大FPGA厂商忙于发布各自的“统一软件开发平台”,Achronix有类似的软件平台产品吗?

实际上,竞品的芯片不仅有FPGA、处理器(Arm SoC),还有另外的处理器(例如AI引擎)等。例如AI引擎,X公司的AI引擎底层是Synopsys公司的矢量处理器,但是这种矢量处理器跟Arm CPU是不同架构的处理器,再加上外部的高速接口,客户要面对3种不同的硬件底层。

“统一软件平台”从表面上看是用同一个软件的思维去开发,但是作为开发者,处理数据时要考虑哪部分放在FPGA里,哪部分放在CPU里,哪部分放在AI引擎/矢量处理器;另外要考虑互相之间的数据怎样去流动,而不是只是简单的有一个工具让你去用。因此,怎样让设计者很好地利用你的架构,对于软件工程师是非常有挑战的。

对于Achronix而言,走的是另外一个方向:对传统的FPGA做了很多优化,诸如二维的高速网络;另外,为了提高算力,虽然名字叫机器学习处理器(MLP),但它不是处理器,它实际上最底层是一种乘累加阵列(MAC,如下图),是硬件。所以所有底层的思维还是硬件的思维。

1573118835323881.png

图 MLP架构:专为计算密集的人工智能/机器学习(AI/ML)应用而优化的Speedster7t

当然Achronix也有开发工具,但是整个底层架构是硬件架构,没有不同类型的单元。Achronix的开发思路是让原有的FPGA工程师很容易地去用Achronix的平台,而且Achronix的平台性能有大幅的提升,甚至软件工程师通过Achronix的工具也可以很容易去用这个硬件平台。

总之,Achronix的思路是延续传统模式,在传统模式上做进一步的优化。即硬件软件化——有很容易用起来的硬件,好像用软件一样。例如Speedster7t的二维片上网络(如下图),让整个的硬件的设计,更像软件的思维去做。

另外,关于竞品的加速卡,例如I公司,采用的存储是HBM2,而Achronix采用的是GDDR6,特点是速度快,同时价格便宜(相对于目前业界通用的HBM2,价格会便宜很多),而且HBM2实现起来也比较复杂,需要封装到FPGA上,制造也比较困难。

1573118865283508.png

上市时间和售价

VectorPath现在就可以接受订单,预计在2020年第2季度发货到客户。在客户拿到这个加速卡之前,客户现在就可以开始做开发。加速卡的价格是7500美元。

总结

对于数据中心、边缘计算等需要计算加速的领域,整个硬件加速市场正在快速增长,CPU已经赶不上性能的需求,FPGA是一种高效选择。

除了极少数超大数据中心有能力和用量可支撑自己建立FPGA团队,包括硬件团队去开发加速卡以外,绝大部分的Tier 2或Tier 3需要去外部采购加速卡,包括相应的底层软件。因此,FPGA厂商纷纷祭出FPGA加速卡。Achronix和BittWare联手推出了采用Speedster7t独立FPGA芯片的VectorPath加速卡,可以快速部署,简单易用。相比竞品,VectorPath还具有超高性能的特点。

1573119714916133.png

关键词: FPGA 加速卡

加入微信
获取电子行业最新资讯
搜索微信公众号:EEPW

或用微信扫描左侧二维码

相关文章


用户评论

请文明上网,做现代文明人
验证码:
查看电脑版