华夏芯推出全新架构的人工智能专用处理器内核

智能计算 时间:2018-05-04来源:电子产品世界


作者/华夏芯(北京)通用处理器技术有限公司创始人、董事长 李科奕

2016年7月,人工智能首次纳入《“十三五”国家科技创新规划》;2017年7月20日,国务院印发《新一代人工智能发展规划》,将人工智能上升国家战略,2018年李克强总理在政府工作报告中,进一步强调“产业级的人工智能应用”。短短2年之内,伴随数据、计算力、算法和网络设施等快速迭代,人工智能已成为中国经济发展新旧动能转换的重要引擎。安防领域一直被认为是人工智能最先落地的行业,随着国内“智慧城市”、“平安城市”的不断建设,在大数据、深度学习等技术的支撑下,安防向城市化、综合化、主动安防方向发展,智能安防成为当前发展的主流趋势,产业规模空前庞大。之前制约高清安防产业发展的云端AI功耗大、实时性不强、缺乏安全保障等网络瓶颈问题都在悄然缓解,智能安防正在演变为智能、高清、无线、预警等相互融合、协调发展的多种形态的综合产业。

除开智能安防行业,智能驾驶正在成为另一个高速发展以及炙手可热的人工智能的典型应用场景。目前汽车产业呈现的“新四化”(即电动化、网联化、智能化、共享化)给人工智能的计算、存储、数据和通信等方方面面都带来了巨大挑战,车用数据处理量呈指数型增长,车载计算芯片平台逐渐走向低功耗与高浮点计算能力。

以智能驾驶和智能安防为例,“云边结合”正逐步取代“中心分析”成为AI应用发展的趋势。针对不同人工智能应用的场景的AI终端芯片有望在今后数年内成为芯片厂商的主战场。云端的计算需求主要是支持海量数据下的计算开销。因此,由超级性能的CPU、GPU、FPGA、专用加速器组成的超高计算性能的芯片组成为主要的芯片平台。在云端芯片市场,Intel 约占71%、英伟达约占16%的市场。而终端侧的计算需求更多的是要考虑的是有限功耗下的系统开销。因此,高性能、低功耗的CPU、GPU、DSP、专用芯片组成的高集成度的SoC芯片成为首选。在这一市场,Intel、英伟达并无无优势,相反ARM、Ceva、华夏芯这样的公司有优势。

面对这一趋势,即华夏芯公司立足于为其客户的芯片定制提供完整的包括CPU、DSP和人工智能在内的系列内核和完整解决方案。华夏芯公司作为少数具备全系列处理器内核设计能力的高科技企业,继之前陆续发布全自主64位的CPU和DSP内核方案,并在嵌入式处理器领域率先引入了可变长矢量处理(Variable Length Vector,VLV)技术后,于2018年初正式向业界公开了其全新架构的嵌入式人工智能专用处理器的内核方案,及全套神经网络专用处理的完整解决方案。

新年伊始,华夏芯公司正式向业界公开了其全新架构的嵌入式人工智能专用处理器的内核方案。作为少数具备全系列处理器内核设计能力的高科技企业,华夏芯公司之前已经陆续发布了其自主设计的64位体系的CPU(Central Processing Unit)和DSP(Digital Signal Processor )内核方案,首次在嵌入式处理器领域引入了可变长矢量处理(Variable Length Vector,VLV)技术。因此,本次针对人工智能专用处理器内核方案的公开发布,进一步展露了华夏芯在人工智能领域的庞大战略,即华夏芯公司立足于为其客户的芯片定制提供完整的包括CPU,DSP和人工智能在内的系列内核,并希望在芯片整体性能,功耗,成本,编程,生态和开发周期方面占据领先的位置。

华夏芯致力于人工智能的专用可编程处理器内核的设计与授权,可以广泛应用于嵌入式人工智能与服务器侧的芯片设计与加速,高效率地解决与智能预测和智能推理等有关的方方面面。虽然华夏芯的人工智能方案可以运用到相当多的领域,但是,当前最为引人注目的应用当以智能安防、无人驾驶等应用领域为主要热点。在人工智能的支撑下,高清安防正在快步迈进全民、全覆盖安防的崭新时代,产业规模空前庞大,之前制约高清安防产业发展的网络瓶颈问题悄然缓解,高清安防正在演变为智能、高清、无线、预警等相互融合、协调发展的多种形态的综合产业。和智能安防行业类似,无人驾驶正在成为另外一个平行、高速发展以及炙手可热的人工智能的典型应用。有人预测,2020年将成为发展无人驾驶的重要节点,产业生态初步成型,产业容量巨大,已经成为全球汽车行业与消费电子行业巨头都不能放下的产业高地和必争之地。

上述发展趋势给人工智能的计算、存储、数据和通信等方方面面都带来了巨大挑战。比如,高维度、适应稀疏结构网络的高效并行计算,高密度、低成本和低功耗的大容量存储,完整或者大致完整的现场数据的收集与加工,带宽高、时延小、运营费用低的宽带网络覆盖,等等都已经成为影响或者制约人工智能在相关行业快速发展的卡口瓶颈。为此,在大力发展针对神经网络的新型架构的专用处理器的同时,还要加大力气在神经网络的原创理论与方法方面下功夫,力争形成理论和实践并驾齐驱的双创局面。

正是在这样的背景情况下,华夏芯正式推出了其自主设计的全套神经网络专用处理的完整解决方案。

纵观华夏芯本次推出的人工智能专用处理器内核方案,不少地方的设计很有特点:

1.采用了与众不同的异构多核架构。人工智能的计算与存储由多种环节组成,而且他们的属性各不相同,传统的单核处理器集成硬件加速器的做法基本上与人工智能的多方面需求不能完全吻合。为此,采用并发、异构的多核协同架构,将为人工智能的系统管理和数据处理奠定牢固的基础,这一点是非常重要的。

2.兼具处理器和硬件加速器的优点。类似于CPU的传统处理器架构可以确保编程方面的灵活性,但不能完全满足人工智能张量处理在专用计算和存储方面大数据量实时处理的需求;华夏芯人工智能专用处理器同时采用了类似硬件加速器的技术完成大数据量的批量处理,加速效率非常高。

3.在位长方面仅支持八位与十六位。人工智能算法的动态范围依据网络规模,分类多少呈现完全不同的特征,为此,多种位长的设置有利于提升处理性能,降低处理功耗,倍增存储效率。十六位半精度浮点的选择已经完全可以覆盖人工智能前端数据处理和存储的动态范围的需求,这一点正在成为嵌入式人工智能领域的趋势。

4.在内核系统管理方面实现全自主。很多人以为,只要把人工智能的数据处理搞定了,顶多加上硬件定制的数据压缩也就可以了。其实不然,人工智能的很多特性呈现运行时(runtime)的动态特性,需要相对应的系统和资源管理方面的能力很强。在这方面,华夏芯的异构多核并发的架构做得很好,可以完美地解决这个问题。

5.在可编程与算法实现定制上很强。大家都说,人工智能现在还在发展的初期,很多东西都处在不确定状态。但同一时期的人工智能算法在计算和存储架构上却基本上是类似的。华夏芯专用处理器的系统架构正是这样的基础上抽象设计出来的,其在可编程性和算法定制方面所蕴含的优势一般来说远远强于其它同类芯片产品。或者说,其生命周期是要远远长于其它同类定制芯片,一款产品可以适应很多算法的优化定制的需求。

6.在指令架构和微架构上扩展性好。伴随着人工智能算法的不断创新,应用场景的丰富多彩,可以预知,好的人工智能专用处理器的指令架构和微架构一定是与时俱进的,因此,架构扩展是不是方便快捷,也是度量专用处理器的关键指标。这方面,华夏芯专用处理器的层次感和扩展性是比较出色的,从一开始就支持对人工智能和控制指令的能力扩展。

7.在片上系统集成路线方面很灵活。华夏芯的人工智能专用处理器的自主管理与控制能力很强,不需要外配实时性很强的CPU等主控单元,因此,在SOC等芯片集成中表现得相对简单而灵活。这一点与当前很多解决方案都完全不同,不仅仅便于片上集成,而且自洽性强,总体性能更加突出。

8.针对主流开源后台实现无缝对接。毫无例外,当前主流的开源训练库和开源训练平台,诸如,CaffeNet, TensorFlow等,华夏芯的专用处理器都是可以无缝对接的。

根据华夏芯公司提供的最新时间表,目前,其已经启动对全球芯片设计企业的内核授权,并接收客户委托的芯片设计服务需求,代客户设计采用华夏芯内核的系统芯片。预计2018年下半年第一款全部采用华夏芯CPU/DSP/人工智能处理器内核的量产芯片开始下线,进入市场。

关键词: 华夏芯 AI ASCI

加入微信
获取电子行业最新资讯
搜索微信公众号:EEPW

或用微信扫描左侧二维码

相关文章


用户评论

请文明上网,做现代文明人
验证码:
查看电脑版