嘉楠:发力边缘侧 构建智能“芯”生态

智能计算   作者:王莹 时间:2019-06-20来源:电子产品世界

      在“2019世界半导体大会”上,嘉楠科技创始人、董事长兼首席执行官张楠赓先生发表题为“让‘AI’成为AI”的演讲,分享了对边缘侧AI和当下产业的思考,以及对嘉楠科技边缘智能“芯”生态的构想。

图片1.png

      在《电子产品世界》记者的专访中,张楠赓表示,真正的AI不仅局限于图像处理,而应该兼具视听等多种感官能力。去年9月,嘉楠推出了第一代AI新品勘智K210,这款基于自主研发的ASIC芯片集视听能力于一身,已经部署于无感门禁系统,功耗仅为300mw。最新的第二代芯片K510也预计在今年下半年问世,芯片算力将提升5~10倍。

      K210和即将问世的K510在某种程度上代表了嘉楠对于AI的思考。随着AI产业逐渐走向成熟,AI芯片也逐渐从传统的通用型芯片向半定制化、全定制化谱系发展。张楠赓认为,边缘侧AI之所以没有普及,因为AI芯片在成本、能耗、算力、通用性等方面仍有不足。对于边缘侧而言,只有足够轻量化、低功耗的AI芯片才能真正落地于边缘侧设备,赋予设备一定的自决策能力,从而真正让社会享受人工智能时代的红利。

      1  让‘AI’成为AI

      从2016年AlphaGo一战成名以来,沉寂了60年的AI摇身一变成为“未来”的代名词。自动驾驶、智慧城市、智能家居等一系列新概念点燃了人们对于AI的想象。但另一方面,实现真正的AI仍存挑战。

      AI的通用性首当其冲。当下AI产业的突破仍处于单点突破期间。由于应用背景明确,数据积累丰富,在翻译、图像检测等一些特定的领域里,AI的能力已经超越人类。但是,真正的AI通用芯片应该具备视、听、触等多种能力,而不是单独针对某个领域进行优化。张楠赓认为,就像人一样,各种传感器同时起作用,这样带给用户的体验才会更好。

      总体上,AI的算法有一定的共通性。尽管IoT(物联网)领域是个性化和碎片化的,如果把这些碎片化的领域集合在一起,发挥通用芯片和算法的优势,这样可以确保在有限投入下,产出更多AI应用。

      而其中的关键,恰恰在于AI在边缘侧设备的落地。

      2  边缘侧AI需要轻量化和低功耗

      张楠赓认为,目前的AI按应用场景主要分为两种,一种是训练,一种是推理。不同应用场景对芯片的设计提出了不同要求。具体而言,算法训练由于对算力要求高,多部署于云端进行。与之相反,数据推理则更多发生在边缘侧,因此芯片设计应当兼具低功耗和轻量化。

      为此,嘉楠科技于2018年9月6日发布了针对于边缘侧的AI芯片——堪智K210。芯片采用了先进的28nm工艺,配置双核64位CPU。其中,芯片的AI加速器由嘉楠自主研发设计,支持8通道高性能麦克风阵列的音频处理硬件,因此一颗芯片可以同时处理视频和音频,功耗仅为0.3 W。

图片2.png

 图 堪智K210芯片(来源:堪智官网:https://kendryte.com/)

      3  为何采用RISC-V架构

      与多数芯片不同,K210的CPU采用RISC-V的RV64。因为RISC-V有很多优点,例如精简指令集开发,更重要的是RISC-V并非国家意志的产物,而是具备学术性质的开源CPU,这在当下的贸易环境中显得尤为重要。

      同时,嘉楠也赶上了国内正在兴起RISC-V研究浪潮。K210芯片和开发板可以服务于高校和科研院所的研究和培训,而且嘉楠产品是市场上为数不多、可立即买到的RISC-V产品,在淘宝就可以很方便地采购到。

      K210的优势是双核64位RV CPU,是非常学术的RISC-V CPU,主频400 MHz。相比Arm,RISC-V的RV64相当于Arm的M7,比M7性能略高一些,但略逊于Arm A7。

      4  MCU领域最先进的工艺水平

      最有效的降功耗方法是好的架构。第一代K210芯片是内置存储,可以等同于单片机(MCU),还有专用的CNN装置,这样的架构方式能够大幅降低芯片功耗。在工艺上,K210采用了台积电28nm制程,在单片机领域已经达到最先进水平。

      那么,嘉楠的矿机芯片已采用了台积电的7 nm工艺,K210为何不采用7 nm?因为7 nm价格高。嘉楠做芯片的原则完全是为了商用,不是为了PPT,也不是为了融资,因此要考虑费效比。

      5  8通道的音频功能

      K210的一大特色是,除了机器视觉能力外,还具备机器听觉能力。芯片上带有支持8通道高性能麦克风阵列的音频处理硬件,可以进行硬件加速的实时声源定向与波束形成,无需占用主CPU资源。一颗芯片就可以实现声源定向、声场成像、波束形成、语音唤醒、语音识别等机器听觉功能。

      那么,音频在此的目的是什么?因为从哲学角度,AI应该是多种感官融合的,因此K210除了有图像,也做了音频。用图像的方法处理音频是可以做的,把音频转成图谱,用计算机的眼睛可以去“看”。

      另一个问题是:为何要做8通道?8通道麦克风的应用场景是什么?主要是为了有更远的拾音距离,一般两个麦克是三四米的拾音距离,4个麦克风是5米,8个是6米左右。

      此外,8麦克风还有一些特殊应用,例如做林业病虫害防治的害虫识别,这是和百度、林业大学合作的一个项目,方法是把麦克风扎到树里,听虫子嗑树的声音。这需要多组麦克风设备扎到树里。嘉楠的方案是一个40 mm见方的模块,做了防水的处理。利用图像分类、检测的方法,去“看”视野里是否有特定的害虫。这种方案的应用前景十分广阔,因为中国的森林非常多,而且它可以推到农田等更多应用场景。

图片3.png

图  堪智的应用场景(来源:堪智官网)

      6  跃升:即将问世的K510

      2016年嘉楠已开始有了做AI芯片的想法,做了一两年时间,本来计划2017年底推出,但因当时算法有很大突破和进展,又拖延到了2018年9月出炉,因此花了整整两年时间。未来AI芯片的迭代速度加快,达到一年一代。

      第二代产品的型号为K510。那么,为何型号从K210一下跳到 K510?因为性能提高很多,提升了5~10倍,有了外存(注:第一代没有外部DRAM),并加入了对高清视频的支持。

图片4.png

图 K210的主要性能指标(来源:堪智官网:https://kendryte.com/)

      7  未来:共建AIoT“芯”生态

      事实上,边缘侧AI芯片业态尚未成熟,各家厂商也都处于摸索路径。但嘉楠对于芯片生态的商业想象却很丰满。这来自于嘉楠对自身研发实力的业务经验的自信。为此,嘉楠做了很多尝试,不仅局限于芯片,而是以芯片为落点,延伸至开发板、算法以及边缘侧的解决方案等。

      更重要的是,嘉楠向外与AI厂商建立合作关系,通过合作补齐算法和数据,同时也为自身的芯片寻找更多落地场景。同时,兼容性上,嘉楠也推出了第一代模型转换工具,可以将英伟达等主流企业的软件迁移到芯片中,对于开发者更为友好。

      嘉楠的核心优势还体现在对于芯片研发设计体系的熟稔。张楠赓认为,之所以市面上涌现出大量的AI芯片产品,恰恰暴露了当下AI产业没有通用硬件平台的现状。以PC时代为例,Wintel联盟的软硬结合成为市场主导,多数公司无需再单独研发芯片。这也正式嘉楠等芯片厂商的机遇所在。

      实际上,对于很多所谓的芯片厂商而言,ODM(委托设计)产品的性能很难保证,靠ODM验证一下概念是可以的,但市场上也很少见到靠ODM成功的产品。而嘉楠不仅包含前端和后端设计,还包括标准库的设计,以及数模混合信号等资源,因此可更好地保证芯片的性能。

      目前,K210的方案已用于智能门锁、智能抄表等业务场景。合作伙伴可以通过嘉楠的SDK(软件开发包)等开发出更多产品。

图片5.png

图  堪智的SDK(来源:堪智官网)

      张楠赓表示,嘉楠希望和合作伙伴一道,构建共赢格局的AIoT(人工智能物联网)商业生态。

关键词: AI IoT

加入微信
获取电子行业最新资讯
搜索微信公众号:EEPW

或用微信扫描左侧二维码

相关文章


用户评论

请文明上网,做现代文明人
验证码:
查看电脑版