「探境科技」发布存储优先架构SFA,28nm工艺条件下系统能效比可达4TOPS/W

2018年11月8日 | By News | Filed in: News.

https://ift.tt/2yT2GqG

探境科技成立于2017年初,是36氪此前曾持续跟进的一家AI芯片领域的创业公司。与当前行业的不少AI芯片公司不同,探境科技提出了一种新的芯片架构和存储解决方案——在有效降低芯片功耗的同时,大幅提高硬件资源利用率的适用于各种终端设备的嵌入式AI芯片解决方案。简单来说,就是希望同时解决AI芯片的计算与存储问题。

在今天的IC world “芯星新锐专场论坛”上,公司也正式公布了其芯片采用的存储优先架构SFA。

根据探境提供的信息,对比“类CPU架构”采用的基于总线的映射方法,在同等条件下, SFA架构数据访问可降低10~100倍;28nm工艺条件下,系统能效比达到4T OPS/W,计算资源利用率超过80%,DDR带宽占用率降低5倍。

探境表示,SFA架构实现了将存储、计算、调度算法一体化,通过软硬件协同工作,控制器在各存储和计算节点进行最优的映射,可以通过OTF的方式动态更新调度算法;使用了分布式的存储和分布式的计算,可以达到较高的内部带宽和计算效率;采用数据驱动的方式,可以支持未来的可计算SRAM或其他新型存储,进一步提高计算效能。

之所以选择这一架构,与探境科技对行业的判断有关。此前在AI芯片之争白热化的当下,如何设计一款真正适用于终端的AI芯片?》一文中,我们已提及,因为目前深度学习算法在芯片中最大的瓶颈来自存储墙问题,与过去的大部分算法相比,过去的算法的计算复杂度较高,而深度学习的计算复杂度和存储复杂度的关系是倒置的,存储部分带来的性能瓶颈和功耗瓶颈远大于计算部分,举个例子,就好比过去汽车的好坏主要取决于发动机,所以大家一直在研究发动机的技术,但突然到了新能源车的时代,电池的重要性成了超过发动机的因素,那么整辆车就要围绕电池来设计了。

在探境看来,当前绝大多数的AI芯片,都是基于冯诺依曼架构,与最初的CPU架构并无本质差异,其解决问题的思路在于解决计算的问题,降低计算指令衔接上的控制冗余,提高效率,以指令为中心或以计算为中心进行优化,以计算驱动存储,通过编译器构建虚拟机的思想,树立AI芯片指令集的抽象标准,对于存储资源的使用和调度,依然或依赖于编译器,或依赖于传统的缓存管理算法,这相当于用较为富裕的计算资源驱动较为稀缺的存储资源,无法解决存储墙的问题的。SFA架构则是一个以存储调度为核心的计算架构,数据在存储之间的搬移过程之中就完成了计算,计算对于数据来说只是一种“演变”。整个SFA架构由数据层、计算层和控制层组成。数据层中的数据在演变的航线(图中虚线)中,与不同的算子相结合,完成其演变过程,过渡到新的数据层相应的位置上。

CEO鲁勇分析,从更高的层面来看,在特定的工艺条件下,一定精度的计算操作下,最终的功耗都来自于MAC,所以每瓦功耗得到的算力是相对固定的,而存储所消耗的功耗和资源超过了计算部分,因此当前大多数AI芯片的能效比差别并不大,在“存储墙”问题解决前,如果在以计算为中心的指令抽象化的方向做文章,结果只能是让抽象层更加远离任务调度的实质,使得存储问题更加的恶化;换句话说,是“类CPU架构”适用于计算复杂度高,存储复杂度低的环境,当面对深度学习这个新形势时,其本身的局限性导致稀缺资源没有得到很好的利用和处理,只有重新思考深度学习所面临的存储墙问题,才能得到突破的AI芯片架构。

 鲁勇告诉36氪,目前业界对“存储墙”也看到了一些解决思路,有的加大存储带宽,采用高带宽的外部存储,例如HBM2,这样不惜功耗,仅提高性能;有的采用分布式片上存储,抛弃DDR,达到几百MB的SRAM,成本非常可怕;有的以算法精度、应用范畴为代价,设计低比特权重的神经网络,无法满足通用神经网络的计算;有的在存储单元内部的设计计算单元的新型存储器,进行存算一体化(In Memory Computing),商用化道路较长;因此,探境科技重新思考存储和计算的关系,以存储驱动计算,直接从应对“三高”特性出发设计与“类CPU架构”完全不同的计算架构,即存储优先架构SFA。



探境规划,未来将围绕安防市场、工业智造、消费类市场、自动驾驶等几个领域开拓市场,并推出相关产品。值得关注的是,此次语音芯片也被提及。

 

延伸阅读:

AI芯片之争白热化的当下,如何设计一款真正适用于终端的AI芯片?

IT.数码

via 36氪 https://36kr.com

October 23, 2018 at 10:03PM


发表评论

电子邮件地址不会被公开。 必填项已用*标注