地平线余凯:算法+芯片+云计算构成自动驾驶三大核心支点

2017年11月14日 | By News | Filed in: News.

http://ift.tt/2zCW3uw

11月11日,2017全球未来出行国际博览会在杭州举行,在全球未来出行高层论坛上,地平线创始人兼CEO余凯出席并发表演讲。

作为前百度IDL副院长,百度无人驾驶项目发起人之一,余凯全面阐述了地平线对自动驾驶领域的看法和发展策略。余凯认为,一辆自动驾驶汽车是计算量达到了4-10个TB/天,一个2000辆规模级的自动驾驶汽车的数据量会更加惊人。这就要求我们需要用全新的思路去定义自动驾驶的软件算法和硬件架构。

具体来说,因为应用场景的变化,重新定义软件的架构,导致硬件架构的变化,核心就是人工智能的计算,从CPU时代的逻辑计算为主到现在深度深耕网络计算的智能计算,实际上使得硬件处理器的架构重新在被定义。

对于业内普遍认为的高精度地图在自动驾驶领域不可或缺,余凯认为其实我们一定要保证这个自动驾驶在完全不联网的状况下足够的安全。所以边缘计算、本地计算至关重要,自动驾驶实际上是边缘计算最具有挑战性、最具有必要性、最重要的场景。

关于自动驾驶本身,余凯认为软件系统的透明可追溯性、端到端的学习和硬件的实时低延迟都是最值得关注的技术部分。只有这些问题得以解决,自动驾驶落地才有机会提上日程。

以下是余凯发言全文:

谢谢陈教授的介绍。今天我想跟大家分享一下地平线正在做的,就是我们定义为我们自己的核心使命,是去研发、去打造自动驾驶的大脑,其实核心包括两个方面,首先是核心算法,怎么去通过人工智能的算法包括增强学习、深度学习以及规则去打造这样一个算法平台。其次,怎么样去设计一个硬件处理器的架构,使得能够去高效的支撑这样一个计算。因为我们知道,面向自动驾驶每一天我们要处理大概4-10个TB的数据,一天里面我们2千辆自动驾驶的汽车,他所处理的数据比整个百度搜索引擎检索的数据量还要大,所以未来面向自动驾驶真正的是大数据的问题、大数据的时代,我们需要有全新的思路去思考他的软件算法,全新的思路去定义这个硬件架构,就是他的核心处理器。

这样一个自动驾驶的汽车,考虑他的计算,不仅仅是算法和处理器,其实也包括在云端去做这种大数据的计算,还包括在云端去做大规模的仿真,未来大量的测试实际上是在仿真平台上面去实现,所以我们定义我们自己核心的一个技术平台的供应商,我们主要是三个支点,第一是算法,第二是芯片,第三是云。

今天我们讲面向自动驾驶的人工智能计算,实际上最主要的玩家并不会太多,因为这个里面需要有强大的计算力,需要有强大的支撑,非常高效的人工智能计算,实际上我们今天看到业界可以染指在这个领域的主要是三个玩家,一个是NVIDIA,一个是Mobileye,一个是intel,这个是三国时代,三国时代也很有意思,我们讲intel很像魏国,兵多将广,他有强大的CPU,他有5G的核心技术,还有很多其他的。Mobileye其实很像蜀国,刘备姓刘,真正的皇亲国戚,Mobileye是所有三家里面唯一一家出生的时候开始就是为自动驾驶,其他的还是有其他的目的,它真正一出生的时候就是自动驾驶正宗的玩家,所以很像刘备,但是它的实力在三家里面是最弱的。另外一个就是NVIDIA,更像孙权,可圈可点,偏安一隅,长于GPU,GPU一开始是为打游戏的显卡设计的,并不是为人工智能计算,但是因为最近人工智能的计算主要核心的深度神经网络,发现其实CPU很适合做大规模的深度运算,所以NVIDIA现在成为世界最知名的人工智能的计算平台。

另外我们看到一个趋势,朝着自动驾驶的趋势走,半导体厂商他们不仅仅只是做硬件,他们其实越来越多的往上层在走,越来越多的去构建软件的架构,我们还看到另外一种背景,传统的过去只是软件的玩家他们现在也朝着向软硬一体的方向去走,比如说我们看到Google,他们现在传统是一个软件的,现在也朝着人工智能的硬件,软硬一体去发展,包括地平线,核心创始人都是来自于百度、来自于Facebook,我们传统也是软件背景,也是闯入这个领域,我们认为未来要真正去解决人工智能的应用落地,我们必须从软件到硬件,软硬一体。

新摩尔定律,从逻辑计算到智能计算。过去半个世纪里面摩尔定律在不断的驱动整个IT产业往前发展,站在2017年的时候我们继续往前看到2045年,这里面有一个问号,这个问号的原因是说未来的路径怎么走,因为我们看到旧的摩尔定律,再去提升它的制程,比如7个纳米再往前走越来越难,英特尔官方的宣布摩尔定律变慢,不再保持以前的速率。但是我们看到新的摩尔定律在出现,就是因为应用场景的变化,重新定义软件的架构,导致硬件架构的变化,核心就是人工智能的计算,从CPU时代的逻辑计算为主到现在深度深耕网络计算的智能计算,实际上使得硬件处理器的架构重新在被定义,摩尔定律在这个角度来讲还在加速往前奔跑。顺便讲一下,到2045年如果摩尔定律继续往前奔腾,每千美金能够买到的计算量,跟现在人脑的计算效率差不多相当,相当于今天中国的天河二号,就是世界上最快的超级计算机的量,那个时候不但自动驾驶不是一个问题,包括我们很多很多的问题都会令人难以置信的被解决。

讲到人工智能计算和人脑的区别我们思考一下,人工智能计算是解决感知、认知和决策去思考这个问题的时候我们毫无疑问需要去回顾一下、对比一下人类的大脑,是一个通用的处理器和一个专用处理器。很多人可能会想,我们人类大脑看似非常聪明,是宇宙中最聪明的计算设备,看似无所不能,但是有一些时候令人费解的时候,一些很简单的问题在座的各位不能够立刻的去计算回答,这让我们很费解,为什么这么简单的问题我们不能够训练的回答。你把这个读完以后你发现人类大脑怎么这样,就是说你对于一个处理的效果,比如说对于这个图像的顺序,并不是按照我们通常的显示设备逐行扫描按照顺序来处理的,而是并行处理。因为我们能够并行处理,使得我们能够处理很复杂的场景,使得我们能够滑雪、能够打乒乓球、能够处理复杂场景的问题,同时我们还可以脑补,虽然是乱的,还可以脑补的读出来。人类大脑有很多的奥妙,对有的问题非常擅长、有的问题非常不擅长,显然启发我们要思考,就是人类大脑实际上解决人工智能问题是一个专用处理器。

所以考虑通用跟专有,实际上启发我们面向自动驾驶一定要去思考。我们不是解决一个通用问题,我们是要解决环境感知、三维定位、决策控制,把这些问题要做到足够的高效、足够的安全、足够的低功耗、足够的低延时、足够的实时,把这些问题都要解决好的话,实际上我们要直奔主题去做,而不是说去解决一个通用问题。一般来讲,在硬件的架构设计里面,如果是针对一个专用的问题去解决的话,相对通用的设计他能至少有三个数量级的效率的提升,这个是我们去思考的方向。

另外一个趋势我们关注到,从中心到边缘,这个是什么意思呢?我们看到其实在过去我们说从桌面计算到浏览器产生了以后,很多计算都逐渐的往云端走,尤其在移动互联网的时代,我们讲云计算,实际上是一个从边缘到中央,计算往中央去迁移的这么一个历史的过程。可是我们看天下大事分久必合、合久必分,面向未来的万物互联、万物智能的时代,我们同样也会看到很多的计算不断的往边缘去走,尤其是自动驾驶,自动驾驶要求实时的反应,他足够的安全。我们今天讲高精地图,大家有没有想到,自动驾驶本质来讲你一定要保证它,即使在网络不通的情况下它也足够安全,大家要思考一下,高精度地图使得这个驾驶更方便、更安全,但是我们一定要保证这个自动驾驶在完全不联网的状况下足够的安全。所以边缘计算、本地计算至关重要,所以说自动驾驶实际上是边缘计算最具有挑战性、最具有必要性、最重要的场景。

毫无疑问中国是世界最大的汽车市场,同时也是最大的边缘计算的场景,我们怎么去解决这个问题?所以说回顾刚才我讲的,实际上面向未来它的这个计算实际上是边缘跟中央和中央结合的一个场景,对感知传感数据立刻处理,同时做决策,同时这些数据经过处理以后在云端会汇聚大数据的分析跟建模编辑他的模型,并且做大规模的仿真。所以我们思考未来,自动驾驶其实有三大核心支点,一个是算法,一个是芯片,一个是云计算。

要求就是说我们需要从全栈式的研发思路,从软件、到系统软件、到处理器架构设计,到云端。首先我们去思考自动驾驶软件设计的几个重要的原则,从自动驾驶的角度,而不仅仅是从人工智能的角度。首先第一点,他需要透明可追溯。在座的各位如果是看过电影《西部世界》的举个手,有很多看过。《西部世界》到了晚上发生什么事情?白天碰到那些机器人很异常的行为,到了晚上的时候都怎么样,当这些机器人的行为不可理解的时候你会觉得很恐怖,未来人类驾驭自动驾驶汽车的时候我们一定要理解这个汽车为什么这样行为。所以软件系统设计原则里面这个透明的可追溯性非常重要,但这个问题又很难,为什么呢?我们通常看到,在所有的软件系统里面越是黑箱系统越准确,越是透明可追溯的越不准确,所以这是一个两难的境地,但是怎么去保证它这是一个挑战,我们一定要知道,在任何的异常情况出现的时候,我们要知道这个汽车为什么这样行为,然后可以控制它。

另外一个所谓端到端的学习。就是我们希望这个汽车一定是在各种场景下去经历,同时能够自我更新、自我迭代、自我循环、自我提升,端到端的这种学习的能力,而不是说你简单的教给他一堆规则他就按照这个规则走,他必须能够经历各种路况,不断的去自我提升。

第三个,一定要硬件友好。这个通常来讲也是做软件的工程师不太注意的一个地方,因为汽车它的功耗一定要低,它的响应一定要实时、一定要低延迟,对我们来讲延迟超过比如说80毫秒,跟延迟300毫秒完全不一样的,但是通常在互联网行业或者在软件系统里面,不是那么受到关注的一个话题。

具体怎么去提升一个人工智能的软件系统,他的透明可追溯性,我们有一些具体的思考跟方法,其中之一就是结合深度神经网络跟贝叶斯网络因果推理的方式,具体细节不讲了。这样其实是构建一个软件自动驾驶的平台,这样一个平台实际上是高度的模块化,然后模块跟模块的耦合是高度的颗粒节性,这里面每一层的耦合实际上不是一个信号的传递,而是一个可理解的有语义意义的这样一个耦合。同时模块跟模块之间是一个很优美的数学框架,能够保持它整体的自恰性。这样一个系统本质上是一个巨大的贝叶斯网络,贝叶斯网络里面很多的模块是一个小的深度神经网络,这是一个我们稍微比较简化的一个解释。

另外一个好处,这样一个网络结构可以很容易的去切进比如说基于规则的系统,这个也很重要,比如红灯停简单的规则,当然我们还有其他的规则,一个规则的系统怎么样跟一个人工智能的系统去完美的契合在一起。

这样一个系统,所谓叫端到端的学习,他不是一个被训练的汽车,而是一个主动去学习的汽车,这样一个学习不仅仅是说让比如说上百万辆的、上千万的车在路上不断的去跑、去学习,但是这个是不够的,为什么呢?因为有很多很多的这种在仿真的系统里面,通过仿真系统可以仿真它的里程数,可以说比我们在真实数据里面的里程数要高2—3个数量级,比如我们在真实的道路上面可以去仿真测试上亿公里的数据,但是在仿真的系统里面我们需要去测试上千亿公里的数据,当然一个事实是说,今天比如说造原子弹,其实已经不需要做实验了,完全是在仿真上做,未来的自动驾驶这点也非常重要,这样让很多在真实数据里面其实你不能够暴露的很多边界条件,你都在里面被充分的去测试,这个非常重要,你难以想象在现实的世界里面怎么去测试一辆汽车在这种非正常的情况下面他怎么去控制,你控制的算法这种边界的安全性怎么样。

前面都是软件,基于这样的软件框架我们要去设计自动驾驶的自动处理器的系统,我们现在是整个的路线图,叫BPU,今年我们会面向市场去推出来的高斯架构的面向L2的驾驶,明年年底我们会在台基电偏更加高制程的架构面向3G自动驾驶和4G有限场景的处理器,当然是更强大的感知。未来其实计算的焦点不在感知,未来其实计算的焦点在决策,复杂场景的决策的难度更大,现在大家没有充分的去估计,比如说我们大家知道下围棋,下AlphaGo,这个计算量非常大,现在AlphaGo今年Google其实用TPU去支撑这个强大的计算,但它是一个博弈的,就是两个在博弈的情况。可是自动驾驶是一个控制系统,实际上跟周围一百个行人跟一百辆车在博弈的过程。比如说我在一个车道线上开车,如果我要换道,我打信号给他,旁边的车看让不让,他如果不让再接着开,这是一个不断博弈的过程,也这么多的互动式的决策过程。面向未来我们在城市道路下面自动驾驶其实决策不管是软件算法、还是我们硬件处理器的架构,实际都是巨大的挑战。

地平线我们最近从去年开始也跟intel也有一系列的合作,包括新的架构去加速深度神经网络的计算,当然最近intel也成为我们的一个投资方。

这个是我们今年成功的,只是用2瓦一个超级功耗的处理器,但它是一个高效的视觉处理器,它能够处理高清的视频,每秒钟30幁,可以同时检测跟踪识别250个目标,所以是非常复杂场景下的强大的计算机视觉的处理器。这样一款处理器用在这种场景下面,比如说在国外通常你看到的这种检测都是那样的路,这是在高速路况上,这都是用2瓦功耗的处理器去处理。

我下面给大家介绍一下我们实际上下一款的处理器,就是明年推出来的这款处理器,面向自动驾驶,其实最核心的思想是什么呢?它会是世界上第一款像素级的处理器,会对每一个项目做精确的计算,使得它突破传统的检测框的框架,它对任何的场景都能做细致的包括路牌、甘蔗、树木包括树木遮挡的人都可以精确的惜别,这样的处理能力实际上低功耗实时的计算难度非常大。这个是在北京的路况上面,因为北京的这种车经常抢道换道,一个挑战性就是说,在换道的时候哪怕车只要露出一个小角,你就立刻把它捕捉到,这非常重要。这种像素级的处理,因为整个车只露出一个小角,这种像素级的处理就至关重要,比如旁边的车突然冒出来我们就能立刻捕捉到。

这样一款处理器适用于这种复杂的城市工况,很重要的一点比如对行人,行人重要的不是知道他在哪儿,重要的是他在下一个5秒钟往哪个地方移动,这个一动不只是检测一个框、检测这个人在哪里,你要检测这个人比如说他的脸的朝向,因为大概率人不会朝脑袋后面走,你还要检测他的动态,比如说他的动态是怎么样的,然后去预测他在下一个5秒钟往什么地方走,这是通过处理器一定要去面对的一个问题。比如中国像这种开着摩托车倒着走,都是我们要去面对的这种情况。

未来的自动驾驶实际上它是跑在四个轮子上面的超级计算、是跑在四个轮子上面的数据中心,所以这个里边从地平线的角度来讲,愿意去跟业界的同仁一起去合作,我们希望能够提供的是在四个轮子上面我们去提供这种汹涌澎湃的计算力,去帮助你们解决你们在共享出行服务、在自动驾驶方面所面对的挑战。

谢谢各位!

(根据发言整理,未经本人审阅)

我是36氪汽车小组记者郑晓康,关注特斯拉、无人驾驶、新能源车、车联网、出行及后市场,欢迎直接与我联系,微信:15735104947

IT.数码

via 36氪 http://36kr.com

November 13, 2017 at 08:58PM


发表评论

电子邮件地址不会被公开。 必填项已用*标注