加州大学伯克利分校教授、人工智能专家Michael Jordan 眼中机器学习的未来

2017年6月22日 | By News | Filed in: News.

http://ift.tt/2sDHvWh

编者按:本文来自微信公众号“机器之心”(ID:almosthuman2014),作者 高静宜,36氪经授权发布。

2017 年 6 月 21 日,在 2017 腾讯云+未来峰会上,腾讯云发布了战略新品「智能云」,希望借此推动「人工智能即服务」成为现实。腾讯董事会主席兼首席执行官马化腾在《云时代的新趋势》的主题演讲中,明确定义了云是产业革新的源动⼒、新型社会管理的主平台和人工智能的强载体。马化腾提出趋势观点,认为像电力时代诞生计算机一样,云将兴盛人工智能,并带来更多创新。

近些年,由于在大规模标注数据基础上的性能表现优良,深度学习算法持续升温,特别是在计算机视觉、语音识别等领域,部分业界巨头企业以及初创公司已经开始加速从传统的机器学习逐步迈向深度学习的布局。此次峰会邀请到加州大学伯克利分校教授教授 Michael Jordan,他发表了《机器学习:创新视角直面挑战》的主题演讲,分享他在人工智能领域最前沿的探索和心得。而在随后的采访中,Michael Jordan 向机器之心谈到「我们应该更理性地看待深度学习」。

Michael Jordan 认为,虽然深度神经网络是目前比较常用的一种方法,但是在标注数据不足或解决某些特定问题的情况下,决策树等机器学习算法的能力也不能忽视。以决策树为例,它利用概率和树对决策中的不同方案进行比较从而寻求最优解,决策树方法也可以在数据条件完备的条件下,通过多个决策树组合的方式形成随机森林,在某些情况下也可以实现较为理想的结果。而且,这种方法相较于深度神经网络可解释性较强,而而不可解释性正是神经网络的一大难题。神经网络在现代神经科学研究成果的基础上提出,而神经科学非常复杂,人们目前还没有完全揭开其中的奥秘,「人们需要认识到神经科学的局限性,而且我认为将神经网络与其他算法进行优化结合也是非常必要的」。

另一方面,对于当下大热的聊天机器人,Michael Jordan 也有一些不同看法。他说:「我并不认为聊天机器人会发展具备和接近人的功能,人们可以理解对话中语义、背后已隐藏的含义,可这对机器来说并不简单,人们对此期待过高;还有一点期待过高的就是希望机器比人聪明,比如机器就不可能帮助 CEO 或是 CTO 做决策。不过,随着时间的推移,我相信无论是数据采集方式、优化算法或是模拟器的研究都会有长足进步甚至是突破性进展,正如三十年里计算机视觉和语音识别方面质的飞跃一样。」

以下为 Michael Jordan 演讲内容:

Michael Jordan:我是一个研究者,我做关于统计学以及人工智能方面的研究,今天我非常高兴来到这里。

首先我们要非常清晰地了解,什么是可能出现的技术,哪些是不可能存在的,而哪些是我们现在所存在的问题,以及未来我们会看到什么样的技术发展,这就是我今天这个演讲的主要所在,以及包括我们未来的洞见和挑战。

首先我们简单了解一下到底目前人工智能行业发展是什么样的。在 60 年代刚刚出现了「智能」这个词,也是刚刚出现了人工智能这个说法,那时候我们说要建立一个机器人,让它可以和人一样具有思维能力,加入到人的世界当中来,那个时候大部分人工智能的电影向大家展示的是机器人最终进入到人的世界中,以及包括我们的云系统、视觉系统,还有我们的自然语言系统,能够让机器人越来越像一个人。

但是在 80 年代、90 年代出现了另外一个趋势,这个趋势对我们来说也是非常重要,我们叫做 IA,也就是智能增强技术,那时候我们提到搜索引擎,这也是我们的智能方面的应用,通过智能引擎,我们可以非常快的找到我们所要问的任何问题的答案,这些东西不需要存储在人的大脑中,所以人的智能得到了引擎的支持,帮助我们能够更好地用自然语言来进行增强,电脑可以帮助我通过自然语言的处理,增强我的自然语言的表现,所以我可以通过自然和科技的技术,以及智能技术说多种语言。我们可以看到目前这个技术正在发展,而机器帮助我们有了更好的存储能力,更好的沟通、交流的能力。

还有一个部分是 IaaS,也就是智能基础设施,这对我们来说是最重要的。我们的交通和金融行业,在我们身边的每一个行业、每一个模块,现在都出现了智能化的趋势,我们也发现世界更了解我们了,能够根据我们的需求提供服务,所以在我们前方是有一个系统的,如果你要说云的话,这个系统就是云,这个云变得更加智能,所以它并不是机器人和我们沟通,而是这个云的架构和云的基础设施在和我们沟通。

之前我们大部分的研发都是与机器人,以及包括智能领域的发展,它主要是制约与我们的技术发展,它和人的发展是非常相似的,但是智能是完全不同的。现在我们在这种所谓的智能设施的建立的时候,我们遇到了很多问题,在腾讯也是如此。比如说我们要对相关的大型的设施做出相应的决定,比如说我们要做一个金融、交通,以及包括对人类做出一些医疗决定的时候,作为一个单独的机器,如果要能够仅仅跟周围的信息做决策,这是很不好的,有时候机器了解的信息是不够的,一个机器做出的决策往往是不对的,它没办法意识到我们周围环境的变化。特别是这样的决策如果要影响到大部分人,它更是危险的。

从这个角度来说,我们应该如何分享数据呢?我们可以看到机器人的发展,会帮助我们更好地促进业务的发展,我们能够帮助到公司,能够帮助他们进行数据的传输,能够帮助他们得到更多的竞争优势,但是这并不是最好的说法。如果能把信息进行分享,比如说诈骗信息,每个公司都能看到这方面的危险,它们会不断地集合,然后我们把问题进行更好的解决,同时大家也不会失去竞争力,每个人都可以从中获益。我们从技术和思维的角度来说还没有办法完全解决,到底我们的知识在哪里?知识是在每个地方不同重复的,在每个地方会出现不重叠性,以及在发展中不同的问题会得到不同的答案,所以我们如何通过数据在多重的维度当中,既包括在云端,也包括在云边缘得到相应的解答,这是很难做到的。同时我们如何做到公正和多样性,现在还很难做到,我们现在只能用一组系统处理一个数据,但是我们还没办法在多种情景下进行部署。还有一个问题是大多数的机器人出现了安全问题,在我们处理了之后,会出现一些系统的攻击,这是比较大的问题,这是我们要重视的,我们不可能说这是小问题,这些都是大问题,这就是我对智能的一个想法。

下面回到机器人、智能发展,包括从人工智能的角度来看,我们看看哪些是可能的,哪些是不可能的。

我们看到机器视觉,在过去几年,我们通过摄像机对场景中的物体进行标识,但是它还是没有办法能够像我们清晰的了解到所有的情况,就像我在这里站在台上,大家在台下,我没办法了解到所有人的注意力在哪里,通过人工智能可以帮我们更好地了解语义,但是现在也没办法做到,语音识别也是如此,我们现在可以把语音转化成文字,文字也可以转换成语音,在各种语言上都可以实现,但是我们的机器人还没办法帮我们了解听觉、视觉之后的真正的意义。

还有一点就是自然语言的处理,我们可以看到到目前为止,自然语言的处理得结果还没有达到我们需要的发展,我们现在有大量的语言的翻译,但是大部分的语言和语句因为没有办法得到有效的语义的阐述,没办法让我们的受众了解到这个语义的意思,有时候我们问问题仅仅能了解部分的答案,而不能了解全部的答案,对机器人学来说也是如此,我们看到世界上有很多工业可编程的机器人,他们也在和我们沟通,但是它们没办法了解到我们的环境、处境以及我们的情绪,我相信这对我们大家来说,如果我们都觉得机器智能将会无处不在的话,这是不太可能的。

对于我们来说,在过去几年的发展,特别是在机器人的发展上,我们的机器人还只是一个雏形,之后可能会出现一些有效的对话,特别是像这样一个自我导识的机器也会出现,但是智能方面它目前还是比较有限的。

我相信在未来,短期内不会出现太多的像人这样的灵活性和可变化性。也许机器可以了解一些事实,它们看上去非常有知识,但是它们没法真正得到人这样一种高级智能,甚至像小孩一样的高级智能,它没有办法了解抽象思维,没有办法进行抽象的处理,机器人还不能实现这方面的能力。这些机器人就像小孩一样,他们知道一些非常棒的现实,他们知道每条河流、每个国家,但是它们仍然没有很高的智能进行人的抗衡,所以在这方面,我们还是很难看到一个超人类的发展,我们相信这个技术可能要很多年的发展才能够出现。我相信我们真正要关注的不仅仅只是这样一种技术的发展,到目前为止,在我们这代人身上还看不到这种高水平的人工智能的出现。

除此之外,我们即使没有办法进行抽象、识别语义,我们也是非常难接近人的发展,但是我们仍然要进行等待,让我们了解到通过大量的数据的处理,比如说机器人以及人工智能可以帮助我们大批次的处理数据,能够通过数据了解未来一些事件的走向,同时能够保证我们的数据结果不断地提高,同时我们还可以用这个机器人做一些简单的人工工作的处理,但是机器人永远不可能像人这样聪明,同时我们可以看到,我们的人工智能的系统也会有很多的智能,它们知道这个现实,但它们不知道哪些现实是真的,哪些是有可能出现未来的一些颠覆式的发展,所以这个机器人并没有办法实现像人一样的能力,它没有办法引领一个公司的发展,在我们这代人身上,在机器上没法做出这样一个前景化的决定。

我们到底应该关注什么,应该担心什么呢?

如果我们担心这种高度类人化的人工智能的发现,我们应该关注,我们所谓的人工智能看上去很智能,但是它并非如此。比如说在医疗行业中,我们让机器做很多的医学诊断,这是不太可能的,有很多人会因为这种不畅的诊断,可能会剂量出现问题,特别是某种竞争的情况下,如果出现任何问题,这个机器没有办法做出有效的诊断,我们的病人都有可能去世。与此同时,我们真正要关注的是机器人可能会造成大量的工作的流失,以及大多数人因为丢了工作没有办法得到收入。在过去我们可以看到工业的发展,在七八十年代都是如此,但是在过去 50 年中,人们在不断地调整,现在我们可以看到未来 10 到 20 年,人们没有机会更多的调整,机器人会取代更多的人,获得更多的工作。同时它还可以帮助现有的智能设备的发展,在世界上也有很多人会恶意使用人工智能的系统,如果出现人工智能系统的误用,我相信也会有问题。机器人本身是没有任何恶意要伤害人类的,只是使用这些及其人的人本身含有恶意。

在这里我特别要和大家谈到我们近期对于机器学习的一些比较大的挑战,我相信这些挑战都是我们大家已经意识到的,但是现在还没有解决,如果我们能够确保未来要建立起一个人工智能的系统,我们必须要解决这些问题,否则没有办法保证未来人工智能的发展。

首先是我们必须要设计一个系统,这个系统可以带来有意义的经过校准以后的信息,能够应对一些不确定性,比如说在医疗行业,还有在策略规划的角度,如果你是公司的 CEO,你必须要清楚地了解到,一种做法和另外一种做法之间的差别,你不可能只有一个做法。与此同时,我们还要保证我们的系统能够真正地解释它们自己所做出的决策,如果机器做出了一个决定,我们必须要让机器向我们阐释为什么做这样的决定,是否还有其它的潜在方法。还有我们要找到问题发生的原因。

另外我们要找到一个系统,这个系统可以实现长期目标的追溯,同时可以主动的收集在实现目标相关的数据。

还有一点是实时,我们可以看到很多的数据和机器需要花几天、几个小时来学习这些数据,但是到目前为止,我们的机器学习方面还没有办法能够达到真正的实时操作。还有在意外情况下怎么办,还有在外部事件上的连接,包括数据和其他的要求,需要和政府的合作,和法律部门、和社会科学家的合作。

这是我们所面临的技术挑战,是需要我们关注的,我们只是做 AI,让这个机器人能够跨过去,或者做计算机视觉,我们需要像工程师一样解决一些问题。

在更广范围的挑战,我相信对我们来讲是更难的,比如说在语义方面,在世界上未来会发生什么,我需要了解什么样的概念,我们在机器学习上,我们讲的更多的是表面的东西,我们需要了解真正的世界上需要什么,了解我们所处的情景,但是它们并不知道我们之前发生了什么,它们是了解我们的一些事实,但是它们并不真正知道我们,我们到底什么时候觉得厌烦,我们不想要这样的互动或者交互。

当然还有云端的互动,这也是挑战非常大的,如果把这个数据放到云上,你需要关注隐私的问题,要看一下实施的问题,同时你还要考虑现实的情况,有时候它可能离我们太远,它不一定是和事实一样的,我们有可能会做出错误的决定,所以我们现在要有更好的方案。当然还有一个不确定性,这也是人类的一个非常重要的特点,围棋的比赛其实并不是一个很好的例子,因为你知道棋盘上的东西,但是人的生活有很多不确定性,比如说我不知道今天会发生什么事情,我不知道将来会发生什么,这就是所谓人的一生,这和围棋是不一样的,所以我们需要解决更深层次的人工智能方面的问题。

最后总结一下。我很高兴来到这里和大家讲人工智能,我也期待着看大家在 AI 方面会做什么,看看其它企业会做什么,我们需要一起合作,我觉得这相当于 3000 年以前,两个人一起来建立合作,大家去建大桥、建房子,我们觉得很兴奋,我们要带来新的发展,同时也会面临一些灾难,大楼可能会倒闭等等,因为他们当时没有什么科学性。我们一起创建了土建工程,我们一起在世界上进行分享,我们看看周边的建筑物,世界上大家的想法是一样的,因为这是可信任的,它不会再垮塌。但是人工智能还没有,这需要花几十年努力,所以我们需要一起合作,我们要认真考虑怎么解决这些挑战。

IT.数码

via 36氪 http://36kr.com

June 22, 2017 at 04:00PM


发表评论

电子邮件地址不会被公开。 必填项已用*标注