近日,2011年诺贝尔经济学奖获得者托马斯·萨金特(Thomas J. Sargent)在一场演讲中对人工智能(AI)的定义,引发了经济学家和人工智能科学家之间如何定义AI的讨论。
在北京举办的世界科技创新论坛上表示,作为经济学理性预期学派的领袖人物,萨金特表示:人工智能其实就是统计学,只不过用了一个很华丽的辞藻,其实就是统计学。好多的公式都非常老,但是所有的人工智能利用的都是统计学来解决问题。
对于这样的观点,从事人工智能科学研究的科学家们表示不能完全赞同。阿里巴巴达摩院机器智能技术实验室主任金榕就认为萨金特的说法是片面和不准确的。
金榕在加入阿里巴巴达摩院之前,是前美国密歇根州立大学终身教授,曾获得过美国国家科学基金会NSF Career Award——有超过200位诺贝尔奖得主都获得过这个奖金的资助。
金榕
在接受澎湃新闻专访时,他表示:“这位宏观经济学家也许是习惯了用统计去寻找经济的因果关系,因而认为AI也是这样。即使是他提到的动态规划(dynamic programming),也不属于统计学范畴。除了统计,AI中的‘学习’、‘推理’和‘决策’中还使用了代数、逻辑、最优化等许多其他学科知识与方法。此外,有了算法后如何有效实现也非常重要。所以单纯说AI就是统计学,或者说“所有的AI都是利用统计学来解决问题的”都是片面和不准确的。”
同为达摩院科学顾问的AI学者印卧涛教授也表示,“统计学是AI若干基础之一,远不是全部。AI是一个综合学科。”
在金榕看来,要想准确定义人工智能,首先需要知道什么是人工智能背后的核心技术。“现在人工智能技术的成功背后,是基于对海量数据的学习,因此大量的大数据处理、优化以及分布式计算基础设施都扮演了非常重要的角色。此外,AI还涉及到一个关键因素,就是如何实现最优的智能决策(例如AI打游戏)。一些理论和实证研究已经发现,神经网络就非常善于在复杂的条件下做出最优的决策。神经网络也不是统计学范畴。”金榕表示。
其次,尽管不认同萨金特对于人工智能其实就是统计学的表述,但金榕赞同了萨金特演讲中提到的人工智能通才以及交叉学科研究是推动当下人工技术进步的关键之一。
至于下一波人工智能技术的跃迁需要依赖于哪些领域和学科,金榕认为来自AI芯片、量子计算这些全新的计算基础设施算力的巨大提升。此外还有神经科学的一些重要突破,可能将揭示大脑中神经元如何处理信息与做出决策的,这对人工智能的发展也有重要意义。
以下为澎湃新闻对金榕的专访:湃新闻:托马斯·萨金特认为,人工智能其实就是统计学,只不过用了一个很华丽的辞藻,其实就是统计学。好多的公式都非常老,但是所有的人工智能利用的都是统计学来解决问题。”如何评价这种“AI就是统计学”的观点?
金榕:这位宏观经济学家也许是习惯了用统计去寻找经济的因果关系,因而认为AI也是这样。即使是他提到的动态规划(dynamic programming),也不属于统计学范畴。
除了统计,AI中的“学习”“推理”和“决策”中还使用了代数、逻辑、最优化等许多其他学科知识与方法。此外,有了算法后如何有效实现也非常重要。所以单纯说AI就是统计学,或者说“所有的AI都是利用统计学来解决问题的”都是片面和不准确的。
在这里我们首先需要定义什么是人工智能背后的核心技术。现在人工智能技术的成功背后,是基于对海量数据的学习,因此大量的大数据处理、优化以及分布式计算基础设施都扮演了非常重要的角色。此外,AI还涉及到一个关键因素,就是如何实现最优的智能决策(例如AI打游戏)。一些理论和实证研究已经发现,神经网络就非常善于在复杂的条件下做出最优的决策。神经网络也不是统计学范畴。
还有,人工智能在计算机视觉、语音识别等领域取得的突破,还得益于硬件的日趋成熟。类似智能音箱天猫精灵、Echo的成功不仅来自于成熟的语音识别算法,也源于麦克风阵列等硬件设备变得越来越可靠。
那如何比较准确的表述统计学和AI的关系呢?应该说,统计学是人工智能若干重要基础之一,但远不是全部。就像我上文提到的除了统计学,AI的核心能力还来自于数学(博弈论、数值分析、逻辑学等)、运筹学(优化)、计算机科技(分布式计算、并行计算、CPU、NPU)、神经科学,甚至心理学。
澎湃新闻:在托马斯·萨金特的演讲中也谈到了交叉学科研究推动的科技进步,你是否认同?在这波深度学习为推动力的AI浪潮中,哪些学科的交叉起到了推动作用?
金榕:这一观点我很认同,这也是很多学者的共识。就像我上面提到的,AI不是独自成长起来的。1956年的达特茅斯会议(Dartmouth Conference)被学术界公认为是人工智能的起源。今天有人说现在是人工智能的春天,其实这都源于我之前提到的一系列技术的发展与进步。特别是我刚刚提到的硬件,诸如麦克风阵列技术的成熟对语音识别的发展起到了重要作用。还有超强的算力,不论是GPU或者是云计算,都给我们带来了强大的计算能力和灵活度。我们在自然语言对话机器人的开发中,还会应用到许多心理学知识。所以说人工智能的繁荣是诸多学科交叉相互影响,共同促进的结果。
澎湃新闻:我们知道人工智能的概念提出已经60多年了,许多算法和模型在几十年前就曾提出了,但在过去的发展中,碍于计算力和数据的局限,此前的发展并没有像如今这样迅速,这是不是从侧面印证人工智能也算是统计学的一种?
金榕:计算力和数据的增长是人工智能发展的必要条件。AI的发展还要感谢Hinton,LeCun, Bengio(编注:这三位被学术界誉为是人工智能、深度学习领域的三巨头、权威学者)等研究者的长期坚持。当然统计学也在发展,但由于深度学习的迅速发展,它们反而变得没有以前那么重要了。
除了统计学,对现在人工智能发展起到举足轻重作用的,神经网络的一些研究工作,也是在50年前进行的,但它被广泛应用是从2010年后开始的。在2010年前,许多上一代机器学习成果的确是基于统计学的,他们被归类于统计机器学习。但技术是持续进步的,近几年推动人工智能进入发展快车道的深度学习技术,并不能归因于统计学。
澎湃新闻:这一波的人工智能发展浪潮绕不开AlphaGo的出现,它的开发和统计学有直接关系吗?
金榕: AlphaGo使用了蒙特卡洛树搜索、神经网络、增强学习等方法,因为算法规模大,所以采用了分布式计算来实现。棋力更强的AlphaGo Zero没有使用人类数据,而是从自我博弈中学习。所以这更说明AI远比统计学来得广泛。所以推动这一波AI浪潮的正是神经网络的迅速发展,以及能够让大量数据发挥作用的算法和算力。
澎湃新闻:下一波大的AI技术跃迁,您觉得会有赖于哪些领域、学科的交叉研究成果?
金榕:我认为首先可能来自于AI芯片、量子计算这些全新的计算基础设施对算力的巨大提升上。此外还有神经科学的一些重要突破,可能将揭示大脑中神经元如何处理信息与做出决策的,这对人工智能的发展也有重要意义。
澎湃新闻:那么如果要跟大众普及人工智能概念的话,你会如何定义?
金榕:我认为智能化的目的,不是让机器像人一样。上一个世纪,在工业时代,我们基本上把人变得越来越像机器,而未来我们真正应该走的道路是,让机器更像机器,人更像人。我们发明了机器,不一定要机器按照人的思考。机器要有自己的学习方式、思考的方式、解决问题的方式,所以我们提出“机器智能”。机器智能不应该是,让机器人复制人类的智能,而是发展出自己独特的智能。我们应该让机器做人类做不到的东西,让机器去发展自己智能的力量、尊重机器、敬畏机器。所以在阿里我们是以“机器智能”为目标。
举几个例子,诸如人工智能客服,它能7*24小时的工作,对海量用户的接待能力远超人类。人工智能应用于城市大脑,通过智能决策和管理能大幅缩短交通拥堵时间,甚至提高救护车到达现场的时间。AI在工业领域的应用,诸如将计算机视觉应用于产品质检,已经为许多制造企业节省了数十亿元。这些都是AI比人类更擅长的领域。而在艺术、文学等创造性工作上,人工智能可能永远无法替代人类。
澎湃新闻:有一种观点认为算法、计算力和数据是人工智能技术能否成功的三个关键,你是否也这样认为?在这三点上,您认为阿里目前最大的优势在哪里?短板又是什么?
金榕:历史上人工智能经历了多次黄金时期。到了今天,我们迎来了新的一波热潮。
那么这次的人工智能热潮有哪些不一样的地方呢。就是由于我们在算法、计算力、数据上都有了重要突破。
首先人类首次拥有了超强的计算能力,不论是GPU还是云计算。给我们带来了强大的计算能力和灵活度。这点阿里具有很大的优势。阿里云在中国拥有最大的云计算服务,同时我们也在积极探索量子计算。
其次,也是很重要的一点,就是大量的数据的产生。海量的数据使AI模型的大规模训练成为可能。阿里巴巴积累了海量的数据与应用场景,这些数据将成为阿里在人工智能领域快速突破的基础。最后,就是算法领域的突破。深度学习等新技术已经在各个领域得到广泛应用,比如计算机视觉、语音识别、自然语言处等,多点开花。
阿里也在算法领域做了很多探索。诸如在语音识别领域,阿里推出了新一代语音识别模型——DFSMN,不仅被谷歌等国外巨头在论文中重点引用,更将全球语音识别准确率纪录提升至96.04%(基于世界最大的免费语音识别数据库LibriSpeech)。而在机器翻译领域,在此前结束的WMT2018国际机器翻译大赛上,达摩院机器智能-NLP翻译团队打败多个国外巨头与研究机构,在所有提交的5项比赛中,全数获得冠军。这5个项目包括英文-中文翻译、英文-俄罗斯语互译、英文-土耳其语互译。短短一年时间,我们已经在20多个各领域的国际人工智能大赛上获得冠军。