2020WAIC | 姚期智：人工智能理论新的方向

ainet.cn 2020年07月09日

　　人工智能诞生以来的60多年间，理论范式的演讲一直引领着人工智能的发展方向。今天，在2020世界人工智能大会云端峰会的会场上，中国第一位、也是目前唯一一位图灵奖获得者、中国科学院院士姚期智为我们展望了未来人工智能的理论发展和新方向。

中国第一位图灵奖获得者、中国科学院院士姚期智

　　下文为主题演讲全文：

　　尊敬的李强书记、尊敬的各位嘉宾、女士们、先生们，各位早上好!我非常高兴今年能够来参加“世界人工智能大会”，我也感谢组织方邀请我来参加这样一个会议，给我有这样一个机会能跟大家交流，我今天要讨论的话题是“人工智能理论新的方向”。

　　如果我们看周围的话，不管在任何地方，比如说在大会堂当中，我们会看到一些在AI领域新进展以及它的应用的新进展。但与此同时，我们也要记住，所有的这些光环，包括今天看到的这些耀眼的应用，它们其实是来自于一些基础的科学，而基础科学是很多年前就打下的在基础理论方面的基础。所以对我们来讲，我们一定要让这些理论方面的研究，这些新的理论不断地发展，我们应该在创新的新的理论方面有新的突破，特别是在AI这块。所以在今天，我要跟大家来讲一讲的是举一些例子，讲一些我的想法，就是在AI理论这一块有什么样新的进展，特别是最近很多人关注的一些新的进展。

　　另外，我也希望最后，我可以说服大家三点，一个就是理论是很重要的，如果你看一下AI现在面临的挑战、我们面临的这些问题的话，我们可以说可以通过理论来分析这样一些挑战，这样我们能够更清楚地知道我们到底面临的是一些怎么样的挑战，而这样一种澄清也可以让我们或者说至少给我们一些启迪和启示，到哪里去找解决方案。第二点就是人工智能，也就是AI，它绝对是一个跨学科的行业。比如说我会给大家举一些例子，我们获得的一些巨大的成果，在AI方面的一些巨大的成果往往是因为一些看似完全不搭界的学科之间的合作，这肯定也需要几十年的努力，因为没有我们其他学科的一些科学家取得的研究成果的话，那么在AI这一块，我们是不可能取得这么快的一个发展。第三点就是我希望通过我的这些例子告诉大家一些非常有意思的新的方向，是非常值得去探索的。

　　讲了这些前言之后，那我就开始吧。

　　跟大家来讲一讲，这个是我想给大家讲的三个例子。第一个是可能刚才李彦宏先生也讲到的就是深度学习和神经网络，这是现在很多AI应用的基础，所以我要给大家讲的是一些理论性的问题，就是机器学习的这些专家也是非常感兴趣的，就是和拓扑学之间的联系，这是数学非常有意思的分支。第二个例子就是关于AI人工智能和关于隐私的一些担忧之间的关系，其实也就是密码学，这是AI的一个非常全新的领域。第三个是很多人也非常感兴趣的一点，但是也是充满争议的一个话题，那就是可控的超级人工，就是所谓的Super AI，因为人们比较关心的是AI快速的进展可能会带来一个对于人类社会的威胁。

　　首先，我来讲讲第一点，深度学习获得了成功，其实很多人是没有预计到的，因为它是很多年以来都没有什么进展，可以说是静止的，直到突然之间到达了一个点就是几个要素集合在一起之后，使得我们看到深度学习和神经网络有这么巨大的应用和影响。但是为什么神经网络这么的成功呢?它仍然是很多人觉得是一个迷失，不知道为什么，很多人都在去想、都在去追究神经网络的力量到底来自于哪里。因为如果你能够理解神经网络的成功的话，那么也许你就会知道如何来改善神经网络，并且取得下一个的突破。

　　我们来看一个简单的例子，就是神经网络能做什么。比如说，我们看到图片数据，这是一个波动的数据，比如说你要有一个算法来看这样一个气候的形势，来分析这样一个气候形势，然后来分析它到底是一个暴风呢，还是一个正常的现象。一个比较标准的方法或者说电子工程师去看待它的一个视角呢，这么多年以来就是你会看一张图，把它看作是一个二维或者是三维的一个表现，然后希望从中找到范式，然后去看一下这张图或者说一个风暴的特点是什么。但是在深度学习当中或者说在最近的一些机器学习当中，人们怎么来看待这张图呢?他可能是从一个更高层次的角度，整张图应该被认为是一个高维度的点、一个高维的数据。比如说看猫的图片，如果是猫的图片的话，它可能是包括几百万个象素，所以它可以被代表成一个一百万维的一个点，所以这其实现在就是AI的一个标准的机器学习的方式，我们如何来分析一个内容，比如说给到一个数据是一个点，但是它是一个极高维度的一个点，然后我们去分析这个点是不是属于一个数据集，那么这个数据集就是叫猫的图像。所以抽象来讲，我们可以看一下所有的猫的图片，它是一百万维度的一个子集，没有人知道在高维度当中的数据集是什么样的情况，可能我们对于低维度的数据是有一个感觉的，但是其实是有非常多的洞见。但是我们的任务就是尽管不知道数据集是什么样的形状，但是我们如何来设计一个算法来做出一个很好的判断呢，所以一个核心的在神经网络，这样一个计算网络当中的核心问题就是神经网络要达到多大的大小和深度，然后可以来区分一个猫的图片和一个其他非猫的图片。在高维度的情况下，数学家是一直在关注这个高维度的数据集，而且关注了很多年，所以一个自然的问题就是如果我们去了解神经网络它能做什么，那么我们想要知道什么样的数据集是神经网络比较容易去识别的，以及什么样的数据集是我们不能够用神经网络来解决这样一个问题的。结果就是在过去十年当中，在做神经网络的这些专家，他们开始这样子一个思考，事实上我们也看到一些在这些的结果出来，就是把一些很好的数学和神经网络的能力联系起来，然后来做计算。

　　我给大家解释一下什么意思，一个非常重要的概念，在拓扑学当中非常重要的概念是应用在高维度的子集就是贝蒂数，贝蒂数是一个数列，最低的是b0，它就等于一个子集当中不相关的元素数，而bi是什么意思呢?你可以把它认为是它代表着在子集当中有多少个洞，比如说你有一个平面上的圆圈，b0=1就是一个元素，bi也=1，在中间是一个洞，你可以这样来看待。下面更复杂的案例，我们看一个环面，就是像一个圈圈饼一样，它的表面bi也就是一维洞的数量等于2，因为有两个不同类型的圆圈，而每一个圆圈就代表着一个洞，在表面上有一个洞。如果说这些数字集合在一个数列就称为总的贝蒂数，这个贝蒂数从数学的角度来讲，你看到它的话就是告诉你一个数据集在高维度的领域有多大的复杂性，这就会让我们可以去猜测，在过去十年，我们其实一直在考虑这个问题就是如果一个数据集是非常复杂的，那么对于神经网络来讲，它就更难去识别它。事实上这种灵感或者说这种感觉是对的，通过一些经典的拓扑学的理论，然后再加上一些洞见，也就是理论计算科学家的一些洞见，在十几年以来，我们是可以证明这样一种理论的，所以这也是给了我们一个证据，我刚才讲的这一点，就是当你想要去解决一个AI问题的话，有意思的人工智能的问题的话，你不妨从另外一个学科的角度去考虑这个问题，这个案例当中讲的就是拓扑学，在拓扑学方面的一些概念、一些技术、一些复杂度的理论就可以让我们获得一种新的在AI方面的理论，这如果只是看AI是不可能的，因为可能花了一百年的时间，这个数学家才达到了我刚才讲的这些拓扑学的理论。

　　我们再讲第二个例子，关于隐私的保护。之前的这个案例，我是先讲了AI就是人工智能的面临问题，然后它可以跟其他的学科进行合作，然后来解决AI的问题。但是在第二个案例当中，我首先先讲另外一个学科，这个就是密码学。我本人对密码学是非常感兴趣的，特别是所谓的多方计算MPC，这个东西其实也是存在了很多年，而且它背后基本的理念是这样的，你要做什么呢?假定说你有很多不同的当事方，每个方面都有一些数据，但是你需要所有各方的数据集合在一起之后才能够去挖掘，比如说通过AI来挖掘或者说去找到一些重要的成果或者结果，但是所有当事方所拥有的数据是秘密的数据，而且是非常有价值的，他不希望来揭露自己的秘密给到其他的第三方知道，我们是不是可以做这件事情呢?是不是可以让人与人之间的传播和沟通来获得计算的结果，但是你不知道，也不需要去揭秘说这个数据是属于谁的或者揭秘这个数据，你是不是可以把委托给这群人以外的第三方再去做计算，然后给你结果就可以了，所以这是一个非常重要，也是非常隐私的信息，你知道你肯定是没有办法把它，你是不信任别人的，你不信任别人说使用你的数据，我们是不是可以通过密码或者说多方密码的一个做法来实现这个结果呢?其实是可以的，可以通过密码学来实现这个目标。很显然，这样的技术是有各种各样的应用。

　　还有就是这种类型的技术，密码学的技术很早就已经开发出来了，在当时其实这个应用是非常少的，但是在那么多年之后，我们说这个成本大大地下降，而且技术也使得我们现在确实是可以做。

　　举个例子来讲，这是一个非常简单的例子，不同的制药公司他们是一起希望共同来做一个新药的开发，但每一个制药公司都有一点自己的机密信息，这个现在就可以做了，其实有一篇论文就是可以来这样做的。

　　最后一点，我觉得真的蛮有意思的，因为很多人就担心说是不是会出现所谓的叫超级人工智能就是Super AI，当然我们也不知道超级人工智能会不会出现，但是伯克利大学的教授去年有本书，这个书当中讲了一个非常有意思的概念，尽管我们不知道超级AI会不会来，但是我们最好是做好准备，所以他就提出了一些很好的方法论或者说方法，来用一种非常具体的方法来做好准备，这个所做的方法就是用我们的概率理论和用博弈论的理论。

　　我要告诉大家一个基本的概念就是现在的应用，它是来自于过去的理论研究。比如说，这是一个基本的科学的原则，我们现在做的理论研究总会在原来的某一天可以让我们获得巨大的进步，就好像刚才李彦宏先生所讲到的。

　　这就是我的分享，谢谢!

（转载）

标签：世界人工智能大会 WAIC

我要反馈