4月17日下午,湛庐特别邀请圣塔菲研究所客座教授、《AI 3.0》一书作者梅拉妮·米歇尔,中国科学院自动化研究所复杂系统管理与控制国家重点实验室主任王飞跃,驭势科技联合创始人、董事长兼CEO吴甘沙,清华大学计算机系副教授、智源青年科学家刘知远等国内外知名科学家和创业者,以及特别嘉宾达闼云端机器人小姜,一起探讨AI 3.0时代的新商机和新生态。
这次全智能场景发布会第一次采用了演播室和户外智能场景双现场形式,在无人驾驶汽车和云端智能机器人的烘托下,全面展示了中国人工智能领域的创新实力和前沿进展。几位科学家、企业家跨界深度交流,共同探讨了人工智能发展现状,以及透视当下AI发展的关键问题,并对产业布局和政策提出了可供参考的建议,助力未来的想象与开创。
以下为清华大学计算机系副教授、智源青年科学家刘知远的演讲精华内容
清华大学计算机系副教授 智源青年科学家 刘知远
《AI 3.0》的作者米歇尔教授通过深入浅出的方式,把人工智能的发展历程,特别是其内在的技术路线的逻辑呈现给了大家,并提出了人工智能未来发展将会面临的一些非常重要的命题,以及无人驾驶、自然语言处理等人工智能非常重要的应用场景。我相信从技术路线的发展上来讲,未来会有更多探索的可能性。我相信这是所有学者都在追寻的问题。
AI 3.0,一个“大数据”和“大知识”融合的时代
说到“AI 3.0”,那么必然存在“AI 1.0”和“AI 2.0”。人工智能学者有一个重要共识,那就是人工智能的发展已经历了两个非常重要的阶段:从“小数据”(small data)到“大数据”(big data),再到“智慧数据”(smart data)的过程。从语言理解这个层面,我认为人工智能的发展基本上也可以划分成三个阶段。
第一个阶段,自然语言处理最初是从机器翻译开始的。最开始,我们通过人为地编写一些翻译的规则,再配一个词典,以实现机器翻译。这个阶段对应“AI 1.0”。
后来,人们发现这个做法不可行,因为人类的语言千变万化,我们很难通过一套人工编写的规则来覆盖所有情形。到了20世纪90年代,有人提出用机器学习方法,通过大规模的数据,让人工智能自动学习翻译的规则。随后,人们进一步使用神经网络来挖掘每个词背后的深层语义信息,以实现对整句话的理解。这是第二个阶段,它对应的是“AI2.0”。
从自然语言处理这个角度来讲,人工智能在这一阶段已经达到一个新的高峰。我们在智源研究院的支持下做的“悟道”模型——超大规模的预训练模型,就是想要用互联网级别的大规模的文本数据来学习各种语言的语言模型。
那么,是不是数据越多、模型越大其语言理解能力就越强?这就要提到人工智能第三个阶段“AI 3.0”,我认为答案是否定的。到第三个阶段一定会有一个更新的框架,人工智能应该能够从大数据里学到更好地反映人类对这个世界认知相关知识的能力,这类似于我们外在有一个世界模型,它一定不是像现在的神经网络,而是应该有知识体系、层次结构,至于它具体是什么样的,从我的角度来看未来应该是要把大数据和“大知识”(big knowledge)结合,即从AI 1.0阶段的符号人工智能路线升级到第三阶段的AI 3.0,充分对人类的知识进行建模,从而支持各种各样的包括自然语言处理在内的人工智能应用。
多模态,人工智能认知世界的全新形式
人类的认知其实是多模态的,有视觉的、听觉的、语言的等,因此我们希望计算机在认识世界时也是多模态的。
米歇尔教授在《AI 3.0》中也提到了,在自动驾驶方面,人工智能领域正越来越多地讨论关于赋予机器常识的重要性,人工智能对于语言、图像的理解需要各种各样的包括抽象能力、类比能力、常识在内的复杂知识的支持。未来的人工智能需要像人一样,构建出关于这个世界的全面的认知体系,这是非常重要的。
最近这两三年在自然语言处理以及在计算机视觉领域有一个非常重要的趋势,那就是如何让互联网上的大规模的文本、图像、视频等数据为我所用,让计算机能够自动从中学习我们的语言、视觉识别的相关知识。其实这几年我们在这方面取得了一个非常重大的突破——预训练模型,也就是说我们不需要再去人为标注任何数据了,我们可以直接让模型从大规模的数据里进行自动学习,因此,我们称之为自监督的学习。
同时,我们希望利用数据驱动的方法从数据中获取更多的关于语言理解的知识,其实这就是from data to knowledge(从数据到知识)。不过,我认为现在的这种“data追问”的方法实际上无法比较好地还原我们人类对这个世界的认知模型,包括抽象层次的结构、复杂的关系,不同类型的知识等。然而,现在的训练模型的确可以通过大规模的数据习得生成流畅语言的能力,这说明它其实已经学到了很多关于语言的知识,比如语法的规则等,互联网上的语言文本的数据,可以看成是我们大脑中语言能力的外在体现。所以,在我看来“data追问”的方法一定是未来的一个非常重要的需要继续坚持的路径。
当然,我们同时也要充分借鉴AI1.0时代人类知识的构建模式,比如我们对于类比、隐喻、抽象学习这样一些相关能力的先验的认识——元认知或元知识,我们要把这两者结合起来。也就是说我们可能会有一些底层的从数据中心获得的比较具体的“知识”,我们可能还会有一些“大脑”,我们要把这两者结合起来,由这些“大脑”指导我们的学习过程,进而得到一个更类似于人类学习能力的语言学习模型,这是我认为的未来自然语言处理的一个重要的发展路径。
“悟道1.0”是智源发布的一个最初版本,我们希望其能够不断演化,在各大高校和研究机构的支持下,利用大数据、大算力以及学生们的聪明才智,一起推动这个领域的发展。
重构人类的知识平台,人工智能的未来使命
在我看来,未来的计算机一定能够更好地服务于我们和我们社会,比如在人的生老病死、衣食住行等各个方面肯定都能发挥很重要的作用。
我主要是从事自然语言处理,具体来说是知识图谱方面的研究,我认为整个人类社会的发展其实是不断积累我们认识世界、改造世界的知识的过程,但其实就我们现在的社会来说,每个人的分工、知识体系其实都是高度专业化的,而且会越来越专业化。
每个人其实都只是整个人类知识的拼图里很小的一块,而且这一块可能会越来越小,因为整个拼图其实变得越来越大了,这时,对于人类社会来说,认识世界、改造世界会变得越来越难。那么,随着拼图越来越大,我们到底该如何学才能更高效地把通识教育学习得更好,这是我们应该思考的问题。比如,对于生物学家或者医生而言,他会面临一些挑战,从去年新冠疫情出现至今,关于新冠病毒的论文已经有几万篇了,那么对于从事这个领域研究的学者来说,他应该如何读这么多论文,其实本身我觉得对于学者来讲,或者说对于人类社会的每个人来讲,他想要再去创造新的知识就会变得越来越难,因为他所需的积累会变得越来越多。
所以,我认为人工智能未来的一个非常大的使命,就是帮助人类把这个平台构建起来,使其成为我们的一个外部知识库,这样一来,我们只需掌握如何去利用这个知识库,就可以更好地认识世界、改造世界。
每个人都能够借助人工智能,走向一个更高的地方
米歇尔教授在书中最后提到了6个问题,其中计算机能够具有创造性吗?我们距离创建通用的人类水平人工智能还有多远?都是非常关键的问题,需要我们不断地去探索并找到答案。
20世纪五六十年代的学者在面向未来时,他们也不知道该如何走,他们各自提出了一些技术路线,然后不断得以演化,这也是一个跌宕起伏的展过程。虽然人工智能至今只有近70年的历史,但其发展历程可谓波澜壮阔,经历过高峰,也经历过低谷。这一发展历程正体现了一代又一代的人工智能学者的不懈探索。
说到人工智能的发展,它源于很多领域专家的共同努力,比如数学家、控制论的专家、计算机专家以及脑科学家和神经科学家等。所以,人工智能其实是一个交叉学科,其中甚至包含一些哲学、伦理学方面的研究。
因此,未来人工智能的发展需要摒弃“人工智能就是一门独立的学科”这种观念,我们需要综合多学科的努力才能推动这个领域的发展。那么,在人才培养上,我们应该重视培养交叉学科的能力和专业素养,这是人工智能跟其他的学科发展的不同之处。
每个人都在不断地探索这个世界、获取新的知识,但是这些知识可能都是散落在各处的,我希望未来的人工智能像粘合剂一样,把这些知识拼出一个人类认识这个世界的途径,使得每个人都能借助人工智能,走向一个更高的地方。