多智能体系统multi-agent system 创始人 Victor Lesser 访谈:研究就是一个复杂的搜索过程

 

 Victor R. Lesser简介:

Victor R. Lesser,多智能体系统领域的创始人,马萨诸塞大学安姆斯特分校名誉教授。他在多智能体和「黑板」系统做出了突出贡献,其重点研究领域包括复杂 AI 系统的控制和组织等。他曾担任 AAAI 创始 Fellow、IEEE Fellow、多智能体系统国际会议(ICMAS)的首届主席、国际智能体及多智能体系统协会(IFAAMAS)创始主席等,还获得了 2009 年IJCAI 「卓越研究奖」等重要奖项。

 

多智能体系统(multi-agent system,缩写M.A.S.)简介

,是由在一个环境中交互的多个智能体组成的计算系统。多智能体系统也能被用在解决分离的智能体以及单层系统难以解决的问题。智能可以由一些方法,函数,过程,搜索算法或加强学习来实现。尽管存在相当大的重叠,然而一个多智能体系统并不总是一个基于智能体的模型(ABM)表现一致。ABM的目标是寻找遵循简单规则的智能体(这些智能体不需要体现出太强的“智慧”)集体行为的解释,通常在自然系统又或者解决具体的工程问题。ABM的术语经常在学术界被运用,而MAS的术语经常在工程技术中运用。多主体系统的研究课题可以给予一个合适的视角去观察网络贸易,灾害应对以及社会结构建模。 [1]

 

在本次「 IJCAI 50 周年」系列专访报道中,AI 科技评论也采访到了 Victor Lesser,跟他聊了聊他 40 多年的研究历程、对于目前 AI 领域发展的看法以及他与 IJCAI 的一系列故事。

作为多智能体系统的先驱研究者, Victor Lesser 依旧在该研究领域勤耕不辍,其中特别值得一提的是,他还在研究工作中引入了强化学习的方法,为传统 AI 和热门 AI 之间的结合做了一个很好的示范。不过同时他也指出,虽然深度学习这些年的成功为 AI 领域带来的影响巨大,但是其他传统 AI 领域所取得的成果同样也值得大家关注,也希望深度学习的光环不会因此而掩盖掉其他 AI 领域所取得的成就

而在回顾自己的研究生涯时, Victor Lesser 特别强调了「热爱」是他选择这一研究领域并始终坚持在这一领域深耕的动力,而这也是他分享给后辈研究者的人生经验和建议:热爱永远是最重要的驱动力。

关于他与 IJCAI 的历史渊源, Victor Lesser 也感慨万千,在 IJCAI 上发表了人生首篇 AI 论文,参加的首个 AI 会议也是 IJCAI,因而 IJCAI 对于他来说意义非凡,正因为此, 2009 年获得 IJCAI「卓越研究奖」也被他视为研究生涯的盛高荣誉。今年恰逢 IJCAI 50 周年,Victor Lesser 也送上了真挚的祝愿:未来漫长岁月,愿 IJCAI 依旧生生不息。

以下是 AI 科技评论与 Victor Lesser 的对话实录。

个人研究生涯回顾:热爱永远是最重要的驱动力

AI 科技评论:您因多智能体和「黑板」系统而享誉世界,当初您选择这一研究方向的契机是什么?

Victor Lesser :在我大学早期阶段,我曾开发出一个分布式操作系统,自此以后,我就对如何让半自动化的子系统一同工作的研究深为着迷。之后在研究生阶段,我的论文就是设计一种能够为处理交互提供硬件支持的平行微处理器架构

早年对这一研究方向产生的兴趣,也让我之后自然而然地开始从事多智能体系统和「黑板」系统的研究工作。

AI 科技评论:您被誉为多智能体系统的奠基人,那在您的研究生涯中,您认为最具代表性的成果有哪些?

Victor Lesser:这其实是一个相当难回答的问题,这就像你要回答你最喜欢你的哪个孩子一样。如果非得选一个,我认为我早期的一项工作——将分布式规划应用于系统协作是最具有代表性的工作之一,这项工作是我在上世纪八十年代后期和我的学生 Ed Durfee 合作完成的。

这个项目给了我很多启发,包括:

第一,基于实际考虑去更加正式地考量智能体之间的协作(如分布式规划)成为可能,同时,这个项目也展示了如何在单个框架中表示多种形式的交互;

第二,该项目强调了局部解决智能体问题的控制和协作之间的关联性,即复杂的协作协议要求依次进行复杂的局部控制;

第三,它通过分析可预测性与协作过程中的响应,清楚地表明了智能体协作的复杂性以及从定量角度思考协作的重要性。

 

AI 科技评论:现在有很多研究者都在从事多智能体强化学习的研究,您认为其和您研究的多智能体系统之间有哪些相关性?

Victor Lesser:我开发的协作式多智能体系统与多智能体强化学习之间,其实存在很紧密的联系。

一直以来,针对需要实现协作的分布式搜索过程,我一般都会考虑使用多智能体系统。究其本质,强化学习同样也是一个搜索过程,因而多智能体强化学习实际上就是一个分布式搜索过程。

由于每个智能体都在以增量的方式学习局部策略,转而会影响到其他智能体,所以各个智能体之间实现协作很有必要。除此之外,每个智能体对于其他智能体的整个学习情况的了解都是有限的,所以某种程度上而言,协作框架能够帮助正在学习中的智能体更好地了解其他正在学习中的智能体的情况,这样的话,各个智能体的学习会变得更加高效。

AI 科技评论:您最近在从事哪些研究工作?

Victor Lesser:我最近深度参与的项目之一就是研究多智能体强化学习方法,尤其是研究如何将强化学习同时应用到数千个智能体上。对于在多个智能体上的组织架构和增量和并行的迁移学习中使用多层级控制方案,我非常感兴趣。

AI 科技评论:您从事 AI 研究几十载,是否遇到过比较大或者印象比较深刻的挑战,最终您又是如何克服的?

Victor Lesser:我面临的最大挑战发生在我研究生涯非常早期的阶段(完成硕士论文的阶段)以及我研究生涯巅峰的后期阶段(研究多智能体强化学习中的迁移学习的阶段)。

在完成我的硕士论文时,我面临着一个经典的学生误区,即由于害怕想法无法得以实现,我选择避开发现的一些难题很高的工作。我最终克服这些恐惧的方法,便是鼓起勇气与自信去接受这个事实:即便我无法将我的想法付诸实践,即便我无法完成硕士论文,我都能接受!

并行智能体间的迁移学习相关研究工作则比我硕士论文阶段遇到的挑战还要难得多。当时,我们提出了很多令人兴奋的错综复杂的想法,然后在实际工作中却无法实现。虽然很羞愧但我不得不承认,即便在从事多智能体系统研究这么多年后,分布和并行的复杂性依旧存在很多让我困惑的地方。

最终我们通过使用更简单的方法取得了更佳结果,而这个方法则是启发自我们对于更复杂和「有趣」的方法为什么会失败的深度分析。我现在也不确定当初我的研究团队在这个项目中所投入的所有努力是否值得,但我认为,要想成为一名优秀的研究者,你就必须要有某种程度的决心和信念:问题再复杂,你最终也能找出解决方案。

AI 科技评论:作为一名资深的计算机科学家,您有哪些可以分享给 AI 领域的后辈研究者的建议?

Victor Lesser:我认为,从长远来看,一名好的研究者必须找到他能够持之以恒地热爱的研究问题和方向。对于我而言,研究就是一个复杂的搜索过程,而在这个过程中,并不是所有的路都是一帆风顺的。只有当你无所畏惧地带着热情去探索,你才能真正获得成功:热爱永远都是最重要的驱动力。

深度学习之外,AI 其他领域亦有所成就

AI 科技评论:实际上,您的研究方向偏传统 AI,与当下如深度学习等热门的研究方向存在着很大的区别,您怎样看待二者各自在 AI 领域扮演的角色?

Victor Lesser:目前,一些研究者直接将 AI 的概念与深度学习和强化学习等同,某种程度上,他们可能是正确的。

然而尽管如此,我还是认为符号化推理方法在 AI 领域同样扮演着非常重要的角色。例如,在我自己的研究工作中,我就解决了如何让 AI 系统更具自我意识和弹性的问题,即让系统能够意识到它们所基于的假设在当前问题的场景中不再有效,从而开发出适用于当前场景的合适的新假设,之后再基于新的假设来构建新的解决问题的策略。

对于我而言,问题就在于系统是否以及如何学到这种类型的知识,以及现有的深度学习框架是否以及如何能引入这类学到的知识。我认为,在未来的时间里,我们能够开发出一个能够同时结合深度学习和符号化推理方法实现推理的系统框架。

AI 科技评论:随着深度学习为 AI 领域带来了革命性的影响,有很多传统 AI 领域的研究者们也开始将新的方法应用到他们自身的研究工作中。在您此前的研究工作中,是否也有考虑应用这些新方法?

Victor Lesser:在我最为活跃的研究阶段,AI 领域还尚未完全意识到深度学习所带来的巨大影响。然而,在我早期的工作中,即 20 世纪 70 年代早期研究「黑板」系统期间,我就喜欢将深度学习方法应用到问题解决的控制系统中。

怎样手动合适地调整系统控制决策中使用的参数,当时对于我们而言是一个非常难解决的问题。之后我们尝试用深度学习来解决这个问题,但是结果失败了,因为我们缺乏足够的样本数量,更重要的是,我们并不理解如何才能合适地预估复杂搜索过程中发生的行为,并将这些行为用作深度学习的输入。

之后,在我从事多智能体系统研究期间,当我们开始拥有足够的计算能力去生成大规模的实验数据集时,我便开始将深度学习应用到多智能体控制问题的部分研究工作中。

现在,我考虑的一个比较有意思的问题就是,我们是否能够利用深度学习让系统从头开始构建完整的多步协作协议,而不是让系统通过学习知识来使得手动设计协议变得更有效

AI 科技评论:实际上,现在有很多人指出目前深度学习存在「过热」的问题,您怎样看待这一问题?

Victor Lesser:深度学习技术取得了如此巨大的成功,因此也值得大家投以如此大的关注。然而,这项技术所存在的问题和局限性也显而易见,并且目前还尚未明了的是,深度学习能否被超越。

而深度学习之外,概率和策略推理、规划以及符号化 AI 等其他领域,目前同样也取得了很多令人兴奋的成果。所以我希望,深度学习的光环不会掩盖掉其他 AI 领域所取得的成就

AI 科技评论:您认为 AI 未来的发展应该是怎样的?

Victor Lesser:我对于 AI 未来的发展总体非常乐观。但与此同时,我认为研究者们需要开始以更长远的视角看待人工智能技术的意义,并以此作为决定去解决人工智能领域存在的哪些问题以及如何解决这些问题的依据。

我在上世纪 70 年代开始研究语音理解之前,就从未思考过 AI 技术对于整个社会的意义。例如,我不是很乐于看到人类通过电脑而不是直接面对面交流,所以如果考虑到这一层问题,我们该如何去改善这项技术,从而不会给社会造成负面影响呢?这是需要得到目前研究者重视的一个重要问题

IJCAI 50 周年寄语:未来漫长岁月,依旧生生不息

AI 科技评论:您于 2009 年获得 IJCAI「卓越研究奖」,还记得当时的心情吗?能否分享下?

Victor Lesser:当我了解到自己获得 IJCAI「卓越研究奖」那一刻,是我人生中最开心、最激动人心的时刻之一。我记得并感激所有在我的研究生涯中给予我帮助的人。

同时,我也要感谢幸运女神的眷顾,这个世界上有那么多甚至比我更加优秀的人,而之所以我能获得这个重要的奖项,很大程度上是我比他们要更加幸运,也就是说我恰好处在正确的时间和正确的位置。

AI 科技评论:您曾担任 AAAI、ICMAS 等多个会议的 Fellow 或主席,那您认为 IJCAI 和这些会议之间有哪些区别?

Victor Lesser:IJCAI 作为 AI 领域的首个国际性的学术会议,一直以来都被该领域的研究者们视为发表论文和参加会议的重要殿堂。它让世界各地的研究者们汇聚一堂,同时囊括 AI 领域的各个交叉子领域,能够很好地推动这些子领域之间的学术交流和思想碰撞,从而推动整个 AI 的发展、

我的第一篇 AI 论文就是在 1975 年发表在了 IJCAI 上,同时,IJCAI 也是我参加的首个 AI 会议,因此它对于我而言,意义非凡。

AI 科技评论:您认为 IJCAI 应该在 AI 的发展中发挥怎样的作用?

Victor Lesser:我认为 IJCAI 是一个供来自世界各地的 AI 研究者交流的重要平台,但除此之外,如果它还能够为科研工作者提供资助,让来自不发达国家的研究者们也能够参加到这一会议中来,能够发挥出更大的价值。

AI 科技评论:今年是 IJCAI 的 50 周年,您对 IJCAI 2019 有哪些寄语?

Victor Lesser:随着很多会议或机构逐渐从这个世界消失,我很欣慰看到 IJCAI 在漫漫历史长河中能够继续存活下来,并且越来越好。

我希望并期待在未来的漫长岁月中,IJCAI 依旧生生不息,能够在 AI 这个快速向前发展的领域继续为世界各地的 AI 研究者们提供一个生动而有趣的思想碰撞和交流的平台。

附录:多智能体系统应用

1、智能机器人

在智能机器人中,信息集成和协调是一项关键性技术,它直接关系到机器人的性能和智能化程度。一个智能机器人应包括多种信息处理子系统,如二维或三维视觉处理、信息融合、规划决策以及自动驾驶等。各子系统是相互依赖、互为条件的,它们需要共享信息、相互协调,才能有效地完成总体任务,其目标是用来结合、协调、集成智能机器人系统的各种关键技术及功能子系统,使之成为一个整体以执行各种自主任务。利用多智能体系统,将每个机器人作为一个智能体,建立多智能体机器人协调系统,可实现多个机器人的相互协调与合作,完成复杂的并行作业任务。

多智能体系统应用

2、交通控制

由于交通控制拓扑结构的分布式特性,使其很适合于应用多智能体技术,尤其对于具有剧烈变化的交通情况(如交通事故),多智能体的分布式处理和协调技术更为适合。

3、柔性制造

多智能体技术应用在柔性制造领域,可表示制造系统,并为解决动态问题的复杂性和不确定性提供新的思路。如在制造系统中,各加工单元可看作智能体,从而使加工过程构成一个半自治的多智能体制造系统,完成单元内加工任务的监督和控制。多智能体技术可用于制造系统的调度、制造过程中的分布式控制。

4、协调专家系统

对于复杂的问题,采用单一的专家系统往往不能满足要求,需要通过多个专家系统协作,共同解决问题。利用多智能体技术,可实现多专家系统的协调求解。

5、分布式预测、监控及诊断

智能体具有意图的性质,利用多智能体的联合意图机制可实现联合行动,从而实现分布式预测与监控。

6、分布式智能决策

采用智能体技术将多个专家系统的决策方法有机地协调起来,可建立基于多智能体协调的环境决策支持系统。智能体采用基于规则的描述方法,可实现环境管理的分布式智能决策。

7、软件开发

利用计算机来开发多智能体系统,称为软件智能体。软件工程的研究从模型角度考察智能体,认为面向智能体的软件开发方法是为更确切地描述复杂并发系统的行为而采用的一种抽象的描述形式,是观察客观世界和解决问题的一种方法。

8、虚拟现实

采用虚拟智能体技术建立了电子市场的模拟系统(MAGMA),可实现电子市场中的货物储藏和买卖机制以及银行信贷和金融管理机制,并设计买和卖智能体,提出两类智能体间的直接交互和代理交互算法,并采用异质智能体技术将模拟系统设计为开放式结构。

9、操作系统

利用拟人化的具有自学习能力的人机智能体(IPAI)技术设计VAXVMS操作系统,利用智能体所具有的特性可实现操作系统的自适应功能。智能体IPAI可通过接受用户的反馈使操作系统适应用户的兴趣和习惯,通过识别正确与错误的命令及与其它智能体进行网络通讯实现系统的学习,从而使操作系统在复杂环境下实现与用户的交互。

 

发表评论

电子邮件地址不会被公开。 必填项已用*标注