由25个AI组成的小社会能有多温馨?斯坦福大学研究员做了个实验……

GameLook专稿,未经授权不得转载!

GameLook报道/人类似乎素来对观察智慧体(无论是人类还是非人类)之间如何产生互动这件事饶有兴致,一个例证是,让游戏中的电脑玩家互相对战,是B站UP主间历久弥新的热门“整活”题材。

UP主“破军歌姬丶诱宵美九”让《红色警戒》电脑玩家还原美苏大战,获得80余万播放;三百多万人曾观看象棋UP主“四郎讲棋”讲解步步妙着的高性能象棋AI大战,是这名UP主播放量最高的视频;在生成式AI的年代,人们又沉迷于观看GPT-4面对百度“弱智吧”的烧脑段子如何闪转腾挪。

在海外也有类似的现象。GameLook曾经报道过一个名为《Rival Peak》的“假人秀”节目,节目中没有嘉宾,仅有12名AI角色参与。节目将每周淘汰一名AI参赛者,而参赛者的目标是通过团结协作解决谜题并生存到最后,观众可以通过观看直播投票对特定的AI进行帮助或阻碍,影响节目走向——这场“假人秀”吸引来超过1.5亿次观看、观众来自55个不同的国家。

无论是《楚门的世界》中人类对楚门24小时全天候的“窥私”,还是《模拟人生》系列将对NPC角色日常行为的观察作为核心玩法驱动力,它们都在用一个又一个案例向我们不断证明,对他人的社会性行为进行观察是植根于人类基因的渴求。

在《红色警戒》或是《模拟人生》中,仅凭借行为树决策驱动的简单AI行为就可让千万人看得如痴如醉,而在生成式AI的时代,AI将拥有更贴近人类情感、更具涌现性的情感表现,而更像人类的AI们社交起来,又会是什么模样呢?

一群来自斯坦福的AI科学家,就在近日玩了这么一把AI社会实验。

斯坦福研究:生成式AI如何形成小社会

斯坦福大学的6名AI科学家近期发表了一篇有趣的论文:

论文链接:https://arxiv.org/pdf/2304.03442v1.pdf

Demo演示:https://reverie.herokuapp.com/arXiv_Demo/#

在这篇论文中,他们搭建了一个由25个大语言模型驱动的AI组成的AI实例。每名AI角色都被赋予了独特的背景故事、性格特征、人际关系等人物特征。例如,“Mei Lin是一名大学教授,他的儿子Eddy Lin是一名音乐学生,丈夫John Lin很爱他的家庭,并且和邻居夫妇二人十分相熟,已经有了多年的友谊……”

除此之外,每名角色还遵循一定的时间日程安排表活动,会进行起床、刷牙、做早饭一系列活动。而这些角色被放置在一个设施完备的小城镇中,镇上酒吧、学校、药店等生活设施应有尽有,角色的家中也安置了卫浴、卧室、花园、炉灶等生活模块。AI角色可以通过行为与生活设施互动,也可以通过自然语言与其它NPC产生交互,AI角色的心理活动也会用自然语言表述出来。

斯坦福的研究者们为AI提供了足够细致而拟真的生活环境,除了使用2D的画面风格外,一切的设计都俨然在还原真实的小镇生活。而AI毫不让人失望,为我们提供了颇有趣味的实验结果。

研究者们发现,这些AI角色会主动观察环境要素和其它AI角色行为,并做出实时的判断和决策。例如,当早饭糊了的时候,AI会关闭燃气灶、在厕所坑位正在被使用时,AI角色会耐心地在厕所外等待。AI可以根据人物的性格和动机主动生成待办事项,并根据环境实时评估调整任务执行顺序。

AI之间还时不时会产生颇有实景感的对话。例如,John和Mei夫妇就在某日的早晨谈论起了他们儿子Eddy的情况:

  • Mei:Eddy去上学了吗?
  • John:没错,他刚刚离开了家里,他正在完成一个作曲的作业。
  • Mei:这太棒了!继续和我说说有关情况。
  • John:我认为他很享受作曲的过程,他告诉我他在作曲中获得了很多乐趣。
  • Mei:这太棒了,我真为他感到骄傲!

而这一对话中涉及的信息来自John在那天早些时候与儿子Eddy产生的对话。Eddy告诉他的父亲,他正在写一段作曲作业,并且很享受这一过程。

有时候,AI之间还会聊起八卦,探讨他们在镇上的所见所闻。一天,Sam Moore告诉了Tom他想要竞选市长的消息。当天晚些时候,Tom和John开始讨论起了这一新闻:

  • John:我听说Sam Moore正在竞选市长,你认为他获胜的可能性高吗?
  • Tom:我认为他胜选的可能性很高。他一直在为我们的社区努力做出贡献,我认为他会获得很多支持。你觉得呢?
  • John:我很高兴他参与了选举,我很好奇还有没有其他人参选,我对选举的最终结果也同样好奇。

据研究组总结,AI之间产生了涌现性的社交行为,其具体表现为信息交换,社交关系记忆,人际合作三大方面。换句话说,AI之间通过大模型的涌现现象产生了信息的传递,并建立起了基本的人际关系。

从理论上,如果观察的时间足够长,或是进行外部信息的输入,我们或许还可以看到AI进行谈恋爱、约会活动等更加复杂的人际交互。

“活”过来的NPC,数不尽的未来机遇

人类的行为本身具有极高的复杂性和随机性,而对于采用行为树规则的传统的游戏NPC来说,假若想要获得类似表现的智能程度,不仅需要通过穷举法穷尽各种场景,还要提供海量的代码支撑——《矮人要塞》就是这样“大力出奇迹”的最佳案例。而在大模型的帮助下,其解决方案就要简洁优雅得多。

为了更好地还原人类的社交模式,斯坦福的科学家为这类生成式智能生命体搭建出了一个记忆——反思——计划的三重循环模型。首先是记忆,即将NPC的所见所闻用自然语言的方式作为记忆储存,并按照相关性、重要性和紧迫性给出相应权重。记忆也被设定为会随着时间消散。

其次是反思:NPC会将自己的记忆进行总结,提炼出要点和结论,并以此影响后续的行为。第三是计划,NPC会根据此前得出的结论、结合环境因素对未来的行为进行重分配。而以此得出的行为计划会被送入记忆和反思循环。

在观察NPC行为的趣味之外,这一实验的结果为我们证明了一个重要的结论:在大语言模型的支持下,AI也可以如人类一样,按照情景、设定和逻辑进行社会性的交际。在《Her》、《银翼杀手》等经典虚构作品中,人类曾对可进行自由交际的智能仿生人做出了幻想,而此次的斯坦福实验,或许可以被看作是迄今为止最接近这些科幻想象的技术实验,也为未来人类的娱乐形态提供了无穷的想象空间。

《银翼杀手2049》电影截图

假如为《辐射》、《上古卷轴》这类大型开放世界RPG作品中的NPC赋予智能,那么这些旅程会比如今的开放世界作品更富有“人味”,极大地倍增游戏的体验感与真实感。如今被暂时打入冷宫的元宇宙概念,或许也能够凭借虚拟NPC概念变为现实。像《银翼杀手2049》中出现的虚拟人伴侣,在未来或许也会成为商业市场上的重要业务……

但前方也不是一片康庄大道。与高智能随之而来的算力矛盾,似乎还看不到解法——斯坦福研究者称,仅仅提供25名可进行简单2D交互的AI计算力,就已经穷尽了他们所掌握的计算性能。而在NPC形态越来越复杂,智能NPC数量需求更高的虚拟世界,人类的总算力恐怕还要增长好几个数量级才能满足这一新兴需求。在摩尔定律已然失效的当下,这一未来离我们还有多远呢?

如若转载,请注明出处:http://www.gamelook.com.cn/2023/04/514856

关注微信