【GameLook专稿,未经授权不得转载!】
GameLook报道/虽说DeepSeek是今年AI热潮的引爆者,但生成型AI(GenAI)并不是2025年才成为“当红炸子鸡”。
早在2022年的时候,ChatGPT的问世就带来了大量的大语言模型(LLM)被科技圈和资本市场青睐,当然,游戏市场也不例外。不过,除了文生图、文生3D资产外,GenAI在游戏业很热门的一个应用方向,就是做智能NPC。
当然,由于需要大量的训练、高昂的制作成本和对专业人才的高要求,智能NPC目前还只是大厂在尝试。此前的GDC 2024大会上,育碧团队分享了使用GenAI做智能NPC的7条经验,我们不妨看看,欧美大厂是怎么运用AI做智能游戏NPC的。
育碧团队总监Xavier Manzanares
以下是Gamelook听译的完整内容:
Xavier Manzanares:
我叫Xavier Manzanares,是制作人和团队总监,主要从事新技术、创新和游戏设计,还包括游戏交付,我最近交付的项目包括《马力欧疯狂兔子:王国之战》、《马力欧疯狂兔子星耀之愿》,以及相关DLC。在任天堂工作是很好的体验,他们很注重以玩家和玩法为中心。
今天与我一起分享的还有Virginie Mosser(叙事总监)和Melanie Lopez Malet(高级数据科学家)。Virginie在育碧很多年了,在多个媒体领域有着非常丰富的叙事设计经验,她今天会谈到很多叙事方面的东西。Melanie从教授文学转行到了技术行业,将AI与文学融合来以全新方式讲故事,她会讲数据科学方面的事情,因为我们得到了大量的经验。
总的来说,我们的团队加起来有30人左右,分布在巴黎、Montpellier和蒙特利尔。需要说明的是,开始的时候没有人从事过生成型AI(GenAI)或者机器学习(ML)。因为在2022年到2023年的时候大语言模型(LLM)遍地都是,我们可能都听过NLP、LLM这些术语,每天都有相关的科学文献发布。
但我们听到了很多正面的东西、很多负面的东西,对我们而言,很重要的是避开这些噪音,直接上手体验。因为我们有着设计和交付游戏的经验,知道科技和设计意味着什么。对游戏人来说,科技并不是唯一重要的,工具本身并不能打造伟大的游戏。想要做优秀的游戏,它需要与游戏设计和设计愿景混合、融合,这里说的设计,包括游戏设计、剧情设计、美术设计等等。
因此,面对覆盖面巨大的生成型AI技术,我们决定一步步来,最终决定从NPC开始,因为很多类型的游戏都有NPC,我们可以从这里开始,看生成型AI能够给NPC带来什么。这不是把ChatGPT插入NPC的大脑中,而是玩家们与NPC的互动可以做到多有意义。
所以,我们并没有直接把LLM做到NPC当中,而是首先做互动,因此我们的话题是意识、语言、感知、情绪、道德、玩法、个性等等,还包括围绕NPC的系统。我们尝试了一年,所以积累了一些经验心得,想要在GDC的舞台上与同行们分享。
在分享心得之前,先展示一些我们做的NEO NPC系统的Demo:
NPC的表情会根据对话内容的变化而改变,这是让互动变得更自然、更有响应的关键。
实时探测玩家的互动,不管是夸夸其谈、赞扬或者道歉,都会直接影响NPC的互动。
这些互动不仅可以提升社交技巧,还可以解锁有价值的知识。通过有建设性和主动地互动,玩家可以提升与NPC的关系等级。这可能对于衡量进度是有帮助的,还可以解锁游戏里的新互动选项。
通过让NPC动态化调整他们的情绪反应并基于玩家的输入做出反馈,游戏可以带来更深度的叙事沉浸感和更加个性化的故事体验。
我们的第二个焦点,就是让NPC意识到动态兴趣点,他们在游戏里的反应,融入到了游戏世界中。NPC会意识到任务更新和大事件的发生,在游戏过程中提供具有情景化的评论和反应。与世界中的兴趣点你互动的NPC,增强了游戏世界的互动性。
最后,我们探索用NEO NPC做战略决策,这些NPC可以作为合作伙伴,辅助任务规划并适应你的策略。通过分析场景,可以带来定制化的策略。
通过独特的互动,NPC可以提供任务和支线任务,丰富游戏体验并展示AI合作的潜力。让NPC帮助玩家做出战略决策,为解决问题带来了团队精神。
这些只是我们尝试过程的一瞥,我们的目标是利用AI技术来丰富叙事与玩法,为NEO NPC为更具沉浸感的游戏世界做出贡献铺平了道路。
我们的尝试带来了7条经验,真正重塑了我们用AI研发的方式。
1、拥抱新团队动态
首先,团队动态的升华。开始这个实验的时候,我们没想到的是所需的工作量。GenAI支持的NPC需要所有部门的介入,游戏策划、游戏编程、任务设计、音频等等,每个部门都要在这个话题上投入大量工作。
不过,这些对我们来说都是预料之外的,因为一年前开始的时候,我们都不知道有什么预期,而且我们必须提高团队人数。我们看到了团队在角色和看法方面的重大变化,比较重要的是数据科学、游戏策划、叙事设计和编程技术四个团队。
第一个是数据团队,通常他们是辅助角色,取决于你的游戏品类和需求。但这一次,他们成为了团队的一部分,数据科学家、机器学习工程师,当然还有数据分析师,他们都是团队的一部分。
然后是游戏策划,他们之前在GenAI领域没有经验,因此要学习了解认知设计话题,数字(大脑)结构、情绪矩阵等更多东西。
接下来是叙事团队,这是很关键的部门,但我们必须管理叙事涌现(narrative emergence),如果你从事过系统设计,就会知道什么是涌现,用了GenAI,这种情况就会升级。对于游戏叙事,我们就必须管理质量、输出,这对于叙事团队而言是一个重大转变。
对于程序员来说,技术堆栈也很不同,图中可以看到。不过我们说的是不同的API,比如我们使用的来自Inworld的角色API,然后是TTS/STT,我们为这次演示和整个试验使用了多个LLM。所以这次试验使用的技术可能与你从事过的项目都不同,对我们来说也是很糟糕的情况。
我们的目标是让玩家与NPC互动时响应的延迟降低,这是做GenAI NPC团队需要解决的重要问题。
2、深化游戏叙事
我是一名脚本写手和作家,从20几岁就开始了,我热爱写故事、创作传说,当我转型GenAI的时候,我问自己,以后还能创作吗?这是个很难的问题,我有听过很多有关GenAI的事情,并不是所有都是正面的。
然而没有人告诉我,在没有提前写好对话的情况下,与一个角色对话会是怎样的,这样就像是为他们搭好舞台,让他们给你带来惊喜。这就像是教学生一样技能,然后看他们发挥的如何。
不过,我第一个想的问题是,令人难忘的角色和容易被忘记的角色,之间的区别是什么?
这些令人难忘的角色背后,或许都有一个共同点火花:他们是有灵魂的。当我首次涉足GenAI的时候,灵魂的辨识影响了我的每一步。NEO NPC非常饥饿,他们需要太多的内容训练才能创造改良后的NPC。
想打造属于游戏世界的NPC,我们需要投入很多内容,包括背景故事、情绪、个性、缺点、对话风格、目标等等。
一个只会打招呼的角色,给人的感觉不像是真实的机器人,但这是我的开始。你在内容方面投入的越多,比如背景故事、他们的动机、特性特点,他们来自哪里,他们就会变得更丰富、可信,这时候就要用到GenAI。
这需要对NEO AI系统的角色个性进行深度探索,你要给他们增加对的问题,他们热爱什么、我希望他们在玩家心目中唤醒的是什么样的情感?所有这些内容信息创造了角色的脑图细节,包括他们的关系图,然后加入Inworld创造一个角色。
如果你觉得一个角色有了这些就不再需要你的创意输入,我这里长话短说,这种想法非常错误。因为,如果要创作这么多的内容,就非常需要一个框架,接下来让我的同事Melanie 介绍相关的内容。
3、创作一个定制化AI框架
首先,为什么要做一个AI框架?当你做一个由LLM支持的玩家输入系统时,可能会认为非常有趣,因为玩家们的输入是开放式的,你能看到任何想看到的东西,做任何事,LLM会给你一个答案,角色扮演本身就已经很有趣了。
有了这些,你可能打造一个非常有趣的叙事沙盒,比如《AI Dungeon》会让你不断发笑,而且可玩性极高。你还可以让LLM与知识结合,做更多叙事的同时,还可以对内容有更高的控制权,还可以给玩家自己探索叙事的能力。
但我们想要更进一步,要得到更多的结构,这也是我们开始做玩家输入与NPC输出LLM的原因。但是,当玩家可以输入任何想知道的东西、NPC能给出任何他想说的答案时,这一切都是由LLM的内部逻辑管理,就像是一个黑盒子。
我们可以决定如何打造结构,叙事节奏,以指引玩家的进度、掌握玩家的学习曲线。语言是一个很大的领域,你能说的东西太多了,NPC可以选想说的话也有很多,介于他们之间的尽管是系统化处理,但也是语言。如果玩家以这种方式输入,那么它以是一个游戏,但本身又不一定是款游戏。
如Xavier所说的那样,我们都不是机器学习背景出身,我们做的决策是为这些无限的可能增加中间步骤,我们已经知道的东西就是游戏状态,这也是我们为输入分类的原因。所以当玩家输入的时候,我们可以判断情绪类型、话题类型和动作类型。NPC输入也是一样,当他说话的时候,我们可以用根据设计领域进行分类,这个领域,你知道如何去处理。
有了这些状态,我们可以为每一个角色做调整和平衡,让他们更加独特,还可以加上UI、引擎和一切我们所知的东西,这对团队的帮助很大。听起来很抽象,所以接下来我们看看在管线中是怎样的:
这是我们的文档之一,我们的任务是让角色开心一些。我们所做的是将玩家语音输入得到的反馈进行处理,但并不是改变,因为我们不希望改变他所说的意思,然后用我们的指标进行分析。
比如情绪,我们并没有用默认的情绪工具分类,而是打造了自己的工具classifier。话题的处理也是一样,我们来决定哪些是与游戏一致的话题,还有动作的处理。我们希望这样可以影响到与之相关的人和事物,然后将其与游戏机制关联起来,所以我们也做了一个classifier。
我们还有其他的指标,例如重要信息的距离,并非所有的东西都呈现在今天的展示中,但我们尽自己所能,做了游戏制作人能够做的一切。有了这些之后,我们就可以调用LLM了,因为我们打造了一个可以对玩家输入进行情景化的框架。
Inworld给我们的LLM工具非常简单易用,然后我们得到一个答案,用我们的框架解读NPC要说的东西,然后我们把它输出到UI中。这样,玩家就能知道游戏是否理解了他们所说的东西,以及游戏通过NPC的话做出的反应。玩法与叙事之间的连接是最难做的事情,因为这需要带来有意义的体验。
那么,为什么我一直说它是非常定制化的?因为游戏AI远不只是GenAI,早在ChatGPT出来之前我就已经在做这个了。这么说不是为了听起来很酷,只是想告诉大家,机器学习是有一大片领域的,远不只是这些模型。当你将规则状态、classifier等知识与AI结合起来,就可以做一个适合自己的管线。
所以,不要试图说,我做了一个定制化系统,然后对所有文献定制化,我选择挑出更酷的一个,你必须挑出一个符合你创意愿景的方案。例如我们就选择了一个灵活的方案,首先要用文本进行创意原型,第一个机制根本就是个秘密。当你输入文字的时候,NPC很难知道你的心理状态,所以我们认为玩家与NPC应该有更亲密的接触,然后我们尝试配音,因为这可以给你力量,所以模型与策划之间的联系始终存在。
在机器学习领域,LLM是很伟大的一步,这可以帮你打开新体验、新玩法的眼界和想法,这些可能是你之前认为不可能的事情。如果你深入了解,就会发现最适合你自己的方式。
这里我说的是创意原型,但在一个制作团队中,你或许需要一两个数据科学家,因为我们在这个过程中的角色就像是漏斗,帮你选择适合自己的那一个。因为每天都有大量的模型出现,如果你只是追潮流,可能选择的模型几天内就过时了,这是很难的。
其他的发现就是,数据科学团队是受到质疑的。当我们加入一个团队的时候,人们可能觉得,我们有了很酷的AI帮手,就可以做很酷的东西。实际上这是误解,因为我们是完全迷失的,不知道在核心团队该怎么帮忙,我们必须倾听人们是怎么工作的,然后改变我们的流程和节奏,以适应制作团队的节奏,根本做不到两小时就交付一个模型那种完美状态。
4、游戏化沟通
接下来我们会谈到这个方法对游戏设计的影响,简单回顾一下我们当时遇到的挑战和问题。
如果谈到对话,这只是GenAI NPC系统的一个部分,但这是我们的焦点之一,我们经历了大量的反复迭代,涉及对话指引、情绪矩阵、话题、策略等等,所以分享出来可能会很有趣,你们会知道我们当时经历了什么。
先从对话指引说,我们知道,开放世界游戏有很多的地标,我们知道如何指引和帮助玩家,这可以是或者不是微妙的方式来做。你如何帮助玩家与NPC对话,如何指引他们的进度。因此我们给自己的问题是:能否用生成的对话来做到对话指引?
我们做了大量的测试,但一个很重要的是认知型关卡设计,我们可以将NPC的大脑想象成一个带有战争迷雾的地图,其中很多地方是锁定的,比如话题、情绪、背景故事元素等等。玩家是自由对话,因为他可以提出任何想问的问题,这里的目标是用UI以及NPC反馈来给出指引。
这种体验可能是独特的,因为作为玩家,你可能对NPC提出的问题与别人是不一样的,NPC会基于你的问题解锁新区域。因此,每个玩家都可以根据自己提出的问题获得独特的体验。
然后是情感矩阵,这是我们深入挖掘的领域。为什么这么做,因为我们觉得我们或许需要表达更微妙的情绪,让NPC更像真人,这个表格看起来就像是情绪矩阵,左右侧是玩家做出的行动,左侧是NPC情绪状态,如果玩家很愤怒、NPC很开心,这样的输入会带来什么?而且很难用一句话来说明白为何愤怒。
实际上,我们探索的更深入,不是7种情绪,而是15种,而且每一种情绪都有不同的步骤。我们在这个问题上投入了一个月,但不只是策划迷失了,整个团队都很迷茫。我们不知道玩家如何理解这个系统,并不是个好想法,但却是需要的,我们希望知道真正的限制是什么。
接下来我们开始做策略,决定一个策略的是行动、话题和情绪,行动可能是动作游戏里的挥剑、对话游戏里的夸夸其谈等,这些都是可以实时探测到的行动。话题可以是NPC的工作、家庭生活,遇到的阻力等等,当玩家沟通的时候我们能探测到走向。
随后是情绪,NPC有很多种不同情绪,会根据玩家输入发生改变,这被我们称之为策略,我们保留了这些东西,它们与如今游戏里部署的很接近。
例如之前展示的Demo,对话界面有很多部分组成,如面部的表情可以展示情绪状态,所处的场景展示了话题,对话框里的人物注释解释了人物关系,左上角的列表给出了对话目标。在未来做智能NPC的时候,你们或许会、或许不会使用这个,但玩家在对话玩法中,对于可选项是很感兴趣的。
讲兴趣点、感知等Demo展示的东西之前,我们需要先解决这个,从步骤1到步骤2。
5、避开NEO阻力
我之前说过,我很喜欢写故事和讲故事。这里讲一个跟GDC相关的故事。在GDC大会开始前一个月,我们开始准备在GDC展示的Demo,我们团队进入了全员备战模式。一个晚上,有团队成员告诉我,在跟Bloom对话的时候没有反应,我也遇到了类似情况。
排查之后,我们发现,问题是团队要根据设计的变化等产品方向上的改变进行不断迭代,但我们完全失控了,这里分享几个避免NEO阻力的方法,叙事团队要创作角色的本质,掌握角色的变化。关注NEONPC系统的微妙动态,每个细节都很重要,还要将叙事与数据结合,带来无缝的连贯性。
三周前,我重新做了这些角色,倾听团队所有部门的需求以便把他做的更连贯。我很担心,但后来Melanie发了一个信息,他说这次转变很成功,测试之后完全没有问题了。
这里的教训是,当一个系统有太多人能输入的时候,就会带来角色的不连贯。因此,每一次做出改变,我们都需要注意连贯性,因为这会影响你的角色。
6、根据用户调研打磨游戏设计
如果把所有内容说完可能会拖堂,因此我们长话短说。用户调研非常关键,所有项目都是如此,我们也不例外,因为内容都是生成的输出。对于所有团队,都需要适应用户调研,因为这可能会重塑团队。
游戏设计和用户调研团队在大部分项目中都是很关键的,但他们之间的关系,就是管理惊喜与突发状况。我们遇到的情况是,你该如何处理玩家的突发行为?
我们需要对此提出的问题是:这与我们意向中的一致吗?玩法测试中发生了什么?如果不是,我们该如何打磨新的NPC行为,让它与我们想象的方向一致?突发的NPC行为能否带来新玩法?诸如此类。
所以,这里的关键是玩家预期是什么、策划预期是什么?两者之间是有差距的,你需要适应玩家预期,还是改变NPC行为以达到你的设计目的?在GenAI设计的时候,两个部门之间的合作是非常重要的。
如用户调研团队领导的workshop,因为,对于突发情况,我们很希望知道游戏策划团队的极限,哪个部分太多、哪些部分不足?我们要始终挑战设计团队。这个workshop是很多团队参与的,因为我们不能将游戏设计与其他团队分割开来。
然后,我们还有与玩家之间的workshop,实际上就是与玩家沟通,因为他们对NPC有不同的预期,你需要保持开放,图中的字迹可能看不清,但能够看到我们在与玩家就不同的事情进行拉扯。
其次是真实的沉浸感。这些NPC带给玩家的感觉是真实的,一些玩家觉得,这与他们之前见到过的NPC有很大的不同。我们用语音版本测试,玩家们发现不知道怎么跟NPC对话,测试过程中,经常有玩家问,“我这样会打扰NPC吗?”“我能说这些吗?”
我们是很惊喜的,但这与我们刚开始做的意图一致。当你做GenAI支持的NPC时,要注意这些也是反馈的一部分,你要接受它。
第三个因素,你需要对玩家的反馈作出回应,不能让他们感到因为NPC而沮丧、有很大压力。他们不应该害怕与研发团队或者用户调研团队沟通,你有时候需要放下偏见,倾听这些玩家的建议,与玩家建立很紧密的关系。
7、与专业的合作伙伴合作
在做这个实验的时候我们还希望保持团队规模较小,所以决定与专业的外部伙伴合作。一方面我们选择了Inworld,我们一开始就选择了Inworld,因为这可以让团队很早就能填写角色卡,与角色聊天。
另外,我们有很好的迭代动态,我们说了我们的愿景是什么,角色的背景,他们调整了产品的极限来适应我们的需求。比如我们对角色愿景以及角色想要的态度有很大的workshop,因为我们的要求很挑剔,希望做到角色对话尽可能自由。做到这样并不容易,但他们已经做好了尽可能多迭代的准备,这种灵活性对我们来说很关键。
另外,我们还与英伟达的AUDIO 2 FACE工具合作了很多,这是一个可以生成实时嘴唇和面部表情动画的工具。所以这非常适合我们,因为我们在实时生成大量的内容,所以需要这样的支持。
但与此同时,我们希望它是量身定制的,因为有很多不同的角色,且聚焦于情感和叙事深度,因此我们对工具进行调整来改变角色面部表情,所以我们在工具能力和对角色想法之间做了大量的混合。
我们希望控制情绪矩阵的东西,所以我们希望改变情绪设计的方式。例如我们做了很多的调整,在Maya上进行修改,实现了对每个情绪都好用的管线,因此这需要大量的迭代。
最后一个步骤就是身体,因为,如果你的表情发生了变化,但身体却没有任何动作,就会错过一些东西,身体语言也是玩法表达的一个渠道。所以,我们决定采用动作捕捉,我们希望做出统一感,专业感。我们已经有了很多生成的东西,所以希望有一些团队做的东西在里面。这是一个不可思议的选择,你可以看到生成型内容与量身定制内容的混合。
最后一点是技术要求,这里会有很多,要做好准备。这是我们没有想到的,实际上,我们很多时候需要做出调整来适应技术要求。
这套方案解决了我们的愿景需求,我们完成了部署,虽然很有挑战,但为我们打开了这个领域的所有可能。我们本来只是想做一个工具,但最后却进入了一个全新的领域,开启了全新的战斗。
如若转载,请注明出处:http://www.gamelook.com.cn/2025/04/567797/