让游戏公司震惊!可微调效果,AI画出高品质游戏美术素材了
【GameLook专稿,未经授权不得转载!】
GameLook报道/过去一年当中,AI画图工具非常火爆,从OpenAI的DALL-E,到夺取艺术比赛冠军的Midjourney,再到画美女无敌手的Stable Diffusion…AI作画的能力越来越强大了,甚至让不少人产生了“人类画师末日”的担忧。
一条简单的指令,就能快速得出超高品质的图形,这对于游戏开发者来说无疑是令人振奋的消息,尤其是没有预算和人手打造美术资源的中小团队。而且,从网络上看到的结果来看,AI的绘图能力也确实令人叹为观止。
然而,对于没有美术基础和编程基础的人来说,用AI绘图工具画出自己想要的效果并不容易,即便是同一个工具、同样的指令,哪怕设置的细微差别、生成图像次数步骤的不同,都会得出品质迥异的图片。
不过,随着AI绘图工具越来越受欢迎,业内已经开始有开发者探索对其进行微调以实现精准效果。比如,Scenario联合创始人Emmanuel de Maistre就通过对Stable Diffusion的微调,实现了高品质的“红警”题材资源创作。
如何微调Stable Diffusion创造红警风格游戏美术资源?
在自己的社交媒体上,Emmanuel de Maistre使用Midjourney生成了200多个建筑模型,尽管没有透露具体的文本描述,但却提供了各种各样的建筑和车辆。
随后,他挑选了16张图片组成一个比较小的数据集,其中每一张都各不相同,但整体风格仍然保持了一致。
这些图片用来通过Scenario_gg工具对Stable Diffusion进行微调,Scenario是一个即将推出的用于创造AI资源的工具(预计将于本月底发布)。
随着模型的训练,de Maistre尝试了多种指令生成不同类型的建筑,下图是生成的一些结果,包括一个核电厂、一个雷达和一座炼油厂。
那么,如果要用它生成一个掩体呢?De Maistre使用图像到图像翻译,从原始数据集里的一个参照图片生成了多个版本。
决定重新训练模型之前,他还尝试了一些其他选择。他减少了数据集至12张图片(此前是16张),并且将文本编码器设置为50%(而非之前的100%)
最终,de Maistre回到了碉堡的形状,并使用以下指令对其进行了定制:“等距掩体,逼真,苏联国旗,红色,电子游戏(Isometric bunker, realistic, soviet flag, red, video game.)。”他还稍微改变了文本描述,以生成美国版碉堡。
他随后展示了AI生成的掩体,周围都有不同的场景和结构,他指出,“三个单词,一个良好的调优,一张精确的的图像(对img2img),以及无限的可能。”
如de Maistre指出的那样,这些工具对于具有高水平创造力、知识和文化的美术师们尤其有用。
他总结说,“我预计游戏工作室最终会管理数百(甚至上千)个经过微调的模型,这些模型在被各个团队(美术师、开发者、游戏策划、营销人员等)使用,并且制作之前要经历一些验证过程。”
实际上,de Maistre此前还尝试过用AI绘制游戏里的药剂,并且得到了很多品质精良的模型。
实现精准控制之后,效率或是AI绘图要攻克的下一关
随着游戏市场进入精品化阶段,用户和市场对于游戏品质的要求越来越高,这就对游戏制作提出了更高的要求,而AI绘图则恰好能够解决游戏制作当中成本占比最高的美术资源问题,最近也有不少游戏公司和互联网公司在招聘AI画师相关的岗位。
AI绘图本身也得到了资本市场和科技圈以及互联网巨头的青睐,比如Stable Diffusion的母公司Stability AI就在今年10月接受了Coatue和光速的1亿美元+投资,成为了AIGC领域第一家独角兽。而在前不久,苹果公司在官方博客公开表达了对Stable Diffusion的支持,并表示其已经在Github发布了针对 macOS 13.1 和 iOS 16.2 平台的Stable Diffusion的 Core ML(2018年发布的机器学习框架) 优化,以及将相关模型部署到Apple Silicon设备(M系列芯片的苹果设备)上的代码。
苹果官方博客截图
不得不说,AI绘图的进步速度是非常快的,从de Maistre展示的效果来看,通过特定工具的微调,具有一定美术知识的开发者的确可以得到自己想要的精准效果,而且从产出结果来看,Scenario工具微调过后产出的图片实际上已经可以直接运用到很多游戏当中,尤其是以2D美术资源为主流的SLG品类。
只是,de Maistre得到这些图片的过程并不是人们想象的一句指令就能秒出图那样简单,从Midjourney生成图片,到使用工具对一组数据集训练,他生成这些红警风格的美术资源经历了长时间的调试和优化,而且de Maistre并没有说明这个过程用了多少步骤、多长时间。
对于大部分开发者来说,考虑使用AI绘图一个很重要的因素,就是能够快速得到高品质美术资源,如果得到想要的效果图片耗费的时间比真人画师创作还久,那显然是不能接受的。
游戏公司招聘AI美术师岗截图
对于效率问题,或许游戏开发者可以参考影视和CG行业的做法。通常情况下,2K分辨率所需要的渲染时间能被接受的是每帧1小时左右,而通过集群技术解决长时间图像渲染问题的“渲染农场(Renderfarm)”,电影行业可以快速制作出高品质的大片,比如Weta制作的《魔戒》就使用了渲染农场。同样,AI绘图也可以使用“AI农场”的解决方案来提升产出效率,尤其是高精度2D甚至3D模型的资源产出。
当然,对于游戏开发商来说,AI绘图还有一个需要注意的问题就是版权。目前,几乎所有的AI训练都是基于海量的网上公开资源,而这些资源当中有相当一部分属于有版权资源,那么经过多次训练和迭代之后,AI生成的图片是否会产生侵权的风险?这是目前所有的AI绘图工具都没有明确给出答案的问题。
如若转载,请注明出处:http://www.gamelook.com.cn/2022/12/504273