解放军报：即时战略游戏可用于军事指挥训练 | 游戏大观

谷歌子公司DeepMind生产的“阿尔法狗”战胜围棋大师李世石后，“即时战略游戏”就成为许多人工智能专家眼中的下一个目标。DeepMind宣布将为研究人员提供一个用《星际争霸Ⅱ》测试人工智能的新算法，阿里巴巴也曾开发过一款《星际争霸》的增强学习框架。

《星际争霸Ⅱ》游戏画面

可能很多人只关注到人工智能挑战“即时战略游戏”事件本身，而忽略了其在军事方面的重大意义。大多数“即时战略游戏”其实就是一款军事作战指挥模拟软件，比如一些二战系列的游戏，玩家可以通过扮演某个国家的将领，充分体验各军兵种在战争中所发挥的独特作用，犹如亲身亲历那些经典战役。还有一些策略性非常强的游戏，更偏重于对整体战略和局部战术的运用，玩家可以像在沙盘上一样运筹帷幄，指挥调配自己的各种军事力量，运用各种战略战术攻击对方。虽然战斗过程被大大简化，但其对实战分析的模拟程度却相当高。因此，“即时战略游戏”本身对提升军事指挥训练水平有很大助益。

战争是你死我活的对抗，一款真正的军事游戏必须具备高度对抗性。实战对抗游戏的乐趣来自于旗鼓相当的“对手”，因为水平差异所产生的“实力碾压”会破坏游戏本身对抗的乐趣。目前，游戏中自带的人工智能还比较原始，是基于预编程序的规则，没有学习能力，也无法进行训练，一旦被人类对手找到弱点后就很难再取胜。

原始人工智能的另一种情形，是快速从游戏代码中获取信息，同时对屏幕内外所有单位下达指令，“手速”远超人类，可以一直“碾压”人类对手。这种情况下，人类与原始人工智能“对战”很快就会失去兴趣，进步也不快。提高水平的最好办法，就是找到一个旗鼓相当的人类对手，但不同的选手之间水平差别比较大，很难找到一个水平层次相当的对手，更何况是一直陪伴自己共同提高的“伙伴”。

当拥有增强学习能力的人工智能开始挑战“即时战略游戏”时，我们看到了解决上述问题的曙光。人工智能通过成千上万次高强度的训练和比赛，不断积累经验，提升自身水平，找到各种复杂局面下的最优方案。相信用不了几年，人工智能就能轻松击败《星际争霸》游戏中的一般选手。随着DeepMind的强势介入，击败顶级选手将指日可待。

之后，人工智能就可以向军事指挥训练方面拓展。利用情报系统提供的素材和仿真实验得到的大数据，将各类军事作战想定、规则和参数移植到“即时战略游戏”，较为逼真地建立起“蓝军”模拟系统。对抗的一方是真实的指挥员，另一方则是人工智能系统。人工智能通过强化学习将自己打造成为指挥员的“私人教练”，成为一个旗鼓相当的对手，并对指挥员开展个性化培训，让其在每局对战中都能发现自己值得改进的地方。随着指挥员水平的不断提升，人工智能还会自动调整自己的水平，让指挥员一直感受到对抗的乐趣和挑战。

本文来自解放军报，本文观点不代表GameLook立场，转载请联系原作者。