新浪新闻客户端

人工智能游戏新运用,网易炉石盒子“化身”阿尔法狗

人工智能游戏新运用,网易炉石盒子“化身”阿尔法狗
2021年05月26日 17:24 新浪网 作者 游戏学姐爱丸酱

  在这个人工智能引领的时代,AI似乎能够完成一切,大到医疗、安防等民生领域,小到围棋等智力竞技,都少不了AI的身影。而“深度学习”、“神经网络”等名词,也从高大上的专业名词,逐渐走入大家的生活之中。

  而在炉石传说这种非对称的竞技游戏中,AI的表现会怎么样呢?由炉石盒子研发的战棋AI助手给出了一份答案。下面让我们看看这个战棋AI助手究竟是如何诞生的。

  在酒馆战棋中,每个版本更新后都会有漫长的适应期,有时候甚至几天不打,就完全看不懂这个版本应该怎么玩而屡屡速8。有了酒馆战棋AI助手后,就可以轻松地解决这个问题。酒馆战棋AI助手应用了网易自研的人工智能技术,以海量战棋高端玩家对战操作为参考依据,会在对局中根据玩家的当前情况实时作出打法推荐,帮助玩家熟悉环境与打法,是新手玩家和中轻度玩家的福音。

  在电子游戏的AI领域,最大的难题就是操作的多样性,以及版本迭代导致的AI更新问题。众所周知,许多竞技类游戏的每一次大更新后都是一个几乎全新的游戏,哪怕是顶尖的职业选手也会随着版本的更迭出现状态的起伏,因此也有“一代补丁一代神”的说法。而在这种节奏下,想要保持AI的更新和稳定性就需要做到底层的稳定,这需要对战棋的机制有充分的理解。在这个问题上,网易的AI团队每一位工程师都是酒馆战棋的资深玩家,在早期开发中就很注重酒馆战棋AI在不同游戏版本的扩展能力,比如在一张随从有多个维度来表征,攻击、血量、是否带有圣盾等,这些维度在版本更新的时候也可以很方便扩充,比如是否带有暴怒(铁匠)、是否处在休眠状态(玛维)等。而对于特殊的随从,则可以根据种族关键字进行关联,如红衣、熊妈妈等。

  围棋棋盘是二维的,可以视作一张图片;因此alphago,绝艺等棋类AI往往采用CNN网络结构,将每个位置作为一个像素点,转换成一个19*19*17的矩阵进行输入。而酒馆战棋虽然名字中带有“棋”字,实际的操作却十分多样化,有大量的随从信息、对手信息和自身的状态等。因此,网易的AI团队选择了另一个方向——自然语言处理中的transformer结构,把卡牌的排列类比为文本语句,判断当前阵容与鲍勃酒馆中随从的相关性,同时将自身血量与所处排名作为阈值,即自身越危险的时候,就越倾向于买一些打工怪保血量,而安全时可以多去找核心。

  Alphago在与柯洁交手

  同样地,围棋每一手只有一种操作和一个位置的选择,而酒馆战棋的选择则非常多样化。比如“刷新酒馆”是一步行动,而“购买随从”不是一步完整的行动,像“购买布莱恩·铜须”指明具体对象的才是,也就是说有的行动不需要指明随从对象,而有的则需要。这方面和MOBA游戏有些类似,比如在施放技能的时候,有的技能需要指定方向,有的则不需要。网易的AI团队在模型输出的设计上应用了Dota2 OpenAI-Five的一些技巧来表示不同层级、类型的子输出,最后组合这些子输出为完整的一个行动。

  OpenAIfive

  在训练数据方面,AI团队综合考虑了玩家的分段、最终排名和当轮状态,设定了短期目标和长期目标,以避免训练出过于极端的AI(如机杂苟烂分流AI)。

  酒馆战棋AI一经推出,便在全球暴雪游戏论坛引发了广泛讨论。国内社区发起了相关的观点投票:

  有的玩家认为,酒馆战棋AI可以让自己如虎添翼,享受前所未有的上分快感。

  有的玩家则是表明了忧虑,他认为战棋AI的强力辅助效果,会破坏游戏的公平性。在插件的帮助下,原本万分以下的玩家会瞬间具备堪比万分的战力,这势必会给不开插件的玩家带来更高的上分难度。

  国外社区也是同样热闹,海外玩家们纷纷表达了对战棋AI的浓厚兴趣,认为AI是能帮助自己战棋更进一步的良师益友,迫切希望早日拥有战棋AI,获得和中国玩家一样的福利。

  酒馆战棋AI的诞生,既凸显了网易的技术深度,也表现了网易在AI领域上的深耕意识。新手发展的战棋AI只是一个开始,随着网络结构的进化与数据的积累,战棋AI将变得越来越强。在AlphaGo诞生后,围棋棋坛也随着AlphaGo引领的“点三三”等新下法有了革命性的突破,而随着战棋AI的进步,以及强化学习等更深入的技术引入,战棋AI或许也能给我们带来打法与节奏选择上的惊喜。或许有一天,我们也能看到战棋AI与瓦娘、会长、墨衣等大神同台竞技的场景。

  参考文献

  1.Vaswani, Ashish, et al. "Attention is all you need." arXiv preprint arXiv:1706.03762 (2017).

  2.DEVLIN, Jacob, et al. Bert: Pre-training of deep bidirectional transformers for language understanding. arXiv preprint arXiv:1810.04805, 2018.

  3. BERNER, Christopher, et al. Dota 2 with large scale deep reinforcement learning. arXiv preprint arXiv:1912.06680, 2019.

  4. SILVER, David, et al. Mastering the game of Go with deep neural networks and tree search. nature, 2016, 529.7587: 484-489.

特别声明:以上文章内容仅代表作者本人观点,不代表新浪网观点或立场。如有关于作品内容、版权或其它问题请于作品发表后的30日内与新浪网联系。
权利保护声明页/Notice to Right Holders 我要反馈

举报邮箱:jubao@vip.sina.com

Copyright © 1996-2022 SINA Corporation

All Rights Reserved 新浪公司 版权所有