10:1!DeepMind AI大胜星际2职业玩家

2019-01-25 09:48 网易科技

  据外媒报道,谷歌旗下子公司DeepMind的人工智能(AI)因战胜人类围棋冠军而备受赞誉,现在它又开始挑战另一款游戏——《星际争霸2》(StarCraft II)。仅仅18个月后,DeepMind就拥有了能够打败世界上最好职业玩家的AI,几乎每场必胜。在去年的一场比赛中,它以10:1战胜了两位欧洲职业选手。

  DeepMind称其主导围棋的AI为“AlphaGo”,而这款玩《星际争霸》的机器人也有类似的绰号,被称为AlphaStar,拥有相当于人类200多年的实践经验。在去年11月份的暴雪大会上,DeepMind表示,其机器学习平台大约有半数时间能够战胜游戏中的“疯狂”挑战。从那以后,情况有了明显改善。

  AlphaStar是个卷积神经网络。其开发队伍从专业比赛回放开始,给了AlphaStar开始玩这款游戏的起点。通过与竞争模型进行密集对战训练,DeepMind能够教会AlphaStar如何像最优秀的人类玩家那样玩游戏。随着时间的推移,他们将AlphaStar削减到五个最好的“代理”,这就是它用来对付世界上许多最熟练《星际争霸2》玩家的力量。

  比赛实际上是在去年12月份举行的,所以今天的网络直播主要是重播这些比赛。首先,AlphaStar与一名主要在《星际争霸》中扮演“虫族”的玩家TLO对战。然而,他必须扮演“神族”,因为这是目前AlphaStar唯一受过训练的种族。尽管TLO尽了最大努力,但AlphaStar还是以5比0的成绩击败了他。接下来,另一个AlphaStar代理与一名经验丰富的“神族”玩家MaNa对抗。尽管有些比赛打得难解难分,但AlphaStar最终仍以5比0获胜。

  AlphaStar在这些比赛中展示了令人印象深刻的单位微观管理能力。它迅速地将受损的部队调回后方,并将更强壮的部队调往战斗前线。AlphaStar还控制了战斗的节奏,在适当的时候向前推进或后退,以给对方造成更大伤害,同时减少自身的损失。这不是因为AlphStar的每分钟操作率(APM)爆表,与人类玩家相比,它甚至拥有更低的APM,但它正在做出更明智的选择。

  AlphaStar也有些似乎非常有趣的战略怪癖。它经常派兵冲到斜坡上,这在《星际争霸2》中是很危险的,因为在你进入之前看不到那里有什么。尽管如此,这种策略还是奏效了。AlphaStar还避开了一个久经考验的策略,即用一堵墙挡住基地的坡道。这在星际争霸中是众所周知的手段,但是AI并不在意它,仍然设法保护它的基地。

  直到最后一场直播比赛,人类挑战者才发现其中有个AI存在缺陷。这个版本的AlphaStar致力于将几乎整个军团作为一个整体移动,目的是横推MaNa的基地。然而,MaNa能在AlphaStar基地后方的几个单位内反复骚扰。每次,AlphaStar都会调转方向来应对威胁。这给了MaNa足够的时间去建立更强大的力量并与AI战斗。

  当天比赛结束时,AlphaStar赢了10场比赛,只输掉了一场。如果AlphaStar能从这些比赛中吸取教训,那么它在未来的比赛中几乎不可战胜。

责编:陶宗瑶
分享:

推荐阅读