AI渗入电子竞技领域雷神之锤团战人类玩家全灭

7003383

7005136

7005137

<article><section data-type="rtext">【环球网科技 记者 樊俊卿】据国外媒体报道，两年前谷歌旗下人工智能部门DeepMind开发的人工智能AlphaGo，击败了世界围棋冠军而一举成名。现在，DeepMind的另一个项目，已经学会了如何玩热门多人视频游戏《雷神之锤》。OpenAI战队在5v5刀塔比赛上打败人类，才是几天前发生的事。如今，DeepMind为了训练AI电竞的团魂，也已把触手伸向了雷神之锤III竞技场。DeepMind的强化学习智能体，不止要和AI队友一起攻打人类的阵地，也要和人类队友并肩作战。至少，在夺旗 (Capture the Flag) 比赛中，AI的胜率比人类高。而且，这里的比赛，比原版游戏还要复杂多变。<img src="//himg2.huanqiucdn.cn/attachment2010/2018/0704/15/33/20180704033322845.jpg?imageView2/2/w/1260"/>雷神之锤III是由id Software采用id Tech3引擎制作的多人连线第一人称射击游戏(FPS)，1999年12月发行。玩家或独立或组队在地图中厮杀，死亡后数秒即在地图某处重生。当某位或某队玩家达到胜利条件或者游戏持续一定时间后即宣告一个回合结束。胜利条件取决于选择的游戏模式。而夺旗(Capture the flag，简称 CTF)是一种类游戏模式，它有各种不同的形式。在雷神之锤III里分成蓝红两边在通常是一个对称的(也有不对称的)地图中竞赛。竞赛的目的是将对方的旗子带回来，并且碰触未被移动过的我方旗子，我队就得一分，称作一个 capture。<img src="//himg2.huanqiucdn.cn/attachment2010/2018/0704/15/33/20180704033337815.jpg?imageView2/2/w/1260"/>夺旗模式一般会设定两个要素，得分的极限以及时间极限，先到达分数极限的队伍获胜，若是两队势均力敌而难以得分，则通常会由时间的设定来结束一个游戏(match)。在夺旗模式中，杀死对手得1分，自己非正常死亡扣1分，夺取对方旗子得3分，杀死夺旗者得2分，重新拿到己方旗子得1分，成功夺取一次旗子并将旗子送回己方基地中得5分。DeepMind周二表示，它已经开发了创新和强化学习技术，使人工智能系统能够在《雷神之锤III竞技场》的夺旗游戏中达到人类的游戏水平。DeepMind表示，学习夺旗游戏是为了让各个人工智能独立行动，同时学会相互配合。“这是一个非常困难的问题——因为需要协同适应机制，整个环境也在不断变化。”DeepMind在一篇博客文章中说。<img src="//himg2.huanqiucdn.cn/attachment2010/2018/0704/15/33/20180704033350532.png?imageView2/2/w/1260"/>DeepMind表示，这些代理(人工智能专业术语，指自主活动的软件)从未接受过关于游戏规则的指示，但能够“以非常高的标准”学习游戏。在随机混合人工智能代理与40名人类玩家的比赛中，代理的胜率很快就超过了人类。即使是很多人类玩家也认为这些代理比其他人类更具协作性。“事实上，代理会学习类似人类的行为，例如跟随队友并在对手的基地安营扎寨，”DeepMind在其博客上说，“总的来说，我们认为这项工作凸显了多智能体培训对促进人工智能发展的潜力。”</section></article>

7003385

7003386

7003387

7003388

7004638

7004639

7004637

7003389