研究人员“强迫”AI教自己如何玩“超级玛丽”

7003383

7005136

7005137

<article><section data-type="rtext">大多数时候，我们听到有关人工智能（AI）的内容与虚拟助手和下棋等有关，或者是虚拟司机向人类司机学习驾驶车辆等。而现在加州大学伯克利分校一组研究人员研发的人工智能却有所不同，该小组展示了他们用来“强迫”AI教自己如何玩“超级玛丽”。<img src="//himg2.huanqiucdn.cn/attachment2010/2017/0527/20170527112703431.jpg?imageView2/2/w/1260" data-alt="mario.jpg"/>教人工智能完成研究人员想做的事情可能是一个复杂而冗长乏味的过程。通常，他们使用系统训练人工智能，在强化学习中,系统会被给予一些代表奖励(reward)的值。其中积极的结果得到加强，并且最终该算法具有足够的反馈，它知道能做和不能做的事情。但是，加州大学伯克利分校的人工智能不是依赖于这种方式，而是建立在“好奇心”之上。<img src="//himg2.huanqiucdn.cn/attachment2010/2017/0527/20170527112703424.jpg?imageView2/2/w/1260" data-alt="overview.jpg"/>这项研究的作者解释称：“我们的想法是当环境中外部‘奖励’很少时，培养具有内在好奇心动机（ICM）的人工智能。令人惊讶的是，即使环境没有‘奖励’，你也可以使用ICM。在这项研究中，人工智能是出于好奇心进行探索。”<img src="//himg2.huanqiucdn.cn/attachment2010/2017/0527/20170527112703721.jpg?imageView2/2/w/1260" data-alt="method.jpg"/>为了测试人工智能的自我学习能力，该团队给其布置玩任天堂经典游戏《超级马里奥兄弟》第一关的任务。 通过反复尝试和无数次的失败，人工智能最终取得进步并成功到达终点过关。</section></article>

7003385

7003386

7003387

7003388

7004638

7004639

7004637

7003389