围观别人打超级玛丽后，AI自己创造了个新游戏

发布时间：2017-09-11 浏览数：

安妮编译自 The Verge

量子位出品 | 公众号 QbitAI

AI会打游戏已经不是新鲜事了。微软AI打出吃豆人史上最高分，暴雪和DeepMind开发工具包教AI打星际2，用神经网络和遗传算法搭建玩Flappy Bird的AI，甚至……连DOTA顶级选手都被AI完爆。AI不断解锁新游戏，还玩得6的飞起。

围观别人打超级玛丽后，AI自己创造了个新游戏(1)

相比之下，乔治亚理工学院的这项研究有些与众不同，计算机学院的Matthew Guzdial、Boyang Li、Mark O.Reiedl三人想让AI学习制作游戏。曾是“网瘾少年”的AI，也要浪子回头步入游戏制作的正经行业了？

围观别人打超级玛丽后，AI自己创造了个新游戏(2)

如何创造新游戏？

在论文《Game Engine Learning from Video》中，Guzdial等人描述了一种AI系统，可在围观别人打超级玛丽后重新创造一个游戏引擎。AI系统无法获取代码，但能通过观察像素学习。重建的游戏引擎有些地方看起来不太合理，但总体看还说得过去。

这是世界首个AI创造的游戏，创造过程不易，研究人员遇到了很多困难和限制条件。万事开头难，AI没有从头开始学习过游戏。

对此，研究人员为它提供了两个数据集：一个是游戏中各种小怪的视觉词典，另一个包含了物体位置和移动速度等基本概念，AI通过这些分析它看到的场景。

围观别人打超级玛丽后，AI自己创造了个新游戏(3)

△ 超级玛丽的男一和男二：马里奥与板栗仔

依靠这两个数据集，AI将游戏情节逐帧分解，并给所见的东西打上标签，自动寻找行为规则。

围观别人打超级玛丽后，AI自己创造了个新游戏(4)

△ 原版洛克人游戏（左）和AI重建的洛克人（右）

在接受外媒The Verge采访时，Guzdial举例解释了AI的学习过程。“解析器分析并收集每一帧画面，比如马里奥的状态、移动速度等，”Guzdial说，“某一帧马里奥踩在板栗仔上，下一帧板栗仔就消失了。根据看到的这个场景AI学习到的新规则，当马里奥踩在板栗仔上且速度为负时，板栗仔消失。”

围观别人打超级玛丽后，AI自己创造了个新游戏(5)

△ 无穷马里奥中框架解析过程的可视化

随着训练时间增加，AI将逐步建立起所有小规则，之后将它们记录成一系列逻辑语句并组合起来近似组成游戏引擎。这些规则可以被导出并转换成很多编程语言，我们又可以用这些语言重新创造新的超级玛丽游戏。

围观别人打超级玛丽后，AI自己创造了个新游戏(6)

论文摘要

智能体需要去预测环境。在这篇论文中，我们提出了一种通过对输入像素的简单搜索学习正向仿真模型的新方法。

我们用游戏超级玛丽初步测试这种方法，超级玛丽代表了没有现实情况这么复杂的物理系统。我们证明了这种方法在预测未来状态上比CNN基线有显著提高，并用学习过的模型训练游戏智能体。最后，我们依据输出模型的准确性和数值来评估算法。

应用于现实生活

目前，这个系统还依赖人类定义在特定游戏中可能发生的事情，因此只能在2D平台上工作，定义3D游戏还需要更多时间以及更先进的机器视觉工具。

Guzdial团队认为，在未来，这项技术不仅可以推导出游戏原理，还有应用在现实生活中的潜力。虽然这比超级玛丽游戏要复杂得多，但并不是一个不可能的想法。“我认为未来的版本可以(分析)有限的现实领域。”Guzdial说。

最后，附上论文地址：

https://www.cc.gatech.edu/~riedl/pubs/ijcai17.pdf

也可在量子位微信公众号（ID：qbitai）会话界面回复“超级玛丽”直接下载这篇论文。

— 完 —

诚挚招聘

量子位正在招募编辑/记者，工作地点在北京中关村。期待有才气、有热情的同学加入我们！相关细节，请在量子位公众号(QbitAI)对话界面，回复“招聘”两个字。

量子位 QbitAI

վ'ᴗ' ի 追踪AI技术和产品新动态