百度360必应搜狗淘宝本站头条
当前位置:网站首页 > 技术文章 > 正文

《吃豆人》40周年献礼,NVIDIA用AI学习5万次“创造”出了PAC-MAN

haoteby 2025-05-10 21:57 8 浏览

近日,NVIDIA携手万代南梦宫宣布,为庆祝经典电子游戏《吃豆人》(PAC-MAN)诞生40周年,将运用人工智能(AI)对这款街机游戏进行改造。NVIDIA研究人员在5万个《吃豆人》(PAC-MAN)情节中训练出一个名为NVIDIA GameGAN的全新AI模型,并在没有游戏引擎支持的情况下,打造了一个功能齐全的新游戏版本。无中生有创造出一个游戏,NVIDIA是怎么做的?

说起《吃豆人》,相信老玩家们都不会陌生。作为游戏史上的经典之作,这款游戏最初出现在任天堂FC游戏机和街机上,伴随着略有些“魔性”的音乐,玩家们操控吃豆人PAC-MAN在随机生成的迷宫中吃完屏幕上的所有豆子,并要在过程中躲开鬼魂的干扰。

据不完全统计,仅在1981年一年时间里,美国人就往游戏机里投了几十亿个25美分硬币,也就是花在这款游戏上的金额超过10亿美金,总游玩时间达到75000小时。在之后的几十年中,这款热门游戏不断推陈出新,在电脑、游戏机和手机上推出了多个版本。

而如今,这款被列入世界游戏名作殿堂的经典游戏借助于NVIDIA AI技术再度重生。NVIDIA的研究人员经过5万个回合的游戏训练,已经能够在无需基础游戏引擎的情况下生成完整版的《吃豆人》游戏。也就是说,该AI即使没有游戏引擎和数据的支持,甚至在不了解游戏的基本规则前提下,也可以完美再现这款经典游戏。完成这一看起来不可思议的任务的,正是NVIDIA推出的用于学习游戏引擎的AI模型——GameGAN。

GameGAN,全球首款学习游戏引擎的AI模型

GameGAN是首个通过利用生成对抗网络(GAN)模仿计算机游戏引擎的神经网络模型。基于GAN的模型由两个相互对抗的神经网络,即生成器和判别器组成,能够生成足以以假乱真的逼真图像。不少玩家可能已经通过NVIDIA GauGAN体验过GAN这款深度学习模型,它由NVIDIA Research开发,能轻易地将随意涂鸦变成逼真的杰作,令人惊叹不已。

GameGAN能够加速游戏开发者的创作过程,因为它可以自动生成游戏新关卡。GameGAN还可以帮助AI研究人员更容易地开发出用于训练自主机器的模拟器系统,让AI在与现实世界中的物体交互之前,先学习环境规则。

▲NVIDIA GameGAN通过达到数万次的游戏过程学习,就能够在无须了解游戏引擎和设计数据的情况下,自主生成这款经典游戏的完整版。

GameGAN是首个利用生成式对抗网络(GAN)模仿计算机游戏引擎的神经网络模型。GAN模型由两个相互对抗的神经网络组成,一个生成器(generator)和一个鉴别器(discriminator),其能够学习创建足以媲美原版内容的新内容。

▲NVIDIA研究人员兼该项目的首席作者Seung-Wook Kim表示:“这是首个使用GAN神经网络模拟游戏引擎的研究。我们想看看AI是否可以仅通过观看游戏中智能代理的行为来学习领悟游戏环境规则。事实证明它做到了。”

当智能代理试玩GAN生成的游戏时,GameGAN会对代理的行为做出响应,从而实时生成新的游戏环境框架。在使用游戏不同等级或版本的游戏剧本进行训练后,GameGAN甚至可以生成从未有过的游戏关卡。

游戏开发人员可以利用此功能自动生成新的游戏等级关卡,AI研究人员则可以使用此功能更轻松地开发用于训练自主机器的模拟器系统。

GameGAN,重现经典PAC-MAN

▲通过不断的学习,GameGAN就能完全理解《吃豆人》的游戏规则,并生成一款几乎和原版一模一样游戏体验的“新”游戏。

无论是哪一款游戏,GAN都可以通过从过去的游戏中提取屏幕录像和智能代理的按键轨迹来学习其规则。游戏开发人员可以将原关卡中的游戏剧本作为训练数据,使用该工具为当前的游戏设计新的等级关卡。

利用万代南梦宫研究有限公司(BANDAI NAMCO)所提供的数据,NVIDIA研究人员及《吃豆人》GameGAN项目的首席作者Kim和他在多伦多NVIDIA AI 研究院的同事们一起在NVIDIA DGX系统上使用《吃豆人》游戏对该神经网络进行了总计数万帧的训练,同时加入了AI代理在游玩这款游戏时的键盘轨迹。

NVIDIA表示,经过训练后的GameGAN模型能够生成静态环境元素,例如统一的迷宫形状、豆子和强化道具,以及作为敌人的幽灵和吃豆人本身等移动元素。该模型能够学习简单和复杂的关键性游戏规则。例如,和原版游戏一样,吃豆人无法穿过迷宫墙。他需要一边四处移动,一边吃豆。当他吃到强化道具后,鬼魂会变成蓝色并四处逃窜。当吃豆人从一侧离开迷宫时,他会被传送到迷宫的另一侧。一旦吃豆人碰到鬼魂,屏幕就会闪烁并结束游戏。

▲用GameGAN AI生成的吃豆人游戏拥有和原版几乎一样的游戏规则与体验

由于该模型可以区分背景与活动的角色,因此其可以将游戏中的迷宫替换成绿篱墙式的迷宫,还可以将吃豆人换成你最喜欢的表情符号。同时,开发人员也可以使用这项功能尝试新的角色创意或游戏主题,从而开创出更多、无限的游戏可能性。

万代南梦宫公司的Koichiro Tsutsumi表示,“在看到这个结果时,我们都感到震惊,大家都无法相信可以在没有游戏引擎的情况下再现了南梦宫的经典游戏《吃豆人》。这项研究将帮助游戏开发人员加快新关卡、角色甚至游戏的开发。一想到这一点,我们就感到十分兴奋。”

▲GameGAN版本依靠神经网络而非传统的游戏引擎来生成《吃豆人》环境。AI持续追踪这个虚拟世界,记录已生成的内容以保证帧与帧之间的视觉一致性。

GameGAN,不止于游戏

其实,自主行动的AI机器人通常也需要在模拟器中接受训练,模拟器中的AI可以在与现实世界中的目标进行交互之前,学习环境规则。对于开发人员而言,创建模拟器是一个相当耗时的过程。开发人员必须编写有关如何与目标互动,以及及光在环境中如何表现等规则。

▲模拟器的AI行为学习是一个非常复杂的过程

模拟器被广泛用于开发各种自主机器,例如学习如何抓握和移动物体的仓库机器人、或是需要在人行道上运输食物或药品的物流机器人等。而GameGAN的出现,为其带来了一种可能性——在未来的某一天,神经网络训练将能取代此类任务中编写模拟器的工作。

比如你在汽车上安装一个摄像头。该摄像头可以记录道路环境或驾驶员的行为,例如转动方向盘或踩下油门等。这些数据可被用于训练一个深度学习模型,其能够预测在现实世界中,人类驾驶员(或自动驾驶汽车)在做出猛踩刹车等动作时会发生什么后果。

正如NVIDIA多伦多研究实验室主任Sanja Fidler所说,“我们最终将训练出一个AI,其只需通过观看视频和观察目标在环境中所采取的行动,就能模仿驾驶规则或物理定律。GameGAN是朝这一目标所迈出的第一步。”

所以,我们也完全相信,GameGAN的作用绝不仅仅是训练出一个完整的《吃豆人》游戏,也绝不会仅仅面向游戏应用,它的未来,或许将是星辰大海,拭目以待!而作为游戏玩家,我们当然也希望GameGAN能得到广泛的应用并进一步深入拓展,让游戏的世界更有趣、更好玩、更有挑战性。

最后,据NVIDIA最新公布的消息显示,NVIDIA将于今年晚些时候在AI Playground上发布这款由AI再现的《吃豆人》。届时,所有玩家都可以在DEMO中亲身体验这一研究演示结果。

注释:本文翻译参考资料来源NVIDIA官方资料。

相关推荐

网站seo该怎么优化

一、网站定位在建设一个网站之前,我们首先要做的就是一个网站清晰的定位,会带来转化率相对较高的客户群体,我们建站的目的就是为了营销,只有集中来做某一件事,才会更好的展现我们的网站。在做SEO优化的同时...

3个小技巧教你如何做好SEO优化

  想半路出家做SEO?可是,怎么才做的好呢?关于SEO专业技术弄懂搜索引擎原理,咱们做搜索引擎排名的首先就是要了解搜索引擎的工作原理,对SEO优化有更深入了解之后再来做SEO,你就能从搜索引擎的视点...

SEO指令分享:filetype指令

filetype用于搜索特定的文件格式。百度和谷歌都支持filetype指令。比如搜索filetype:pdf今日头条返回的就是包含今日头条这个关键词的所有pdf文件,如下图:百度只支持:pdf...

网站seo优化技巧大全

SEO在搜索引擎中对检索结果进行排序,看谁最初是在用户的第一眼中看到的。实际上,这些排名都是通过引擎的内部算法来实现的。例如,百度算法很有名。那么,对百度SEO的优化有哪些小技巧?下面小编就会说下针对...

小技巧#10 某些高级的搜索技巧

由于某些原因,我的实验场所仅限百度。1.关键词+空格严格说来这个不能算高级,但关键词之间打空格的办法确实好用。我习惯用右手大拇指外侧敲击空格键,这个习惯在打英文报告时尤其频繁。2.site:(请不要忽...

MYSQL数据库权限与安全

权限与安全数据库的权限和数据库的安全是息息相关的,不当的权限设置可能会导致各种各样的安全隐患,操作系统的某些设置也会对MySQL的安全造成影响。1、权限系统的工作原理...

WPF样式

UniformGrid容器<UniformGridColumns="3"Rows="3"><Button/>...

mysql自动备份,并zabbix检测备份文件是否正常,备份文件大小

推荐...

MySQL学到什么程度?才有可以在简历上写精通

前言如今互联网行业用的最多就是MySQL,然而对于高级Web面试者,尤其对于寻找30k下工作的求职者,很多MySQL相关知识点基本都会涉及,如果面试中,你的相关知识答的模糊和不切要点,基...

jquery的事件名称和命名空间的方法

我们先看一些代码:当然,我们也可以用bind进行事件绑定。我们看到上面的代码,我们可以在事件后面,以点号,加我们的名字,就是事件命名空间。所谓事件命名空间,就是事件类型后面以点语法附加一个别名,以便引...

c#,委托与事件,发布订阅模型,观察者模式

什么是事件?事件(Event)基本上说是一个用户操作,如按键、点击、鼠标移动等等,或者是一些提示信息,如系统生成的通知。应用程序需要在事件发生时响应事件。通过委托使用事件事件在类中声明且生成,且通过...

前端分享-原生Popover已经支持

传统网页弹窗开发需要自己处理z-index层级冲突、编写点击外部关闭的逻辑、管理多个弹窗的堆叠顺序。核心优势对比:...

Axure 8.0 综合帖——新增细节内容

一、钢笔工具与PS或者AI中的钢笔工具一样的用法。同样有手柄和锚点,如果终点和起点没有接合在一起,只要双击鼠标左键即可完成绘画。画出来的是矢量图,可以理解为新的元件。不建议通过这个工具来画ICON图等...

PostgreSQL技术内幕28:触发器实现原理

0.简介在PostgreSQL(简称PG)数据库中,触发器(Trigger)能够在特定的数据库数据变化事件(如插入、更新、删除等)或数据库事件(DDL)发生时自动执行预定义的操作。触发器的实现原理涉及...

UWP开发入门(十七)--判断设备类型及响应VirtualKey

蜀黍我做的工作跟IM软件有关,UWP同时会跑在电脑和手机上。电脑和手机的使用习惯不尽一致,通常我倾向于根据窗口尺寸来进行布局的变化,但是特定的操作习惯是依赖于设备类型,而不是屏幕尺寸的,比如聊天窗口的...