日前,微软方面发布并开源首个世界与人类行动模型(World and Human Action Model,WHAM)Muse,并表示该模型“专为游戏构思而设计”,其生成的3D世界能遵循设计用于电子游戏的机制。 据了解,Muse由微软游戏智能团队、可教学人工智能体验(Tai X)团队与Xbox游戏工作室Ninja Theory合作开发,能够生成游戏画面、控制操作,以及同步完成这两项任务。该模型采用Transformer架构作为其序列预测的骨干网络,并使用VQGAN图像编码器将图像编码为离散的token序列,通过对真实人类游戏玩法数据的训练,能够准确预测游戏环境的3D结构、控制器动作的效果以及游戏的时空结构。 据悉在相关演示中,微软方面展示了Muse如何使用来源于2020年游戏《Bleeding Edge》的训练数据生成视频游戏视觉效果。具体而言,Muse在超过10亿张图片和控制操作上进行训练,相当于超过7年的人类连续游戏时长。开发者只需提供仅10个初始帧(相当于1秒钟的游戏视频)以及整个游戏过程中的控制器操作,Muse便能生成后续的游戏画面。 值得一提的是微软方面还透露,正在探索利用Muse保存和重振经典游戏。 对此微软方面表示,“如今,无数与老旧硬件绑定的经典游戏已无法被大多数人游玩。多亏了这一突破,我们正在探索利用Muse从我们工作室的旧游戏库中选取较老的游戏,并针对各种设备对它们进行优化。我们相信,这可能会从根本上改变我们在未来保存和体验经典游戏的方式,让更多玩家能够玩到这些游戏。想象一下,那些因时间流逝和硬件发展而被遗忘的深受喜爱的游戏,有朝一日能在任何搭载Xbox的屏幕上玩到,对我们来说这是一种令人兴奋的可能性”。 【本文图片来自网络】 |