

近日,一家名为 DIAMOND(用于世界建模的扩散模型)的人工智能模型引起了广泛关注,它能够模拟在第一人称射击游戏《反恐精英:全球攻势》(CS:GO)中的游戏场景。
该模型在一台配备 Nvidia RTX3090 显卡的计算机上进行训练,并且使用了 10 个训练步骤。相比于其他 AI 模型,这种方法显著减少了训练所需的时间。
DIAMOND 的性能评估显示,在模拟 87 个不同的 CS:GO 对战场景时,其表现优于 GameNGen 生成的 0.5% 的数据。这意味着该模型能够更好地模拟游戏环境,为人工智能在复杂场景中的应用提供了新的可能性。
DIAMOND 的设计灵感来源于 Atari 游戏的早期研究,它采用了类似于 Transformer 的架构,通过“补丁”的方式来处理图像,即把图像分割成小的块进行分析。通过这种方式,该模型能够学习并预测游戏中各个对象之间的交互和动态变化。
开发人员 Eloi Alonso 在 Twitter 上分享了这一模型,并表示它能够通过学习大量数据来模拟 CS:GO 游戏中的复杂行为。该模型甚至可以预测玩家的行动,包括走位和射击。这表明 DIAMOND 在理解和模拟复杂环境方面具有巨大的潜力。
此外,该模型还能够模拟 Source 引擎的物理特性,从而更逼真地模拟游戏世界。这意味着人工智能可以更好地理解和模拟复杂的物理环境,为未来的研究提供更多可能性。
总而言之,通过模拟游戏环境和学习游戏规则,该人工智能模型展示了其在复杂环境中的学习和适应能力。这一进展有望推动人工智能在游戏和其他领域的应用。
值得一提的是,DIAMOND 的 CS:GO 训练模型超越了 Google Research、Google DeepMind 和其他团队利用 GameNGen 生成器进行世界建模的工作,并且在单个 Google TPU 设备上仅用 20 步就实现了与 DOOM 游戏相媲美的性能。
最后,为了方便研究人员使用,DIAMOND 模型的源代码已发布在 GitHub 上,供大家下载和使用。
项目地址:https://diamond-wm.github.io/
关键信息:
- 一款名为 DIAMOND 的人工智能模型能够模拟 CS:GO 游戏场景,并在 Nvidia RTX3090 显卡上仅用 10 步完成训练。
- 该模型在模拟 87 个不同场景时的表现优于其他数据生成方法,能够更真实地模拟游戏环境。
- DIAMOND 展现了其在复杂环境中的学习能力,并且为人工智能在游戏领域的应用提供了新的思路。