Tim Brooks加入DeepMind，领衔构建下一代世界模型团队

10个月前发布AI俱乐部

摘要：

人工智能的出现，正逐渐改变着创意领域的面貌。其中，Tim Brooks 担任着谷歌的生成影像研究负责人。他正在 […]

人工智能的出现，正逐渐改变着创意领域的面貌。其中，Tim Brooks 担任着谷歌的生成影像研究负责人。他正在 Sora 项目上与来自 Google DeepMind 的团队一同工作。他们的目标是让 Sora 能够模拟真实且充满想象力的世界，这与该团队此前在图像生成领域所做的努力密不可分。

据介绍，Sora 在视频生成方面，已经超越了 Luma、Stability、Runway 等其他公司。目前，这项技术还处于早期阶段，但 Tim Brooks 相信 Sora 具备生成高质量视频的潜力。他同时指出，谷歌也在积极研发与 Sora 类似的视频生成模型 Veo，旨在提供更出色的视频编辑能力。

Tim Brooks 强调，Google DeepMind 致力于研究人工智能在图像和视频生成方面的应用。DeepMind 首席执行官 Demis Hassabis 曾表示，他们的目标是“构建通用人工智能”，而 Tim Brooks 认为，实现这一目标的关键在于构建能够创造复杂世界的通用模型。他进一步指出，DeepMind 正在努力提升视频模型的质量，其中包括 Gemini、Veo 以及 Genie 等项目，他们的共同愿景是“构建世界模型”。

为了实现这一愿景，Tim Brooks 积极投入时间和资源，用于训练扩散模型和 Transformer 模型，其数据量已达到136,000个视频和245,000张图片。这些模型的训练旨在学习视频中的空间和时间关系，从而使人工智能能够理解真实世界的物理规律，并在此基础上生成内容。

总的来说，人工智能视频生成技术的发展，有望大幅降低制作高质量内容的技术门槛。《Wired》杂志的一篇文章指出，虽然当前的模型可能会产生不准确的结果，但人工智能正在迅速改进其内容创作能力，并有望实现创意民主化。例如，一些独立游戏开发者利用 Odyssey 工具，将人工智能融入游戏开发流程，这在过去是难以想象的。

总而言之，Google 正在积极探索通用人工智能在图像和视频生成领域的应用，并对未来的发展充满信心。