Meta 新一代视频生成模型 MarDini 发布，强势解决视频缺失帧填补难题

摘要：

近日，Meta 与沙特阿拉伯阿卜杜拉国王科技大学 (KAUST) 合作，推出了一项引人瞩目的研究成果 &mda […]

Meta 新一代视频生成模型 MarDini 发布，强势解决视频缺失帧填补难题的封面图

近日，Meta 与沙特阿拉伯阿卜杜拉国王科技大学 (KAUST) 合作，推出了一项引人瞩目的研究成果 —— MarDini。这项创新技术旨在推进场景感知的生成建模，通过深入理解场景中的复杂关联，实现更加精细和逼真的内容生成，有望为数字内容创作领域带来革命性的变革。

当前，Meta 在人工智能领域持续发力，不断推出创新成果。此前，已发布了 Emu Video 和 Emu Edit 等领先的生成模型与编辑工具。而此次发布的 MarDini，则进一步拓展了 Meta 在生成模型方面的技术实力，旨在打造更强大的视频生成工具 Movie Gen。通过持续的技术创新，Meta 致力于为用户提供更加丰富和便捷的内容创作体验。

MarDini 的核心优势在于能够对复杂场景进行细致的建模，它不仅能够理解场景中的各个元素，还能准确把握它们之间的关系，从而生成更具逻辑性和真实感的视频内容。这种技术为视频编辑、特效制作以及各种需要场景理解的生成任务提供了强大的支持。

场景理解能力

具体来说，MarDini 的独特之处在于其出色的场景理解能力。它能够通过分析场景中的各种元素，准确把握它们之间的关联，从而生成更符合现实逻辑的视频内容。研究人员通过在一个包含多个交互对象的复杂厨房环境中进行实验，证实了 MarDini 的卓越性能。实验结果显示，即使在仅有 8FPS 的低帧率条件下，MarDini 也能生成高质量的 2 秒视频。

视频生成效果

MarDini 的强大之处在于能够生成具有高度真实感和连贯性的视频内容。它能够准确地模拟物体之间的交互，并在较长时间内保持场景的稳定性，从而避免了传统生成模型容易出现的画面闪烁和物体漂移等问题。实验结果表明，MarDini 能够在 5 秒的输入视频基础上生成长达 12 秒的视频，且画面质量依然出色。

视频编辑功能

MarDini 还具备强大的视频编辑能力，能够实现对视频内容的精准控制。通过指定一个或多个对象，MarDini 能够对这些对象进行编辑和修改，从而实现各种创意性的视频编辑效果。例如，可以改变物体的颜色、形状甚至材质，从而创造出令人惊艳的视觉效果。

MarDini 的应用前景十分广阔。它可以被应用于电影制作、游戏开发、广告设计等诸多领域，为内容创作者提供强大的工具和支持。其核心优势在于能够理解复杂的场景，并根据用户的指令生成符合逻辑和具有艺术性的视频内容，从而大大提升创作效率和作品质量。简单来说，该技术包括：编辑视频和生成视频。总而言之，编辑视频模型允许利用相关环境信息 (MAR) 来实现超出传统编辑方法的范围。同时，生成模型能够产生连贯的场景，从而提升了各种生成任务的性能。

与其他同类技术相比，MarDini 不仅能够生成高质量的视频内容，还具备出色的场景理解能力。这使得它能够更加精准地把握用户的创作意图，并生成更符合用户需求的视频内容。此外，MarDini 还具有很高的可扩展性，可以与其他人工智能技术相结合，从而实现更加强大的功能。

MarDini 的一个关键创新之处在于其场景建模能力。它能够准确地捕捉场景中的物体及其关系，从而生成更逼真的视频。这一技术不仅能够提升视频的视觉质量，还能够增强视频的叙事能力。通过更逼真的场景呈现，观众可以更好地沉浸于故事之中，从而获得更丰富的观影体验。

总的来说，MarDini 的发布标志着 Meta 在人工智能领域的又一次重大突破，它为视频生成和编辑带来了全新的可能性，并将极大地推动数字内容创作的发展。这项技术不仅能够提升视频的视觉质量和叙事能力，还能够为内容创作者提供更强大的工具和支持，从而激发更多的创意和创新。未来，该技术将会广泛应用于视频内容领域，成为新的核心技术与生产力。

在官方博客中，MarDini 团队分享了他们的愿景，期望利用先进的生成建模技术，进一步拓展数字内容创作的边界，并最终实现更加智能和个性化的内容创作体验。他们的核心目标是通过技术创新，赋能更多的人参与到数字内容创作中，并创造出更加丰富和精彩的数字世界。正如他们所说：“我们的目标是通过场景感知生成建模，让每个人都能轻松地创建和编辑令人惊叹的视觉内容，在 AI 时代释放无限的创作潜力。”

项目主页：https://mardini-vidgen.github.io/

要点总结：

✨ MarDini 是 Meta 与 KAUST 联合开发的全新场景感知视频生成模型，旨在促进具备情景感知能力的视频内容创作。

🎬 该模型能够实现视频编辑和视频生成功能，从而实现更逼真的场景建模以及对场景进行编辑与修改。

💡 MarDini 致力于提供更智能的视频编辑和内容生成体验，从而弥合艺术表达与先进技术之间的差距。

文章版权归作者所有，未经允许请勿转载。

本文地址：https://aidh.net/kuaixun/08l5loi6