生数科技发布Vidu 1.5，突破多主体一致性视频生成瓶颈

摘要：

近日，Vidu迎来重要更新，昆仑万维正式发布了Vidu1.5版本，该版本在整体性能方面实现了显著提升，旨在打造 […]

近日，Vidu迎来重要更新，昆仑万维正式发布了Vidu1.5版本，该版本在整体性能方面实现了显著提升，旨在打造更具通用性和创造力的视频生成模型。

Vidu1.5的突出特点在于模拟和学习了通用世界，更加接近通用人工智能（AGI）的目标。Vidu在视觉效果方面实现了单镜头一致性的突破，能够模仿真实人物的运动方式，并对复杂场景和物理规律进行准确的模拟。今年9月，Vidu成功实现了“全球首个长时程”的突破，实现了对更长时间跨度的模拟，进一步提升了其应用价值。Vidu的核心技术进步体现在以下三个方面：多镜头运镜的流畅度和连贯性、人物动作与面部表情的自然程度，以及复杂场景的物理规律模拟。

Vidu1.5专注于提升生成视频的通用能力，旨在模拟更加贴近现实的世界运行规则。此次性能升级不仅体现在对物理规律和光影效果的模拟上，还体现在其生成高品质内容的能力上。Vidu1.5展现了更强的通用性，在不到30秒的时间内即可生成高质量的视频。Vidu借鉴了大语言模型（LLM）的关键技术，实现了图像和视频处理方面的技术突破，同时借鉴了Transformer架构在处理时序信息方面的优势，从而实现了生成视频质量的显著提升。

Vidu1.5的发布，不仅提升了视频生成模型的技术水平，还为未来的技术发展奠定了基础，有助于更好地模拟真实世界的运行规则。此次性能升级预示着，AGI的实现离我们更近一步。Vidu不仅为我们提供了一个强大的视频生成工具，更重要的是，它正在推动通用人工智能的发展，成为构建未来世界的关键基石。此次技术革新展现了面向AGI的一次重要探索，标志着朝着AGI的目标迈出了坚实的一步。

官方网站:www.vidu.studio

文章版权归作者所有，未经允许请勿转载。

本文地址：https://aidh.net/kuaixun/0oib00l3