生数科技发布Vidu 1.5,突破多主体一致性视频生成瓶颈

4个月前发布AI俱乐部
4 0 0
生数科技发布Vidu 1.5,突破多主体一致性视频生成瓶颈的封面图

近日,Vidu迎来重要更新,昆仑万维正式发布了Vidu1.5版本,该版本在整体性能方面实现了显著提升,旨在打造更具通用性和创造力的视频生成模型。

Vidu1.5的突出特点在于模拟和学习了通用世界,更加接近通用人工智能(AGI)的目标。Vidu在视觉效果方面实现了单镜头一致性的突破,能够模仿真实人物的运动方式,并对复杂场景和物理规律进行准确的模拟。今年9月,Vidu成功实现了“全球首个长时程”的突破,实现了对更长时间跨度的模拟,进一步提升了其应用价值。Vidu的核心技术进步体现在以下三个方面:多镜头运镜的流畅度和连贯性、人物动作与面部表情的自然程度,以及复杂场景的物理规律模拟。

Vidu1.5专注于提升生成视频的通用能力,旨在模拟更加贴近现实的世界运行规则。此次性能升级不仅体现在对物理规律和光影效果的模拟上,还体现在其生成高品质内容的能力上。Vidu1.5展现了更强的通用性,在不到30秒的时间内即可生成高质量的视频。Vidu借鉴了大语言模型(LLM)的关键技术,实现了图像和视频处理方面的技术突破,同时借鉴了Transformer架构在处理时序信息方面的优势,从而实现了生成视频质量的显著提升。

Vidu1.5的发布,不仅提升了视频生成模型的技术水平,还为未来的技术发展奠定了基础,有助于更好地模拟真实世界的运行规则。此次性能升级预示着,AGI的实现离我们更近一步。Vidu不仅为我们提供了一个强大的视频生成工具,更重要的是,它正在推动通用人工智能的发展,成为构建未来世界的关键基石。此次技术革新展现了面向AGI的一次重要探索,标志着朝着AGI的目标迈出了坚实的一步。

官方网站:www.vidu.studio

© 版权声明:
本文地址:https://aidh.net/kuaixun/0oib00l3

暂无评论

none
暂无评论...