智谱AI发布CogVideoX视频生成模型，用户可通过“清影”平台免费体验。

最近，清华大学推出了新一代AI视频生成模型CogVideoX，它在视频生成领域展现了卓越的创新能力。

CogVideoX的关键技术亮点包括：

优化的三维变分自编码器（3D VAE）：该AI模型采用了一种先进的三维变分自编码器，显著降低了视频生成的计算负担，训练成本降低了2%，同时保证了高质量的生成效果。结合3D RoPE技术，模型能够处理更长的视频序列，从而生成内容更加丰富的视频。

创新的分层视频生成方法：通过将视频内容和风格进行解耦，该模型能够更好地控制视频的生成过程，允许用户通过调整提示词（prompt）来定制视频的风格和内容。

高效的时空Transformer架构：该模型采用了Expert Block稀疏注意力机制，专注于关键时空信息的处理，并结合Full Attention架构来捕捉全局的视频特征。

CogVideoX模型目前已在清华大学的PC集群上部署，用户可以通过“清影”（Ying）平台体验AI视频生成和编辑功能。该平台支持文本生成视频、图像生成视频等多种创作方式，能够处理复杂场景和生成高质量的内容。该模型的卓越性能体现在其快速生成能力、对提示词的精准理解以及对复杂场景的有效处理。

目前，您可以通过访问bigmodel.cn上的“清影”体验入口，申请并使用API服务。清华AI团队致力于通过Scaling Law拓展视频生成模型的性能边界，旨在实现更高分辨率、更长时长的视频生成，并推动人工智能在视频内容创作领域的广泛应用。

项目链接：https://top.aibase.com/tool/qingying-ai-shipinshengchengfuwu

文章版权归作者所有，未经允许请勿转载。

本文地址：https://aidh.net/kuaixun/ne50qsam