智谱AI发布CogVideoX视频生成模型,用户可通过“清影”平台免费体验。

8个月前发布AI俱乐部
4 0 0
智谱AI发布CogVideoX视频生成模型,用户可通过“清影”平台免费体验。的封面图

最近,清华大学推出了新一代AI视频生成模型CogVideoX,它在视频生成领域展现了卓越的创新能力。

CogVideoX的关键技术亮点包括:

  1. 优化的三维变分自编码器(3D VAE):该AI模型采用了一种先进的三维变分自编码器,显著降低了视频生成的计算负担,训练成本降低了2%,同时保证了高质量的生成效果。结合3D RoPE技术,模型能够处理更长的视频序列,从而生成内容更加丰富的视频。

  2. 创新的分层视频生成方法:通过将视频内容和风格进行解耦,该模型能够更好地控制视频的生成过程,允许用户通过调整提示词(prompt)来定制视频的风格和内容。

  3. 高效的时空Transformer架构:该模型采用了Expert Block稀疏注意力机制,专注于关键时空信息的处理,并结合Full Attention架构来捕捉全局的视频特征。

CogVideoX模型目前已在清华大学的PC集群上部署,用户可以通过“清影”(Ying)平台体验AI视频生成和编辑功能。该平台支持文本生成视频、图像生成视频等多种创作方式,能够处理复杂场景和生成高质量的内容。该模型的卓越性能体现在其快速生成能力、对提示词的精准理解以及对复杂场景的有效处理。

目前,您可以通过访问bigmodel.cn上的“清影”体验入口,申请并使用API服务。 清华AI团队致力于通过Scaling Law拓展视频生成模型的性能边界,旨在实现更高分辨率、更长时长的视频生成,并推动人工智能在视频内容创作领域的广泛应用。

项目链接:https://top.aibase.com/tool/qingying-ai-shipinshengchengfuwu

© 版权声明:
本文地址:https://aidh.net/kuaixun/ne50qsam

暂无评论

none
暂无评论...