智谱开源CogVideoX-5B：打造更高质量、更具视觉冲击力的视频生成模型

10个月前发布AI俱乐部

为了配合ModelScope开源社区，我们发布了一款与国内领先水平相当的文生视频模型——CogVideoX-5B。

相对于之前的CogVideoX-2B版本，本次发布的模型在生成视频的质量和整体效果上都有了显著提升。

CogVideoX-5B采用了一种新颖的架构DiT (diffusion transformer)，它能够更有效地学习视频数据的潜在分布。该架构结合了3D因果变分自编码器(3D causal VAE)以及Transformer结构，实现了对视频内容和风格的精确控制。同时，引入的3D-RoPE能够处理视频的空间信息，确保生成视频在时间维度上的连贯性和一致性。

此外，该模型还具备生成长时序视频的能力，从而能够生成更具故事性和表现力的视频内容。

模型链接:

https://modelscope.cn/models/ZhipuAI/CogVideoX-5b

文章版权归作者所有，未经允许请勿转载。

本文地址：https://aidh.net/kuaixun/c1r1var9

暂无评论

暂无评论...

智谱开源CogVideoX-5B：打造更高质量、更具视觉冲击力的视频生成模型

Clockwise推出AI助手Prism，智能日历用户可免费体验

夸克PC端AI功能大升级：集AI搜索、创作与总结于一体

暂无评论

智谱AI发布CogVideoX视频生成模型，用户可通过“清影”平台免费体验。

智谱AI开源CogVideoX v1.5：支持5秒/10秒视频生成

智谱AI发布CogVideoX v1.5：10秒生成4K高清视频，尽享“新清影”体验

智谱发布GLM-4-Plus基座模型，清言APP同步升级视频通话功能

智谱AI开源CogVideoX：同源视频生成模型“清影”正式亮相

热门AI工具

AI快讯

历史AI快讯回顾

智谱开源CogVideoX-5B：打造更高质量、更具视觉冲击力的视频生成模型

Clockwise推出AI助手Prism，智能日历用户可免费体验

夸克PC端AI功能大升级：集AI搜索、创作与总结于一体

暂无评论

智谱AI发布CogVideoX视频生成模型，用户可通过“清影”平台免费体验。

智谱AI开源CogVideoX v1.5：支持5秒/10秒视频生成

智谱AI发布CogVideoX v1.5：10秒生成4K高清视频，尽享“新清影”体验

智谱发布GLM-4-Plus基座模型，清言APP同步升级视频通话功能

智谱AI开源CogVideoX：同源视频生成模型“清影”正式亮相

热门AI工具

AI快讯

标签云

历史AI快讯回顾