掌控运动！开源阶跃星辰 Step-Video-TI2V 图生视频模型

上海阶跃星辰智能科技有限公司宣布开源其最新的图生成视频模型——Step-Video-TI2V。该模型基于30B参数的Step-Video-T2V模型训练而成，能够生成102帧、5秒、540P分辨率的视频，具有运动幅度和镜头运动可控的两大核心特点，尤其在动漫效果方面表现出色。相较于现有的开源图生成视频模型，Step-Video-TI2V不仅在参数规模上提供了更高的上限，其运动幅度可控能力还能平衡视频生成结果的动态性和稳定性，为创作者提供了更灵活的选择。

Step-Video-TI2V的开发过程中，团队进行了两大关键优化。首先，引入图像条件以提高生成视频与原图的一致性。与传统的cross-attention方法不同，该模型采用了更直接的方式，将图像对应的向量表示与DiT第一帧对应的向量表示直接进行channel维度的拼接，确保生成的视频与输入图片高度一致。其次，通过AdaLN模块引入视频动态性打分信息，使用户在生成视频时可以指定不同的运动级别，精准控制视频的动态幅度，以实现动态性、稳定性和一致性的平衡。此外，团队还对主体动作和镜头运动进行了专项精准标注，进一步提升了模型在主体动态性和镜头效果上的表现。

Step-Video-TI2V的核心特点包括运动幅度可控、多种镜头运动控制、动漫效果优异以及支持多尺寸视频生成。用户可以根据创作需求自由切换动态与稳定画面，生成从基本的推拉摇移、升降到复杂电影级镜头效果的视频。该模型在动漫类任务上表现突出，非常适合动画创作和短视频制作等应用场景。同时，它支持多种尺寸的图生成视频，可适应横屏、竖屏甚至方屏等不同平台需求。

如需体验，请访问以下网址：
https://yuewen.cn/videos

GitHub地址：
https://github.com/stepfun-ai/Step-Video-TI2V

GitHub-ComfyUI地址：
https://github.com/stepfun-ai/ComfyUI-StepVideo

文章版权归作者所有，未经允许请勿转载。

本文地址：https://aidh.net/kuaixun/8jcp6n03