lora

共 1 篇文章

腾讯混元发布图生视频模型,开放源代码并推出对口型和动作驱动等新玩法

腾讯发布了混元图生视频模型并对外开源,同时推出了多种新玩法,包括口型对齐和动作驱动功能,支持生成背景音效以及2K高质量视频。 基于图生视频技术,用户只需上传一张图片,并简要描述期望的动态效果及镜头调度,混元便能够根据要求将图片动起来,转化为5秒短视频,并自动添加背景音效。此外,用户若上传一张人物图片...
AGI2个月前
腾讯混元发布图生视频模型,开放源代码并推出对口型和动作驱动等新玩法