腾讯混元上线图生视频模型,我们用七个Prompt进行了测试

产业4个月前发布 智能之星
9 0 0

基于实验的数据。

腾讯实施了一场迅猛的市场攻势。

3月3日,腾讯元宝在中国区苹果App Store中反超DeepSeek,荣登免费榜首。

腾讯混元上线图生视频模型,我们用七个Prompt进行了测试

对于腾讯元宝而言,春节前其排名尚在200名开外,面对大量大模型的竞争犹如一颗“小卡拉米”,但自从接入DeepSeek后,仅用了十天的时间便迅速跃升至榜单第二位。

紧接着,不到十天便成功夺得榜首。

腾讯混元上线图生视频模型,我们用七个Prompt进行了测试

腾讯元宝的广告几乎无处不在。

在浏览微信公众号、朋友圈时,时常会突然出现“腾讯元宝,AI人工智能专家”的字样。

腾讯混元上线图生视频模型,我们用七个Prompt进行了测试

充值话费时,微信的“生活服务”栏目中也能看到“元宝下载”的推荐:

腾讯混元上线图生视频模型,我们用七个Prompt进行了测试

进行信息检索时,微信搜索栏下方也能找到它:

腾讯混元上线图生视频模型,我们用七个Prompt进行了测试

即使在享受音乐时,QQ音乐的开屏广告也展示了它的身影;在腾讯视频观看剧集时,无论暂停还是播放,它都时刻伴随在侧;即便召开会议,同样难以逃脱它的影响。

此外,在B站、小红书、微博等各种应用中也频繁见到元宝的身影。

在腾讯元宝积极吸引用户的同时,混元视频也在持续发展。

3月6日,腾讯混元终于上线并开源了其图生视频模型。

体验链接:[https://video.hunyuan.tencent.com/](https://video.hunyuan.tencent.com/)

用户只需上传一张图片并输入提示词,即可生成一段自带配音的5秒视频。

视频的画质最高可达到2K高清。

腾讯混元上线图生视频模型,我们用七个Prompt进行了测试

接下来,我们将一同体验这一新功能。

-1-

表情控制能力

表情是人类交流中最直接、最关键的元素。

一个微笑、皱眉或眼神的细微变化,能够传达丰富的情感信息。

如果AI生成的视频中的人物表情显得僵硬或不自然,观众将会迅速感到疏离,甚至可能认为其为虚构之作。

因此,我们首先测试混元AI视频的“表情控制”能力。

不久前,第97届奥斯卡金像奖获奖名单已公布,阿德里安·布劳迪凭借电影《野兽派》获得最佳男主角。

我们上传了一张他的剧照,并输入了提示词:男人悲伤地流泪。

腾讯混元上线图生视频模型,我们用七个Prompt进行了测试

画面中的阿德里安立刻栩栩如生。

他的眉头微微皱起,眼中闪烁着泪光,泪水缓缓从眼眶中落下,沿着面颊滑落,头部也轻微颤动。

然而,遗憾的是,混元自动生成的配音并未与画面一致。

腾讯混元上线图生视频模型,我们用七个Prompt进行了测试

在混元生成的视频中,一位白发老人时而凝视镜头,时而垂目凝思。

微笑时,眼睛微微闭合,眼角的皱纹更加明显,嘴角微微上扬,露出几颗牙齿,整个表情自然生动,同时伴随身体的动作,使整个画面更具动感。

腾讯混元上线图生视频模型,我们用七个Prompt进行了测试

混元严格遵循了文本描述。在视频的开头,一名老人独自在公园长椅上休坐,背对着镜头。随着其视线转动,画面右侧出现了一位身穿黑色风衣的年轻女性。

虽然她的动作较为灵活,但并没有出现腿脚不分或四肢不协调的问题。

此外,系统还发挥想象,远处生成了几辆汽车缓缓驶过,丰富了画面内容,使场景更显真实。

腾讯混元上线图生视频模型,我们用七个Prompt进行了测试

在视频中,女主轻轻荡着秋千,男主从左侧走入镜头,顺势走到女主身后,整个动作流畅自然,几乎没有瑕疵。

但遗憾的是,女主的面貌却发生了变化,并不再是凯拉·奈特利,表明混元在主体一致性方面仍需进一步改进。

腾讯混元上线图生视频模型,我们用七个Prompt进行了测试(提示词:一名女生正走在路上,一位男士从画面左侧走来,手中握着一束玫瑰花。)粒子。运用 Phantom 高速摄影捕捉水滴飞溅瞬间。

效果展示:

腾讯混元上线图生视频模型,我们用七个Prompt进行了测试 *(提示词:超现实香水广告 CG,中心悬浮 Art Deco 风格的蓝水晶香水瓶缓慢自转,蝶群环绕飞舞。配音由混元自动生成。)*

文章中提到的AI工具

Deco
Deco

设计稿一键生成多端代码

DeepSeek
DeepSeek

深度求索:引领未来人工智能技术的探索与创新

© 版权声明

相关AI热点

没有相关内容!

暂无评论

none
暂无评论...