基于实验的数据。
腾讯实施了一场迅猛的市场攻势。
3月3日,腾讯元宝在中国区苹果App Store中反超DeepSeek,荣登免费榜首。

对于腾讯元宝而言,春节前其排名尚在200名开外,面对大量大模型的竞争犹如一颗“小卡拉米”,但自从接入DeepSeek后,仅用了十天的时间便迅速跃升至榜单第二位。
紧接着,不到十天便成功夺得榜首。

腾讯元宝的广告几乎无处不在。
在浏览微信公众号、朋友圈时,时常会突然出现“腾讯元宝,AI人工智能专家”的字样。

充值话费时,微信的“生活服务”栏目中也能看到“元宝下载”的推荐:

进行信息检索时,微信搜索栏下方也能找到它:

即使在享受音乐时,QQ音乐的开屏广告也展示了它的身影;在腾讯视频观看剧集时,无论暂停还是播放,它都时刻伴随在侧;即便召开会议,同样难以逃脱它的影响。
此外,在B站、小红书、微博等各种应用中也频繁见到元宝的身影。
在腾讯元宝积极吸引用户的同时,混元视频也在持续发展。
3月6日,腾讯混元终于上线并开源了其图生视频模型。
体验链接:[https://video.hunyuan.tencent.com/](https://video.hunyuan.tencent.com/)
用户只需上传一张图片并输入提示词,即可生成一段自带配音的5秒视频。
视频的画质最高可达到2K高清。

接下来,我们将一同体验这一新功能。
-1-
表情控制能力
表情是人类交流中最直接、最关键的元素。
一个微笑、皱眉或眼神的细微变化,能够传达丰富的情感信息。
如果AI生成的视频中的人物表情显得僵硬或不自然,观众将会迅速感到疏离,甚至可能认为其为虚构之作。
因此,我们首先测试混元AI视频的“表情控制”能力。
不久前,第97届奥斯卡金像奖获奖名单已公布,阿德里安·布劳迪凭借电影《野兽派》获得最佳男主角。
我们上传了一张他的剧照,并输入了提示词:男人悲伤地流泪。

画面中的阿德里安立刻栩栩如生。
他的眉头微微皱起,眼中闪烁着泪光,泪水缓缓从眼眶中落下,沿着面颊滑落,头部也轻微颤动。
然而,遗憾的是,混元自动生成的配音并未与画面一致。

在混元生成的视频中,一位白发老人时而凝视镜头,时而垂目凝思。
微笑时,眼睛微微闭合,眼角的皱纹更加明显,嘴角微微上扬,露出几颗牙齿,整个表情自然生动,同时伴随身体的动作,使整个画面更具动感。

混元严格遵循了文本描述。在视频的开头,一名老人独自在公园长椅上休坐,背对着镜头。随着其视线转动,画面右侧出现了一位身穿黑色风衣的年轻女性。
虽然她的动作较为灵活,但并没有出现腿脚不分或四肢不协调的问题。
此外,系统还发挥想象,远处生成了几辆汽车缓缓驶过,丰富了画面内容,使场景更显真实。

在视频中,女主轻轻荡着秋千,男主从左侧走入镜头,顺势走到女主身后,整个动作流畅自然,几乎没有瑕疵。
但遗憾的是,女主的面貌却发生了变化,并不再是凯拉·奈特利,表明混元在主体一致性方面仍需进一步改进。
(提示词:一名女生正走在路上,一位男士从画面左侧走来,手中握着一束玫瑰花。)粒子。运用 Phantom 高速摄影捕捉水滴飞溅瞬间。
效果展示:
*(提示词:超现实香水广告 CG,中心悬浮 Art Deco 风格的蓝水晶香水瓶缓慢自转,蝶群环绕飞舞。配音由混元自动生成。)*
文章中提到的AI工具
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关AI热点
没有相关内容!
暂无评论...