
阶跃星辰与吉利汽车集团联合宣布,将双方合作研发的两款Step系列多模态大模型面向全球开发者开源,其中包括当前全球范围内参数规模最大、性能领先的开源视频生成模型Step-Video-T2V,以及业界首款产品级开源语音交互大模型Step-Audio。

据AI工具库信息,Step-Video-T2V模型参数量高达300亿,可直接生成204帧、540P分辨率的高质量视频。阶跃星辰表示,根据其获得的评测结果,该模型是目前全球范围内参数规模最大、性能表现最优异的开源视频生成大模型。
Step-Audio是业界首个产品级开源语音交互模型,能够根据不同场景需求生成具备情绪、方言、语种、歌声及个性化风格的表达,实现与用户自然流畅的高质量对话。该模型生成的语音具有高度自然、富含情感等特点,同时能够实现高质量的音色复刻。用户现已可在跃问App内体验此项新功能。
阶跃星辰作为吉利汽车集团的科技生态战略合作伙伴,在两款大模型的研发过程中,双方开展了深度合作,于算力算法、场景训练等领域优势互补,显著提升了多模态大模型的性能表现。阶跃星辰表示,深谙通用人工智能(AGI)的实现离不开全球开发者的共同努力,开源的初衷在于分享最新的多模态大模型技术成果,为全球开源社区贡献来自中国的力量。
阶跃星辰(上海阶跃星辰智能科技有限公司)成立于2023年,总部位于中国上海,是一家专注于人工智能大模型研发与应用的公司。该公司由前微软全球副总裁姜大昕创立,于2024年3月发布了Step系列大模型,并推出了两款人工智能应用产品:跃问、冒泡鸭。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关AI热点
暂无评论...