腾讯混元 Turbo S 发布:新一代快思考模型,响应速度提升至“秒回”级别

人工智能4个月前发布 AI之家
7 0 0

腾讯公司于今日正式发布了其新一代快速思考模型——混元 Turbo S。

据腾讯官方介绍,与 Deepseek R1、混元 T1 等需要“思考后回答”的慢思考模型不同,混元 Turbo S 实现了“即时响应”,能够更迅速地输出答案,文本生成速度提升了一倍,首字延迟降低了 44%

在业界通用的多个公开基准测试中,混元 Turbo S 在知识、数学、推理等多个领域均展现出卓越性能,可与 DeepSeek V3、GPT 4o、Claude 等一系列业界领先模型相媲美。

腾讯混元 Turbo S 发布:新一代快思考模型,响应速度提升至“秒回”级别
腾讯混元 Turbo S 发布:新一代快思考模型,响应速度提升至“秒回”级别

在架构方面,混元 Turbo S 采用了 Hybrid-Mamba-Transformer 融合模式,有效降低了传统 Transformer 结构的计算复杂度,减少了 KV-Cache 缓存占用,从而降低了训练和推理成本。

腾讯方面还表示,这种新的融合模式突破了传统纯 Transformer 结构大模型在长文本训练和推理方面成本高昂的难题。该模式既发挥了 Mamba 在高效处理长序列方面的优势,又保留了 Transformer 擅长捕捉复杂上下文的特点,最终构建了在显存和计算效率上均表现出色的混合架构。

这也是工业界首次成功地将 Mamba 架构无损地应用于超大型 MoE 模型。通过模型架构上的技术创新,混元 Turbo S 的部署成本得以大幅降低。

作为旗舰模型,混元 Turbo S 未来将成为腾讯混元系列衍生模型的核心基座,为推理、长文本、代码等衍生模型提供基础能力。

基于 Turbo S,通过引入长思维链、检索增强和强化学习等技术,混元还推出了具备深度思考能力的推理模型 T1。

据 AI 工具库从腾讯公告中获悉,开发者和企业用户目前已可以通过腾讯云上的 API 调用腾讯混元 Turbo S,并可自即日起在一周内免费试用

在定价方面,Turbo S 的输入价格为 0.8 元 / 百万 tokens,输出价格为 2 元 / 百万 tokens

腾讯元宝即将逐步灰度上线混元 Turbo S,用户在元宝内选择“Hunyuan”模型并关闭深度思考即可体验使用。

文章中提到的AI工具

DeepSeek
DeepSeek

深度求索:引领未来人工智能技术的探索与创新

Claude
Claude

由Anthropic公司开发的下一代人工智能AI助手

© 版权声明

相关AI热点

暂无评论

none
暂无评论...