
腾讯公司于今日正式发布了其新一代快速思考模型——混元 Turbo S。
据腾讯官方介绍,与 Deepseek R1、混元 T1 等需要“思考后回答”的慢思考模型不同,混元 Turbo S 实现了“即时响应”,能够更迅速地输出答案,文本生成速度提升了一倍,首字延迟降低了 44%。
在业界通用的多个公开基准测试中,混元 Turbo S 在知识、数学、推理等多个领域均展现出卓越性能,可与 DeepSeek V3、GPT 4o、Claude 等一系列业界领先模型相媲美。
在架构方面,混元 Turbo S 采用了 Hybrid-Mamba-Transformer 融合模式,有效降低了传统 Transformer 结构的计算复杂度,减少了 KV-Cache 缓存占用,从而降低了训练和推理成本。
腾讯方面还表示,这种新的融合模式突破了传统纯 Transformer 结构大模型在长文本训练和推理方面成本高昂的难题。该模式既发挥了 Mamba 在高效处理长序列方面的优势,又保留了 Transformer 擅长捕捉复杂上下文的特点,最终构建了在显存和计算效率上均表现出色的混合架构。
这也是工业界首次成功地将 Mamba 架构无损地应用于超大型 MoE 模型。通过模型架构上的技术创新,混元 Turbo S 的部署成本得以大幅降低。
作为旗舰模型,混元 Turbo S 未来将成为腾讯混元系列衍生模型的核心基座,为推理、长文本、代码等衍生模型提供基础能力。
基于 Turbo S,通过引入长思维链、检索增强和强化学习等技术,混元还推出了具备深度思考能力的推理模型 T1。
据 AI 工具库从腾讯公告中获悉,开发者和企业用户目前已可以通过腾讯云上的 API 调用腾讯混元 Turbo S,并可自即日起在一周内免费试用。
在定价方面,Turbo S 的输入价格为 0.8 元 / 百万 tokens,输出价格为 2 元 / 百万 tokens。
腾讯元宝即将逐步灰度上线混元 Turbo S,用户在元宝内选择“Hunyuan”模型并关闭深度思考即可体验使用。
文章中提到的AI工具
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关AI热点

暂无评论...