360智脑推出Tiny-R1-32B：性能参数逼近Deepseek-R1的95%

标签：360智脑 AI推理模型 Tiny-R1-32B-Preview 高效推理

摘要：

2024年2月，360智脑发布了基于大模型的系列产品，其中包括Tiny-R1-32B-Preview预览版。该 […]

360智脑推出Tiny-R1-32B：性能参数逼近Deepseek-R1的95%的封面图

2024年2月，360智脑发布了基于大模型的系列产品，其中包括Tiny-R1-32B-Preview预览版。该版本参数规模为320亿，在多个评测基准上取得了优异成绩，例如在部分评测中提升了5%的准确率，相比Deepseek-R1-671B模型参数量更小，但性能表现令人满意，且更易于部署和应用，为用户提供便捷高效的使用体验。

这些模型在多个公开基准测试中表现出色，例如Tiny-R1-32B-Preview在AIME2024评测中取得了78.1%的准确率，而R1模型达到了79.8%的准确率；Deepseek-R1-Distill-Llama-70B模型则达到了70.0%的准确率。此外，在LiveCodeBench和GPQA-Diamond评测中，也展现出优异的性能，分别取得61.6%和65.0%的准确率，展现出70B参数量模型Deepseek-R1-Distill-Llama-70B的强大实力。与同等规模模型相比，其性能优势显著，并且在资源消耗方面也具有优势。

360智脑团队持续改进优化模型，致力于打造“高效-极致”的大模型产品。DeepSeek-R1模型在多个评测基准上展现了其强大的性能，并通过参数量精简和蒸馏技术，实现了高效的推理速度和更低的资源消耗，其在多个评测中均取得了领先的成绩。同时，Arcee和Mergekit等项目也为模型的优化和应用提供了支持，持续改进模型的性能和效率，为用户带来更优质的使用体验。此外，团队也积极探索模型的应用场景，致力于将技术成果落地应用，推动人工智能技术的进步。

360智脑持续投入大模型研发，并取得了显著进展。Tiny-R1-32B-Preview模型凭借其小巧的规模和优异的性能，获得了广泛关注，其在特定任务上的性能提升显著。团队通过持续的优化和改进，不断提升模型的性能和效率，例如对参数进行了精调和蒸馏处理，以平衡模型大小和性能表现。这使得模型更易于部署和应用，降低了使用门槛，为用户提供了更便捷高效的选择。

为了方便用户使用和体验，360智脑团队已将相关模型和代码开源，用户可通过Hugging Face平台访问相关资源。具体地址为：https://huggingface.co/qihoo360/TinyR1-32B-Preview。