DeepSeek发布R1推理模型，性能媲美OpenAI-o1

10个月前发布AI俱乐部

摘要：

2025年1月20日，DeepSeek发布了通过强化学习（RL）训练得到的全新一代模型DeepSeek-R1， […]

2025年1月20日，DeepSeek发布了通过强化学习（RL）训练得到的全新一代模型DeepSeek-R1，其性能表现超越了OpenAI在2023年12月17日发布的o1-1217版本模型。DeepSeek-R1基于DeepSeek-V3-Base模型，并在此基础上进行了海量数据的强化学习训练，从而显著提升了模型的推理能力。

DeepSeek的研发人员还推出了一款名为DeepSeek-R1-Zero的零样本推理模型，这是一种无需任何训练数据直接进行推理的模型，但具备出色的问题解决能力。DeepSeek-R1-Zero在推理能力方面表现出色，例如，在AIME2024评测中，其pass@1准确率达到15.6%，而pass@8准确率高达71.0%。总而言之，DeepSeek-R1-Zero是一款功能强大的模型，能够处理各种复杂的任务。值得一提的是，DeepSeek为此模型配备了代码生成和文本处理能力。

为了实现这些强大的功能，DeepSeek还发布了DeepSeek-R1。DeepSeek-R1在解决复杂问题方面表现卓越，这得益于其海量数据的强化学习训练和推理能力的提升。同时，研发人员还开源了所有相关的代码，方便开发者基于DeepSeek-V3-Base模型进行二次开发。不仅如此，他们还提供了DeepSeek-R1-Zero的所有相关模型权重，进一步方便了研究人员对零样本推理能力的研究。在训练过程中，研发团队使用了大量高质量的合成数据，以便提高模型在复杂问题上的表现，他们也期待DeepSeek-V3能在对话、编程、数学和通用基准等领域有所突破。目前，用户可以免费申请DeepSeek-V3-Base模型的使用权限，以便体验其强大的功能。此外，您还可以利用该模型的权重构建出色的应用程序。

以下是DeepSeek-R1在各项基准测试中取得的优异成绩：

• 在AIME2024测试中，DeepSeek-R1的pass@1准确率达到了79.8%，远超OpenAI-o1-1217模型。

• 在MATH-500测试中，DeepSeek-R1的pass@1准确率高达97.3%，再次超越OpenAI-o1-1217模型。

• 在编程能力评估方面，DeepSeek-R1在Codeforces平台上达到了2029的Elo评分，超越了96.3%的参赛选手。

• 在知识型基准测试（包括MMLU、MMLU-Pro和GPQA Diamond）中，DeepSeek-R1的准确率分别达到了90.8%、84.0%和71.5%，全面领先于DeepSeek-V3。

• 在其他各项基准测试（如常识推理、多语言处理、阅读理解和世界知识）中，DeepSeek-R1也展现出了强大的竞争力。

总而言之，DeepSeek致力于打造能够理解并解决复杂问题的通用模型。目前的DeepSeek-R1已经具备了在各类任务中展现卓越性能的潜力。未来，DeepSeek将继续专注于利用模型能力解决实际问题，致力于使其在商业应用中发挥更大的价值。这种对实际应用的关注体现了该公司对推动通用人工智能发展的坚定承诺。DeepSeek推出了DeepSeek-R1-Zero和DeepSeek-R1模型，它们均可媲美Qwen和Llama等大型模型。DeepSeek-R1拥有一系列不同规格的模型（1.5B、7B、8B、14B、32B和70B），并已开源。DeepSeek-R1的目标是为研究和商业领域提供一个功能强大且易于使用的基础模型，从而促进人工智能技术的普及和发展。

价格信息

目前，DeepSeek-R1已全面开放API接口，方便用户使用。API调用价格分为两种：输入价格为0.14美元/百万token（约合人民币），输出价格为0.55美元/百万token。同时，也提供企业级的私有部署方案。如果您有任何关于模型部署或API调用的需求，请随时联系我们，期待与您携手共创未来！立即体验DeepSeek的强大功能！访问 https://chat.deepseek.com 开启 DeepThink!

许可证及使用条款

请务必详细阅读DeepSeek-R1的使用条款。如有意将此模型用于商业用途或API调用，请务必确保您的应用符合相关规定，并遵守所有适用的法律法规。不仅如此，您还需要遵守模型的使用许可协议，这对于保障您的合法权益至关重要。DeepSeek郑重声明，他们将持续致力于推动人工智能技术的进步，并严格遵守相关伦理道德规范，以确保技术的健康发展。

DeepSeek坚信，开放获取高质量的模型和工具对于推动人工智能的发展至关重要。通过参与开源社区，贡献自身的知识和经验，不仅可以促进技术的创新，还能为实现通用人工智能（AGI）的宏伟目标奠定坚实的基础。