OpenAI为应对DeepSeek挑战，公开o3-mini模型推理过程。

摘要：

OpenAI最近发布了一款名为o3-mini的开源语言模型，其性能据称能够与先进的DeepSeek-R1模型相 […]

OpenAI最近发布了一款名为o3-mini的开源语言模型，其性能据称能够与先进的DeepSeek-R1模型相媲美。此举被视为OpenAI在开源领域迈出的重要一步。

据悉，OpenAI采用了“思维链”（Chain of Thought，CoT）技术来提升模型的推理能力。通过这种方式，DeepSeek-R1在特定语言模型基准测试中表现出色，甚至超越了OpenAI的同类产品。据了解，o3-mini在某些方面也展现出了类似的性能水平。

在具体参数方面，OpenAI似乎正在尝试不同的策略。o3-mini的训练数据集相对较小，仅为4.40亿个token，而初代o1模型的训练数据则达到了60亿个token。相比之下，DeepSeek-R1使用的token数量则介于70亿到80亿之间。因此，o3-mini在数据效率方面表现突出。

从实际应用角度来看，o3-mini的开源特性有助于推动语言模型技术的普及。开发人员可以更轻松地获取和使用该模型，从而加速相关应用和产品的创新。

OpenAI CEO Sam Altman曾公开表示对模型“大小之争”的质疑。而DeepSeek-R1的出色表现表明，OpenAI可能会重新评估其在模型研发方面的侧重点。

快讯中提到的AI工具

DeepSeek

深度求索：引领未来人工智能技术的探索与创新

OpenAI

致力于创造对全人类有益的安全 AGI

文章版权归作者所有，未经允许请勿转载。

本文地址：https://aidh.net/kuaixun/9q47n61h