OpenAI为应对DeepSeek挑战,公开o3-mini模型推理过程。

1个月前发布AI俱乐部
3 0 0
OpenAI为应对DeepSeek挑战,公开o3-mini模型推理过程。的封面图

OpenAI最近发布了一款名为o3-mini的开源语言模型,其性能据称能够与先进的DeepSeek-R1模型相媲美。此举被视为OpenAI在开源领域迈出的重要一步。

据悉,OpenAI采用了“思维链”(Chain of Thought,CoT)技术来提升模型的推理能力。通过这种方式,DeepSeek-R1在特定语言模型基准测试中表现出色,甚至超越了OpenAI的同类产品。据了解,o3-mini在某些方面也展现出了类似的性能水平。

在具体参数方面,OpenAI似乎正在尝试不同的策略。o3-mini的训练数据集相对较小,仅为4.40亿个token,而初代o1模型的训练数据则达到了60亿个token。相比之下,DeepSeek-R1使用的token数量则介于70亿到80亿之间。因此,o3-mini在数据效率方面表现突出。

从实际应用角度来看,o3-mini的开源特性有助于推动语言模型技术的普及。开发人员可以更轻松地获取和使用该模型,从而加速相关应用和产品的创新。

OpenAI CEO Sam Altman曾公开表示对模型“大小之争”的质疑。而DeepSeek-R1的出色表现表明,OpenAI可能会重新评估其在模型研发方面的侧重点。

快讯中提到的AI工具

DeepSeek
DeepSeek

深度求索:引领未来人工智能技术的探索与创新

OpenAI
OpenAI

致力于创造对全人类有益的安全 AGI

© 版权声明:
本文地址:https://aidh.net/kuaixun/9q47n61h

暂无评论

none
暂无评论...