

OpenAI最近发布了一款名为o3-mini的开源语言模型,其性能据称能够与先进的DeepSeek-R1模型相媲美。此举被视为OpenAI在开源领域迈出的重要一步。
据悉,OpenAI采用了“思维链”(Chain of Thought,CoT)技术来提升模型的推理能力。通过这种方式,DeepSeek-R1在特定语言模型基准测试中表现出色,甚至超越了OpenAI的同类产品。据了解,o3-mini在某些方面也展现出了类似的性能水平。
在具体参数方面,OpenAI似乎正在尝试不同的策略。o3-mini的训练数据集相对较小,仅为4.40亿个token,而初代o1模型的训练数据则达到了60亿个token。相比之下,DeepSeek-R1使用的token数量则介于70亿到80亿之间。因此,o3-mini在数据效率方面表现突出。
从实际应用角度来看,o3-mini的开源特性有助于推动语言模型技术的普及。开发人员可以更轻松地获取和使用该模型,从而加速相关应用和产品的创新。
OpenAI CEO Sam Altman曾公开表示对模型“大小之争”的质疑。而DeepSeek-R1的出色表现表明,OpenAI可能会重新评估其在模型研发方面的侧重点。
快讯中提到的AI工具
© 版权声明:
文章版权归作者所有,未经允许请勿转载。
本文地址:https://aidh.net/kuaixun/9q47n61h暂无评论...