
OpenAI 首席执行官萨姆·奥尔特曼于当地时间 2 月 17 日在 X 平台发文,向公众征询关于公司下一开源项目方向的意见。他提出了两种潜在的开源模型方向:一是“相当小但仍需在 GPU 上运行的 o3-mini 级模型”,二是“尽可能优化的手机大小模型”。此举或预示着 OpenAI 即将开源新的大型模型,这也将是继 2019 年 OpenAI 开源 GPT-2 之后的又一次重大开源举措。

据 AI 工具库观察,奥尔特曼在 1 月 31 日 Reddit 的“问我任何事”活动中,当被问及 OpenAI 是否会公开部分 AI 模型技术并发布更多系统工作原理的研究时,他表示公司内部正在讨论这种可能性,并反思了 OpenAI 过去在开源方面的立场。他坦言,OpenAI 此前在开源策略上可能“站在了历史的错误一边”,并表示需要制定不同的开源策略。但他同时指出,公司内部并非所有人都对此观点表示赞同。
OpenAI 成立于 2015 年,最初曾承诺在符合公众利益的前提下公开其模型的研究和数据。然而,出于竞争压力以及对信息披露可能引发的安全风险的担忧,该公司后来转向了专有模型的开发。
近期人工智能科技行业的新动向,似乎促使 OpenAI 重新评估其开源策略。DeepSeek 的异军突起,凭借其低成本和开源模式迅速吸引了大量用户。其大型模型 DeepSeek-R1 仅用两个月时间完成训练,成本仅为 550 万美元,相较之下,OpenAI 等公司的同类项目成本要高出许多。自 ChatGPT 于 2022 年底问世以来,许多人工智能公司为了保持竞争力,选择不公开过多的技术细节。然而,随着 DeepSeek 等开源技术的兴起,部分开发者和客户可能会转向更具性价比的开源解决方案。
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关AI热点
暂无评论...