OpenAI o3 模型查询费用高昂，单次竟达 1000 美元！

11个月前发布AI俱乐部

摘要：

OpenAI近来发布了其名为o3AI的新一代模型，旨在提升人工智能领域中常见的推理能力，据称，该模型已成功通过 […]

OpenAI近来发布了其名为o3AI的新一代模型，旨在提升人工智能领域中常见的推理能力，据称，该模型已成功通过了一项包含1000道题目的基准测试。

根据TechCrunch的报道，OpenAI早在几个月前就已开始着手训练这一新型AI模型，并将其定位为“推理优化”的版本，专注于提升在解决涉及复杂抽象推理的任务时的表现，这些任务往往需要综合运用各种不同的认知能力。据悉，OpenAI的目标是使其能够胜任此前被认为对AI而言具有挑战性的任务。

根据ARC-AGI推理基准的创建者François Chollet的说法，o3在通过该基准测试时，准确率达到了87.5%，相较之下，o1模型的准确率仅为32%。值得注意的是，o3在专门为考察此类能力而设计的测试中表现尤为出色。总的来说，这项基准旨在评估模型在面对全新挑战时的泛化能力。为了达到通过该基准的要求，o3需要成功解决超过1000道推理题，而此前的模型仅能勉强通过4道题。

值得一提的是，o3模型在理解问题和有效利用其已有的能力方面都得到了显著提升。一方面，o3模型能够更准确地理解人类提出的指令，另一方面，它也能够更有效地调用相关的知识和算法，从而更好地完成任务。此外，o3的性能还受益于一种被称为“过程”的新型训练方法，在这种方法中，模型能够学习如何根据给定的步骤来解决问题，从而提升其推理能力。通过这种方式，它可以更有效地处理复杂的推理任务，并取得更好的结果。据称，o3的推理能力现在已经超过了人类的水平，达到了一个全新的高度。

如果想了解关于o3模型的更多信息，请访问OpenAI官方网站以获取更多详细资料。同时，也可通过关注相关的新闻报道来了解o3模型在实际应用中的最新进展。

要点总结：

✨ o3AI 是一种新型AI模型，旨在提升推理能力，并在基准测试中成功解决了1000道题目，展现出强大的实力。

💡 在 ARC-AGI 基准测试中，o3 的准确率达到了 87.5%，远超 o1 模型的表现。

🔍 据称 o3 已经具备超越人类水平的推理能力，标志着人工智能领域取得了新的突破。