傅盛称OpenAI o3发布，程序员或将“不存在”：击败99.9%程序员

OpenAI于12月发布了一项重要的模型更新，推出了新一代视觉语言模型o3，它是当前视觉语言模型o1的升级版本。o3模型代表了在图像理解方面的一项重大突破。

o3模型包含o3和o3-mini两个版本，其中o3-mini在处理复杂推理和专业学科方面表现出色，是一款精简版的视觉语言模型。OpenAI表示，o3模型在需要快速响应的应用中也能发挥作用，旨在推动通用人工智能（AGI）的发展，使机器在各种认知任务中达到甚至超越人类水平。

在ARC-AGI评估基准测试中，o3模型展现了卓越的推理能力，成功解决了大量难题，准确率高达75.7%，相比之下，之前的模型在该测试中的表现仅为87.5%。在涉及复杂编程的竞赛中，o3的解题能力也远超o1，提升了约85%。数据显示，o1模型在类似任务中的解决率仅为25%至32%，表明o3是o1的显著升级。在编程挑战平台Codeforces上，o3解决了2727道问题，而o1仅解决了1891道。

除了在既定基准上的优异表现外，OpenAI的o3模型还具备出色的代码生成能力，能够利用多种编程语言（如Python和C++）创建复杂的程序，从而扩展和定制现有代码，并根据用户的需求生成全新的程序。据悉，o3模型在代码竞赛中表现出色，能够成功解决Codeforces平台上的175个难题，而o1在面对90%的相同代码问题时会失败，GPT-4o则会失败11%。

OpenAI在1月发布了最新的o3模型。该模型在处理复杂视觉任务时展现出卓越的性能，促进了机器人技术、增强现实和各种先进人工智能应用的发展。视觉语言模型能够理解图像并生成文本，弥合了计算机视觉和自然语言处理之间的鸿沟，从而推动了人工智能技术的发展。这类模型对于优化计算机对现实世界的理解至关重要。