

OpenAI于12月发布了一项重要的模型更新,推出了新一代视觉语言模型o3,它是当前视觉语言模型o1的升级版本。o3模型代表了在图像理解方面的一项重大突破。
o3模型包含o3和o3-mini两个版本,其中o3-mini在处理复杂推理和专业学科方面表现出色,是一款精简版的视觉语言模型。OpenAI表示,o3模型在需要快速响应的应用中也能发挥作用,旨在推动通用人工智能(AGI)的发展,使机器在各种认知任务中达到甚至超越人类水平。
在ARC-AGI评估基准测试中,o3模型展现了卓越的推理能力,成功解决了大量难题,准确率高达75.7%,相比之下,之前的模型在该测试中的表现仅为87.5%。在涉及复杂编程的竞赛中,o3的解题能力也远超o1,提升了约85%。数据显示,o1模型在类似任务中的解决率仅为25%至32%,表明o3是o1的显著升级。在编程挑战平台Codeforces上,o3解决了2727道问题,而o1仅解决了1891道。
除了在既定基准上的优异表现外,OpenAI的o3模型还具备出色的代码生成能力,能够利用多种编程语言(如Python和C++)创建复杂的程序,从而扩展和定制现有代码,并根据用户的需求生成全新的程序。据悉,o3模型在代码竞赛中表现出色,能够成功解决Codeforces平台上的175个难题,而o1在面对90%的相同代码问题时会失败,GPT-4o则会失败11%。
OpenAI在1月发布了最新的o3模型。该模型在处理复杂视觉任务时展现出卓越的性能,促进了机器人技术、增强现实和各种先进人工智能应用的发展。视觉语言模型能够理解图像并生成文本,弥合了计算机视觉和自然语言处理之间的鸿沟,从而推动了人工智能技术的发展。这类模型对于优化计算机对现实世界的理解至关重要。
快讯中提到的AI工具
© 版权声明:
文章版权归作者所有,未经允许请勿转载。
本文地址:https://aidh.net/kuaixun/78m90suk暂无评论...