

OpenAI震撼发布!他们推出了名为GPT-4o mini的新模型,声称其具备“大师级智能”的轻量化版本。这并非仅仅是又一个模型,而是智能领域的一次飞跃。据悉,我们可以期待GPT-4o mini在“性能表现”上有所突破。
以下是详细信息:
OpenAI的创新团队表示,GPT-4o mini是该系列中又一里程碑式的成果。该模型不仅仅是缩小版,而是在保证核心能力的基础上进行了优化。它在特定任务上的速度令人惊叹,能够以极快的速度处理文本信息,某些情况下甚至比GPT-3.5 Turbo快60%。
GPT-4o mini的设计目标是兼顾效率和智能,确保在计算资源受限的环境中也能实现卓越性能,例如通过API调用、在资源有限的设备上运行应用程序,以及支持大规模数据处理任务。
不仅如此,GPT-4o mini还优化了文本理解和生成能力,能够处理更长的文本序列,有效管理高达128K tokens的上下文窗口,同时支持16K tokens的音频上下文处理,这些改进都基于2023年10月的数据。与GPT-4相比,此次更新在成本效益上实现了显著提升,降低了企业在人工智能应用方面的运营成本。
性能优势,一览无遗:
GPT-4o mini旨在超越GPT-3.5 Turbo和其他轻量级模型,它在多种智能基准测试中展现出卓越的性能,尤其在文本和代码处理方面。通过对GPT-4o的知识进行提炼,使其能够在各种复杂任务中表现出色,例如实现高级推理、创建复杂的代码以及应对多语言环境等,而这些通常是GPT-3.5Turbo难以胜任的。
在各项性能指标上,GPT-4o mini的表现如下:
-
常识推理:在处理日常情境和推理问题时,GPT-4o mini展现出强大的能力,得分高达82.0%,优于Gemini Flash的77.9%和Claude Haiku的73.8%。
-
数学和编程能力:GPT-4o mini在数学问题解决和代码生成方面同样表现出色。在MGSM(数学常识推理)基准测试中,得分达到87.0%,超过Gemini Flash的75.5%和Claude Haiku的71.7%;在HumanEval(代码生成能力)测试中,得分达到87.2%,同样优于Gemini Flash的71.5%和Claude Haiku的75.9%。
-
多模态理解:在处理包含图像和文本的多模态输入时,GPT-4o mini的表现也相当出色。在MMMU(多模态理解和推理基准)测试中,得分达到59.4%,高于Gemini Flash的56.1%和Claude Haiku的50.2%。
安全性考虑:
安全措施一直是OpenAI模型开发的核心。通过全面的安全评估,OpenAI致力于减少模型产生有害内容的可能性,同时确保在实际应用中对齐人类价值观。通过结合监督学习和人类反馈,OpenAI不断改进模型,使其输出结果更加准确和有用。此外,GPT-4o mini还采用了多层安全协议,以应对潜在的滥用风险,确保其安全可靠。
GPT-4o mini的安全性能得益于GPT-4o所采用的安全措施,OpenAI在设计之初就考虑到了潜在的风险,包括恶意使用和生成不当内容等,并采取了相应的防护措施。通过利用超过70个红队成员的专业知识,他们对GPT-4o进行了全面的风险评估,并针对性地强化了安全措施,确保了GPT-4o及其衍生产品在实际应用中的安全性和可靠性。
定价与可用性
GPT-4o mini的价格极具竞争力,通过API、Azure OpenAI服务和各种API接口均可访问。其定价策略为1M tokens输入15美元,1M tokens输出60美元(相当于处理约2500页文本)。OpenAI旨在通过经济高效的定价策略,鼓励开发者广泛采用GPT-4o mini。
在ChatGPT中,Plus和团队订阅用户现在可以体验GPT-4o mini,以及GPT-3.5。其他订阅者也将在不久的将来获得体验机会,这表明OpenAI致力于将先进的AI技术普及到更广泛的用户群体。
官方声明
OpenAI官方强调:“在人工智能领域,我们始终致力于推动创新,同时确保技术进步能够切实惠及每个人。相比2022年发布的text-davinci-003模型,GPT-4o mini的效率提升了99%。我们始终致力于实现全面的可访问性,并持续推进人工智能技术的安全应用。”
“我们的目标是通过人工智能技术的创新应用,为各行各业赋能,从而有效提升生产力、激发创新力并促进社会进步。GPT-4o mini不仅经济高效,而且功能强大,为人工智能应用带来了前所未有的灵活性。人工智能技术的进步应服务于全人类,我们坚信,通过共同努力,定能确保人工智能技术的发展与应用能够切实增进福祉。”
快讯中提到的AI工具

由Anthropic公司开发的下一代人工智能AI助手

OpenAI 推出的最新小型模型

OpenAI 最新的旗舰模型

OpenAI 发布的最新一代语言模型

致力于创造对全人类有益的安全 AGI

OpenAI开发的一款先进AI聊天机器人