

近日,DeepMind 公布了其最新的 AI 系统——AlphaGeometry2,它在解决国际数学奥林匹克竞赛(IMO)级别的几何问题上取得了显著进展,展现出卓越的推理能力。AlphaGeometry2 是 DeepMind 在先前版本 AlphaGeometry 的基础上改进而来,性能有了质的飞跃,在限定时间内能够解决 25 道 IMO 试题中的 84%。
那么,DeepMind 究竟是如何实现这一数学领域的突破的呢?关键在于,它能够像人类一样进行几何推理,而这正是 AI 领域长期以来的一大挑战,尤其是在涉及复杂几何图形的问题上。通过结合神经推理和符号推理,DeepMind 构建了一个能够自主解决复杂几何问题的 AI 系统。
具体来说,DeepMind 引入了一种名为 AlphaProof 的新模型,它与 AlphaGeometry2 协同工作,共同参与 2024 年 IMO 的自动化推理挑战,用于解决高难度的几何问题。在解决几何问题时,该模型能够更有效地探索几何关系和证明策略,显著提升问题求解的效率。
AlphaGeometry2 的卓越性能主要归功于其对 Gemini 模型中的推理能力的巧妙运用和整合。Gemini 模型能运用其强大的几何知识来辅助解决复杂的几何问题,为解决难题提供了有力的支持。具体而言,Gemini 模型能够识别几何图形中的关键信息(如角度、长度等)并将其转化为可用于推理的符号表示,从而帮助 AlphaGeometry2 更有效地进行几何证明。
值得一提的是,AlphaGeometry2 在解决 IMO 的 50 道几何试题中成功解决了 42 道,超越了以往任何 AI 系统,展现出强大的解题能力,涉及各种复杂的几何概念和定理。此外,在一个更具挑战性的测试中,AlphaGeometry2 成功解决了 29 道难题中的 20 道。
这些结果表明 AI 系统在解决复杂推理问题方面具有巨大的潜力,AlphaGeometry2 的成功在于它能够有效地将神经推理与符号推理相结合,实现了对几何问题更深层次的理解和解决。DeepMind 的这一创新,有望推动人工智能在更多需要复杂推理能力的领域取得突破性进展,尤其是在科学研究领域。