AlphaEvolve是由陶哲轩与DeepMind工程师共同开发的数学创新工具,展现了在组合数学、几何、数学分析和数论等领域的巨大潜力。研究表明,AlphaEvolve在可扩展性、鲁棒性和可解释性方面优于传统工具,能够自主发现新数学结构,并在某些问题上超越人类最佳结果。在67个测试问题中,AlphaEvolve成功复现了多个已知最优解,并为研究者提供了新的启发。该系统高效处理复杂问题,具备出色的泛化能力,展示了AI与人类合作在数学研究中的巨大潜力。

AlphaEvolve:数学创新的全新助手
近日,陶哲轩再次向我们推荐了AlphaEvolve这一令人振奋的工具。他与DeepMind的高级工程师Bogdan Georgiev等人共同撰写的一篇新论文,指出了AlphaEvolve在数学发现方面的巨大潜力与应用价值。
具体而言,他们利用AlphaEvolve探索了67个数学问题,涉及组合数学、几何、数学分析和数论等多个领域。研究结果显示,AlphaEvolve在可扩展性、鲁棒性和可解释性方面均超越了传统工具。更为重要的是,AlphaEvolve已经能够自主发现新颖的数学结构,并在某些问题上超越了人类已知的最佳结果。
在这67个测试问题中,AlphaEvolve不仅成功复现了多个已知的最优解,更展现了其独特的发现能力。其中一个显著成就是,它能够自主发掘人类未曾涉足的新数学构造。例如,在处理Nikodym集问题时,虽然系统生成的初步构造尚未达到最优,但却为人类研究者提供了一个极具启发性的“直觉跳板”。基于AI提供的结构,研究人员通过进一步的简化和推演,最终找到了更优的构造,改进了已知的上界。这一人机协作的成果将作为一篇独立的数学论文发表,彰显了人类与AI合作的巨大潜力。
同样,在算术Kakeya猜想的研究中,AlphaEvolve也展现了其卓越的能力。系统不仅将一个已知的下界从1.61226提升至1.668,还构造的解(与离散高斯分布形态相似)启发了人类数学家建立新的渐近关系,相关成果也即将发表。这种启发人类研究的能力,与AlphaEvolve输出结果的可解释性密切相关。系统在大多数情况下生成的是结构清晰的程序代码,而非晦涩难懂的黑箱结果,使得人类专家能够轻松分析、归纳其发现的模式,并提炼出通用的数学公式。
积木堆叠问题便是这一特性的重要体现。在这一问题中,系统最初生成了一个逻辑正确的递归程序来计算积木的放置。经过演化,系统内部的语言模型分析了这段代码的逻辑,并自主将其重构为一个更简洁、高效的显式程序。最终程序清晰地揭示了最优解与谐波数之间的数学关系,与人类已知的理论公式完全一致,展示了系统从复杂解法中提炼数学本质的能力。
除了方案的清晰性,AlphaEvolve在不同类型的问题设置下也表现出了强大的鲁棒性。它能够有效处理高维参数空间、复杂的几何约束以及基于蒙特卡洛模拟的近似评分函数。例如,在最小三角形密度问题中,研究人员最初设计了一个简单的评分函数,但系统很快利用了该问题空间的非凸性,获得了超越理论最优的不可能分数。为了解决这一问题,研究人员设计了一个基于利普希茨连续性的新评分函数。切换到这个更复杂的评分函数后,AlphaEvolve迅速收敛到了已知的正确理论最优解。
AlphaEvolve同样具备出色的泛化能力。在针对IMO 2025的第6题时,研究人员仅在输入n为完全平方数时对系统进行评分。这种“信息限制”反而促使AlphaEvolve去寻找稀疏实例背后的共同结构模式,而非对每个n进行“过拟合”。最终,系统成功发现并输出了在所有完全平方数n上均达到最优的通用构造,展现了其归纳能力。
在实际应用中,AlphaEvolve的效率极高,仅需少量高质量提示即可驱动。研究表明,来自领域专家的提示往往能显著提升最终构造的质量,显示出系统对人类输入的高度敏感性。同时,该系统在架构上支持并行化,允许研究人员在多个问题实例或同一问题的不同参数设置上同时进行探索,并能自动迁移成功的搜索策略,这在处理多参数的几何问题时尤为高效。
AlphaEvolve并非一个单一流程的系统,而是通过不同“工作模式”适应不同类型的数学探索任务。该系统主要在“搜索模式”和“泛化模式”下运行。“搜索模式”旨在高效发现最优的数学构造,而“泛化模式”则更具挑战性,目标是让AlphaEvolve编写一个能够解决任意给定参数n的问题的通用程序。
总之,AlphaEvolve展示了AI引导的演化搜索如何为数学研究提供全新的视角与方法。它不仅增强了人类的直觉,还为数学发现开辟了新的道路,充分展现了科技与人类智慧结合的美好前景。
论文地址:
查看论文











