

大型语言模型(LLM),以GPT为代表,已经成为人工智能领域的重要组成部分,在语言理解、生成和执行复杂推理任务方面展现出卓越的能力,并在众多实际应用中取得了显著成果。它代表着当前人工智能技术发展的一个重要里程碑。
然而,我们需要认识到,当前大型语言模型的应用仍然面临着一些挑战,其中最主要的问题是,它们在执行推理时仍然依赖于特定的提示词,这与AI追求自主生成解决复杂问题的通用能力有所差距。如何让AI摆脱对特定提示的依赖,真正实现通用智能,是当前领域面临的关键挑战。
为了使人工智能能够更有效地解决现实世界的复杂问题,研究人员正在积极探索如何让AI模型摆脱对特定指令的依赖,实现自主地进行推理和决策,从而提高其解决问题的效率。
为此,一种新兴的研究方向正在兴起,旨在训练大型推理模型(LTM),使其具备利用外部工具和资源,执行多步骤推理过程的能力。LTM不再仅仅依赖于自身存储的知识,而是能够主动探索和利用各种外部信息,从而拓展其问题解决能力。
LTM是实现AI通用智能的关键。通过让模型主动探索和利用外部资源,有望实现各种复杂推理任务,而不再需要依赖于特定的提示。
LTM的关键目标是扩展现实世界复杂推理任务的能力,使其能够利用各种领域知识和数据,而不是单纯依赖于自身的记忆。这样的模型可以实现更广泛的应用,解决更为复杂的问题,这是当前AI发展的重要方向。
例如,在涉及到复杂计算的情况下,模型可以调用计算器等工具,保证计算的准确性,并且能够通过互联网查询相关信息,获取最新的知识,这不再仅是AI的愿景,而是正在逐步变为现实的创新。
现有研究表明,模型可以在复杂的推理链中集成工具使用和知识检索,从而使其能够执行那些仅仅依靠自身无法完成的推理任务。
进一步扩展模型能力的方法之一是通过利用检索增强生成和工具使用的组合,从而为LTM的性能带来提升。 Omne模型通过GAIA基准测试得以验证,它能够在没有人类干预的情况下,自主完成复杂推理任务,为AI的未来发展提供了新的可能。
总而言之,工具使用是AI通用智能的重要组成部分,它使得AI模型能够更好地解决现实世界的复杂问题,并为未来的创新应用奠定了基础。
更多信息:https://arxiv.org/pdf/2410.15665