阶跃星辰发布自研轻量级推理模型Step Reasoner mini

10个月前发布AI俱乐部

摘要：

2025年1月16日，上海人工智能实验室发布了一款名为Step Reasoner mini（简称“Step R […]

2025年1月16日，上海人工智能实验室发布了一款名为Step Reasoner mini（简称“Step R-mini”）的新模型。该模型现已开源，可以通过访问https://yuewen.cn进行体验。欢迎大家通过上述链接体验“Step R-mini”的强大功能。

Step R-mini是Step推理引擎的轻量级版本，主要用于解决需要逐步推理的问题，例如数学问题和常识问题，它能够模拟人类的思考方式，逐步分解复杂的问题，从而更有效地解决问题。与直接给出答案的模型不同，Step R-mini能够展示其解决问题的推理过程，使用户能够理解其解题思路。

人工智能领域的Step推理模型在处理复杂逻辑推理和需要逐步计算的问题时表现出色。在AIME和Math等数学问题集中，Step R-mini展现了其卓越的性能，与OpenAI的o1-preview和o1-mini模型相媲美。在LiveCodeBench的基准测试中，其性能甚至超过了o1-preview。重要的是，该模型的设计初衷是为了使推理过程更加透明化，Step R-mini不仅能够给出答案，还能展示其推理的步骤和依据，通过On-Policy（在线策略）的方式进行推理，模拟“思考过程”，从而更好地解决各种难题，包括常识问题、数学问题以及复杂的编程问题，为用户提供更全面和深入的理解。

在实际应用中，Step R-mini展现出了非凡的潜力。在解决推理问题时，它的表现尤为出色。在常识推理方面，它能够进行复杂的逻辑推理，并且可以处理需要多步骤推理的编程问题，能够有效地分解编程问题，提供清晰的解决思路。例如，它可以成功解决LeetCode中被标记为“Hard”的难题，甚至能够生成高质量的代码，支持代码调试和执行。在代码生成方面，它能够分析问题，生成可靠的代码方案，涵盖数据结构、算法和编程技巧，为开发者提供有价值的参考，从而提高开发效率。通过这种逐步推理的方式，它可以帮助我们更好地理解复杂问题的本质。

总而言之，Step Reasoner mini是一款强大而有用的推理模型，它在解决复杂推理问题方面表现出色，通过展示推理过程，有助于提高模型的可解释性。其在常识推理、编程问题解决等方面的能力，使其成为人工智能领域一个有价值的工具，有望推动相关技术的发展。