Light-R1 Light-R1是360智脑推出的一个开源AI模型,专注于数学领域的长思维链推理。该模型具体版本为Light-R1-32B,建立在Qwen2.5-32B-Instruct的基础上,经过与7万条数学数据和双阶段课程学习(SFT+DPO)的训练,成功超越了DeepSeek-R1-Distill-Qwen... AI工具箱8个月前