商汤科技于11月10日发布并开源了SenseNova-SI系列模型,受到业界广泛关注。该模型在空间理解和推理能力方面表现卓越,超越了包括GPT-5和Gemini 2.5 Pro在内的顶尖闭源模型。SenseNova-SI分为2B和8B两个规格,在多个空间智能基准测试中表现优异,特别是SenseNova-SI-8B在四项基本评测中获得60.99的平均分,远超其他同类模型。这一突破回应了大模型在空间结构理解上的短板,彰显了商汤科技在人工智能领域的技术实力与创新。

商汤科技于11月10日宣布发布并开源其SenseNova-SI系列模型,这一创新举措在业界引起了广泛关注。官方表示,SenseNova-SI在多项权威评测中展示了卓越的空间理解和推理能力,不仅在同类开源多模态大模型中遥遥领先,更超越了国际顶尖闭源模型如GPT-5和Gemini 2.5 Pro。这样的突破不仅体现了商汤科技在空间智能领域的前瞻性探索,也为行业发展注入了新的活力。
当前,虽然许多大模型在知识获取、写作、推理和编程等领域表现不俗,但普遍存在对空间结构理解和推理的短板。空间智能的提升恰恰是具身智能体与外部世界互动的关键能力。商汤科技的SenseNova-SI系列模型在这一领域的创新,正是对这一短板的有力回应。
此次开源的SenseNova-SI系列模型分为2B和8B两个规格。官方提供的评测数据显示,SenseNova-SI在多个空间智能基准测试(如VSI、MMSI、MindCube、ViewSpatial)中表现优异。其中,SenseNova-SI-8B模型在四个基本评测中获得了60.99的平均成绩,远超Qwen3-VL-8B(40.16)、BAGEL-7B(35.01)等开源模型,以及SpatialMLLM(35.05)、ViLaSR-7B(36.41)等专注于空间智能的模型。更重要的是,SenseNova-SI-8B以相对轻量的设计成功超越了顶级闭源模型如GPT-5(49.68)和Gemini-2.5-Pro(48.81),这标志着其在空间智能领域取得了质的飞跃,而非简单的性能提升。
在具体的空间智能任务中,SenseNova-SI-8B的表现进一步证明了其强大的推理能力。例如,在立方体组合图形问题中,SenseNova-SI-8B选择了正确的俯视图,而GPT-5则未能做到。在多车道道路场景的判断中,SenseNova-SI-8B同样表现出色,准确判断了黄色汽车的转向,而GPT-5则选择了错误的答案。这些实例不仅展示了模型的智能化水平,也彰显了商汤科技在人工智能领域的技术实力和创新精神。
总的来说,SenseNova-SI的发布不仅为空间智能的发展提供了新的可能性,也为整个行业带来了积极的信号。随着技术的不断进步,我们有理由相信,未来将会有更多的智能应用涌现,为人类生活带来更多的便利和创新。商汤科技的这一举措,必将激励更多企业和研究者在人工智能的道路上不断探索和前行。











