商汤8B模型强势逆袭!空间智能完胜GPT-5,AI看懂世界的革命性突破!

6天前发布AI工具集
0 0 0
摘要:

商汤科技于11月11日发布并开源了SenseNova-SI系列空间智能大模型,包括2B和8B版本。SenseNova-SI-8B在多个基准测试中表现卓越,平均得分为60.99,领先于同级别的通用模型和空间理解模型,超越GPT-5和Gemini-2.5-Pro。商汤的成功源于系统性训练设计,构建了“空间能力分类体系”,并首次验证了“尺度效应”。该模型在空间理解与推理方面表现稳定,推动了空间智能的发展,助力未来自动驾驶和机器人等应用。商汤还开源了空间智能测评平台EASI,推动开源生态合作。

商汤8B模型强势逆袭!空间智能完胜GPT-5,AI看懂世界的革命性突破!的封面图

商汤发布开源SenseNova-SI系列空间智能大模型

商汤科技于11月11日正式推出并开源了SenseNova-SI系列空间智能大模型,涵盖了2B和8B两个版本。这一系列模型在多个空间智能基准测试中展现了卓越的性能,尤其是SenseNova-SI-8B模型,其在VSI-Bench、MMSI-Bench、MindCube-Tiny和ViewSpatial四个核心任务上取得了60.99的平均成绩,显著领先于同级别的开源通用模型,如Qwen3-VL-8B(40.16)和BAGEL-7B(35.01),以及专注于空间理解的模型SpatialMLLM(35.05)和ViLaSR-7B(36.41)。

更为引人注目的是,尽管保持8B参数规模,SenseNova-SI-8B的平均成绩已超越GPT-5(49.68)和Gemini-2.5-Pro(48.81)。这种卓越的性能体现了商汤在空间智能领域的深厚技术积累。

此次性能的飞跃,离不开商汤在训练机制上的系统性设计。研究团队构建了“空间能力分类体系”,并扩展了空间理解的数据规模,首次在该领域验证了“尺度效应”的存在。这一技术突破有效回应了当前多模态大模型面临的核心挑战之一,即空间智能的短板尚未完全克服。尽管现有大模型在语言、代码和逻辑推理等任务上表现良好,但在需要空间理解的场景中,仍然容易出现错误。

例如,虽然GPT-5能够解答复杂的图形逻辑题,但在处理立方体俯视图这类空间问题时却常常出现明显的失误。这类题目对人类儿童来说通常是直观判断,但却依然难倒了顶级模型。

SenseNova-SI的构建与训练专注于空间理解,其开源也为大模型在空间智能方向的能力优化提供了新的样本。商汤的性能提升并不是简单的单点优化,而是基于系统训练范式的整体进化。商汤团队将空间智能划分为六大核心维度:空间测量、空间重构、空间关系、视角转换、空间形变与空间推理。

在训练数据层面,商汤团队整合了多模态感知和视觉模型等领域的积累,系统地扩展了空间理解数据规模,并首次在空间智能领域验证了“尺度效应”——随着数据量与质量的持续增长,模型的空间认知能力将同步增强。这一方法具有通用性,能够支持多种基座模型(如InternVL)进行空间能力的增强迁移。商汤团队表示,后续将发布完整的技术报告,进一步阐述具体的技术方案。

在SITE-Bench和MindCube两大空间智能基准测试中,商汤研究团队选取了六道典型题目,涵盖俯视图判断、视角转换、物体方位与移动方向推理等任务,分别对GPT-5与SenseNova-SI-8B进行了测试。从结果来看,GPT-5在多项题目中出现了误判,而SenseNova-SI-8B则持续给出正确答案,展现出更为稳定的空间理解能力。

这组题目覆盖了空间智能的多个关键维度,结果显示SenseNova-SI在空间理解与推理方面的表现更加稳定。SenseNova-SI的推出,也是商汤整体空间智能战略的重要组成部分。今年7月,商汤发布了“悟能”具身智能平台,提出以“开悟”世界模型为核心,推动机器人在物理世界中的自主理解与适应能力。SenseNova-SI作为空间能力组件,将进一步增强模型在三维结构认知方面的基础能力。

与此同时,商汤还同步开源了空间智能测评平台EASI及其“英雄榜”,旨在统一测评口径、展示模型进展并推动开源生态合作。当前,人工智能在语言、知识与逻辑推理方面已有扎实的积累,但对三维空间的理解、感知与推理能力仍是其通向物理世界的重要挑战之一。

空间智能作为支撑具身智能与世界模型发展的核心能力,正逐渐成为衡量下一阶段AI模型“真实世界理解力”的重要指标。相关能力的持续构建,将为自动驾驶、机器人等实际应用提供更为坚实的基础。这一进步不仅激励了技术的发展,也为我们带来了无限的可能,展现了科技改变未来的美好愿景。

© 版权声明:
本文地址:https://aidh.net/kuaixun/2fhh1qkq

暂无评论

none
暂无评论...