1月30日讯 1 月 29 日,商汤宣布开源多模态自主推理模型 SenseNova-MARS(8B/32B 双版本)。据商汤介绍,该模型是首个支持动态视觉推理和图文搜索深度融合的 Agentic VLM 模型。
根据官方介绍,其在多模态搜索与推理的核心基准测试中以 69.74 分超越 Gemini-3-Pro(69.06 分)、GPT-5.2(67.64 分)。
SenseNova-MARS 是首个支持动态视觉推理和图文搜索深度融合的 Agentic VLM 模型,能自己规划步骤、调用工具,轻松搞定各种复杂任务,让 AI 真正具备“执行能力”。
在 MMSearch、HR-MMSearch、FVQA、InfoSeek、SimpleVQA、LiveVQA 等基准测试中,SenseNova-MARS 取得开源模型中的 SOTA 成绩,还超越 Gemini-3.0-Pro、GPT-5.2 等顶级闭源模型。
有关地址如下:
模型仓库:
- 32B:https://huggingface.co/sensenova/SenseNova-MARS-32B
- 8B:https://huggingface.co/sensenova/SenseNova-MARS-8B






