商汤AI模型性能落后于竞争对手 | AI生成和翻译
理解商汤的日日新与Riri Xin模型
自2014年起,商汤作为中国“AI四小龙”之一,始终是计算机视觉与人脸识别领域的领军者。进入生成式AI时代后,他们迅速转向SenseNova体系下的大语言模型研发。“日日新”既指其交互式AI平台,也代表模型系列——最新一代日日新6.5于2025年10月底在世界人工智能大会亮相。该系列专注多模态任务处理(文本、图像、视频),重点布局企业应用、API集成与硬件生态(如小米AI眼镜)。而“Riri Xin集成模型”则是2025年初推出的轻量化多模态大模型,主打深度推理、跨模态生成与终端设备效率优化。
这些模型旨在角逐中国白热化的AI战场,但在核心性能基准测试中确实落后于头部玩家:深度求索(DeepSeek-V3)、Kimi(月之暗面Kimi系列)与MiniMax(ABAB系列)。以2025年中期的SuperCLUE基准测试(中国大模型关键评估体系)为例,DeepSeek-V3综合得分居首(约85/100),Kimi K2达82分,MiniMax ABAB约80分,而商汤SenseNova系列(含Riri Xin集成模型)徘徊在70-75分区间,在推理与代码任务中常逊于MiniMax。类似差距也出现在MMLU、HumanEval等国际评估中,反映出商汤侧重多模态能力而非纯文本推理的战略选择。
为何落后于深度求索、Kimi和MiniMax?
这一现象源于商汤的基因传承、市场动态与外部压力:
-
从计算机视觉向大模型的转型滞后:商汤凭借感知AI(如安防技术)建立商业帝国,直至2023年才通过SenseNova全面进军生成式大模型。相较于原生大模型创业公司,其规模化进程明显延迟。深度求索(2023年创立)与月之暗面(Kimi,2023年创立)从初创即聚焦高效开源模型,在稀疏注意力等架构上快速迭代以实现低成本训练。MiniMax虽更年轻(2021年创立),但从成立之初就专注于视频生成(海螺AI)等消费级应用优化。
-
美国实体清单制裁影响:商汤因涉人权争议于2019年被列入实体清单,导致其获取先进芯片(如英伟达GPU)与美国技术受限。这严重制约了其训练规模——深度求索创新性采用国产华为昇腾芯片,Kimi与MiniMax则通过混合架构规避出口限制。最终结果:商汤模型更新速度放缓、成本攀升,性能差距逐渐拉大。
- 敏捷初创企业与传统巨头的博弈:作为港股上市企业(年营收超10亿美元),商汤主要服务银行、政府等企业客户,这使其更注重合规性与多模态解决方案,而非极限突破基准测试。反观竞争对手:
- 深度求索坚持“快速、经济、开源”策略,以低推理成本蝉联开源榜单冠军
- Kimi凭借20万token长文本推理能力比肩OpenAI o1
- MiniMax在多模态(文生视频)与能效方面表现突出,常直接超越商汤
颇具戏剧性的是,MiniMax创始人闫俊杰与周彧聪均曾任商汤深度学习工具链负责人。他们离职创立更敏捷的初创公司,反超老东家的案例,印证了人才流动如何驱动中国AI军备竞赛。
- 基准测试与市场热度循环:SuperCLUE等本土评估体系侧重推理与数学能力,恰是初创公司重点突破领域。商汤的核心优势在于集成能力(如SenseCore微调云平台),但在“前沿能力”测试中表现平平。较低的市场声量导致用户数据反馈不足,形成迭代速度的恶性循环。截至2025年10月,商汤虽占据AIGC市场约14%份额(位列前三),但这主要来自营收而非技术能力指标。
近期动态与商汤的战略布局
相较于初创公司的频繁发声(如深度求索R1模型引发的全网热议),商汤更专注于企业级与生成式AI的稳步推进:
- 2025年4月:发布SenseNova V6 Omni,自称中国“最先进”多模态模型,同步升级SenseCore 2.0基础设施以提升模型理解能力
- 2025年6月:在AI竞赛中紧随字节跳动/阿里巴巴进行模型更新,强调高性价比API服务
- 2025年8月:日日新平台接入小米AI眼镜生态,生成式AI需求(训练/推理服务)推动营收同比增长21%
- 2025年9月:分拆非核心业务单元,聚焦生成式AI战略并加速盈利进程
- 2025年10月:在世界人工智能大会展示日日新6.5与Mynie平台,多模态交互能力提升(如视频理解能力增强30%)
商汤正持续强化B2B领域布局(云服务、设备嵌入),而非消费级聊天机器人,这解释了其“低调”态势——少有声量巨大的演示,多的是扎实的企业级合作。随着制裁缓解谈判与国产芯片进展,预计2026年其技术差距有望缩小。
简言之,传统巨头的包袱使商汤在初创企业的冲刺赛中暂处下风,但其多模态战略布局更着眼于实际应用场景而非单纯基准竞赛。
ChinAI #324:SuperCLUE基准测试——2025年中盘点
商汤SenseNova基础模型跻身行业前三
中国AI独角兽全景概览
商汤业务重组聚焦生成式AI增长
商汤发布日日新6.5AI模型与Mynie平台