2025年9月中国顶尖大语言模型榜单

2025年9月中国顶尖大语言模型榜单 | AI生成和翻译

Home 2025.09

以下是截至2025年9月中国顶尖大语言模型的最新概况，基于最新报告和基准测试。不进行表格对比——仅以清晰的叙述方式呈现，便于阅读：

2025年9月领先的中国大语言模型

1. DeepSeek-V3 / R1

DeepSeek-V3（混合专家设计，约2500亿参数）在保证计算效率的同时提供顶级性能。（Second Talent, Index.dev）
DeepSeek-R1，其高性价比的开源版本，因在推理和重推理任务上以极小预算超越西方同类模型而引发全球关注。（The Guardian, TIME, The Sun）

2. Qwen系列（阿里巴巴云）

Qwen 3（稠密和稀疏变体，参数高达2350亿，支持128K令牌上下文窗口）于2025年中发布，采用Apache-2.0许可。（Wikipedia）
全球排名极高——在基准测试中击败了许多西方模型。（Wikipedia, TechWire Asia）

3. Kimi K2（Moonshot AI）

Kimi K2，于2025年7月发布，是一个万亿参数的MoE模型（激活参数量为320亿），提供开放权重并采用修改后的MIT许可。（Wikipedia）
跻身全球顶级模型之列；被技术观察者提及并列入广泛使用的开放权重模型。（Simon Willison’s Weblog, Wikipedia）

4. GLM-4.5 / GLM-4.5V（智谱AI / Z.ai）

GLM-4.5（在常见基准测试中达到SOTA）于2025年中发布；GLM-4.5V，一个1060亿参数的视觉语言模型，于2025年8月发布。（Wikipedia）
GLM-4.5现被定位为Claude的一个可靠且高性价比的替代品，尤其在中国市场。（Reuters）

5. Ernie X1 和 Ernie 4.5（百度）

Ernie X1，一个专注于推理的模型，以及Ernie 4.5，一个以远低于GPT-4.5的成本实现超越的多模态模型——两者均于2025年初推出，并计划在6月前开源。（Business Insider, Wikipedia）

6. Yi（01.AI）

Yi-34B 早期即被公认为全球顶级的预训练基础LLM之一。（Wikipedia）
Yi-Coder（支持高达128K令牌的上下文长度）和 Yi-Lightning 针对编码和效率进行了优化。（Wikipedia）

7. Wu Dao 3.0, GLM-4 Plus (ChatGLM), Doubao 1.5 Pro, Kimi k1.5

属于前代模型，但在特定用例中仍然相关：
- Wu Dao 3.0
- ChatGLM (GLM-4 Plus)
- Doubao 1.5 Pro
- Kimi k1.5 所有这些模型都被认为是强大的开源先驱，具有良好的多语言和推理能力。（Index.dev）

8. dots.llm1 (Rednote / 小红书)

2025年的新晋者，作为开源模型发布，在编码任务上表现与阿里巴巴的Qwen 2.5相当——但落后于DeepSeek-V3。（Reuters）

简要总结（叙述风格）

DeepSeek-V3 / R1：在性能和性价比上均名列前茅。
Qwen 3：阿里巴巴主导基准测试的旗舰开源模型系列。
Kimi K2：Moonshot AI推出的MoE架构、万亿参数、开放许可的主力模型。
GLM-4.5 / 4.5V (智谱AI/Z.ai)：在基准测试中达到SOTA，并对Claude用户迁移具有吸引力。
百度的Ernie X1 & 4.5：性能高效且具有竞争力的模型，即将开源。
Yi系列 (01.AI)：高效、长上下文且编码能力强大的模型。
早期模型 (Wu Dao, ChatGLM等)：仍在特定场景中发挥重要作用。
dots.llm1：来自社交媒体平台的新兴、值得关注的开源模型。

为何这很重要

2025年中国的AI领域以高性能、开放性和成本效益为特征。像DeepSeek和Kimi这样的模型在保持高精度的同时，价格上低于西方巨头；阿里巴巴的Qwen系列持续设定基准；智谱AI和百度正日益开放其创新成果。随着中国开发者和政府战略聚焦于广泛的国内应用和全球竞争力，向开放模型的转变正在加速。（wsj.com, Reuters, Business Insider）

Back Donate