新兴人工智能企业及其模型

新兴人工智能企业及其模型 | AI生成和翻译

Home 2025.09

除了 OpenAI、Anthropic、Google 和 xAI 之外，多家新兴人工智能公司也正在其大型语言模型方面取得重大进展。以下是一些值得关注的参与者概览：

DeepSeek (中国)

模型: DeepSeek-V3, R1, R2
亮点:
- DeepSeek-V3 于 2024 年底推出，拥有 6710 亿参数，在推理任务上表现出色，在某些基准测试中超越了 GPT-4o 等模型。
- 公司强调高性价比的 AI 开发，使用更少的 GPU，并以西方同行成本的一小部分实现了高性能。
- DeepSeek 的模型在中国正获得关注，并正在全球范围内扩大其影响力。
近期发展:
- DeepSeek 计划在 2025 年底前发布一款新的 AI 智能体，旨在与 OpenAI 的产品竞争。(彭博社)

Z.ai (前身为智谱AI)

模型: GLM-4.5
亮点:
- GLM-4.5 是一个专为智能体应用设计的开源模型，具备推理、编码和任务分解能力。
- 该模型支持本地部署和 API 访问，使其适用于各种应用场景。
近期发展:
- Z.ai 已完成品牌重塑，并积极推广 GLM-4.5 作为 Anthropic 的 Claude 等模型的具有成本效益的替代品，提供有竞争力的定价和性能。(路透社)

Mistral AI

模型: Magistral (小尺寸和中尺寸), Voxtral, Devstral
亮点:
- Mistral 专注于开源模型，特别强调推理和编码能力。
- Magistral 小尺寸和中尺寸专为现实世界推理和反馈驱动的改进而设计。
- Voxtral 引入了开源语音理解模型，将 Mistral 的能力扩展至音频领域。
- Devstral 专为编码任务量身定制，提供用于探索代码库和自动化软件工程流程的工具。
近期发展:
- Mistral 持续在 Apache 2.0 许可证下发布模型，确保可访问性并促进社区贡献。(Mistral AI 文档)

Kimi by Moonshot AI

模型: Kimi K2
亮点:
- Kimi K2 是一个拥有万亿参数的大型语言模型，采用混合专家架构。
- 该模型针对多语言任务进行了优化，在推理、编码和多模态能力方面表现出色。
- Kimi 被定位为 OpenAI 的 GPT-4o 等模型的竞争替代品。
近期发展:
- Moonshot AI 持续增强 Kimi 的能力，旨在为各种应用提供高性价比的 AI 解决方案。(维基百科)

Qwen by 阿里云

模型: Qwen 3
亮点:
- Qwen 3 是阿里云开发的一系列大型语言模型，专为广泛的应用而设计。
- 该模型在各种基准测试中排名靠前，展示了其具有竞争力的性能。
近期发展:
- Qwen 3 持续被整合到阿里的生态系统中，在不同平台上提供 AI 能力。(维基百科)

总结:

DeepSeek: 凭借高性价比、高性能的模型，尤其是在推理任务方面，成为强有力的竞争者。
Z.ai: 提供专注于智能体的开源模型，是西方模型的一个具有成本效益的替代方案。
Mistral AI: 专注于具有强大推理和编码能力的开源模型，并扩展至音频领域。
Kimi by Moonshot AI: 提供具有多语言和多模态能力的大规模模型，被定位为竞争替代品。
Qwen by 阿里云: 集成到阿里生态系统中，在各种应用中提供具有竞争力的性能。

这些公司各有所长，共同塑造了一个多元化且快速发展的 AI 市场格局。

Back Donate