OpenRouter排名预示市场碎片化

OpenRouter排名预示市场碎片化 | AI生成和翻译

首页 2026.06

问题： 本周的 OpenRouter LLM 排行榜揭示了什么？为什么 token 数量如此接近，为什么没有出现绝对的领先者？

答案：

从这张快照中可以发现几个值得注意的点：

图表展示的内容

每周的 token 吞吐量——而非质量或基准测试分数。这是通过 OpenRouter 路由的原始使用量。
周环比增长率——每个模型旁边的数字（35%、51%、103% 等）反映的是增长势头，而非绝对规模。
这是一个需求信号，而非能力排名。

为什么数量如此接近

多个因素叠加导致：

1. 该领域在本周期内真正实现了多元化

GPT-4 时代的垄断局面已不复存在。DeepSeek V4 Flash、Hy3、MiniMax M3、MiMo 等模型在价格/性能上都具有竞争力。用户之所以分散使用，是因为每个模型都有其专长领域（速度、成本、上下文窗口、编程、中文语言）。

2. OpenRouter 的路由特性

OpenRouter 汇集了大量 API 消费者——业余爱好者、初创公司、CLI 工具、代理程序。每位用户的选择各不相同。没有单一的“企业默认设置”将某个模型推高至 10 倍使用量。

3. Flash/免费模型相互蚕食

注意，大多数顶级模型都是 Flash 变体或提供免费套餐。对价格敏感的用户（占 OpenRouter 的多数）会在它们之间不断进行套利。没有哪一款免费模型占据主导地位。

4. 周度窗口期太短

单周数据存在较大波动。新模型发布（MiniMax M3 周环比增长 +103%），其使用量会立即飙升；而下一周它可能就掉到第 8 位。

为什么没有明确的领先者

“领先者”会因使用场景而异：

使用场景	谁占优势
原始吞吐量 / 成本	DeepSeek V4 Flash
中文语言	MiMo、GLM、Hy3
编程	Claude Opus 4.7/4.8
免费套餐	Nemotron 3 Ultra（周环比 +321%）
多模态	Gemini 3.x Flash

目前并没有出现 GPT-4 那样的决定性时刻。 2023 年中期曾有一个明显的差距——GPT-4 遥遥领先。而现在，前沿模型的能力水平大致相当，差异在于价格、延迟以及特定任务的适配性，而非原始智能的差距。

这里真正值得关注的是什么

Nemotron 3 Ultra 免费套餐，周环比 +321%——NVIDIA 的 550B MoE 模型，提供免费套餐，增长迅猛。值得持续关注。
腾讯的 Hy3 Preview 位列第二——一个预览模型，产生了 4.26T token 的使用量，这很不寻常。很可能是许多开发者在同时对其进行基准测试。
MiniMax M3 周环比 +103%——增长最快。新进入者正在获取试用流量。
Claude Opus 4.8 已位列第九——比 4.7 更新，但使用量更低，表明 4.7 仍然承载着生产部署。
DeepSeek V3.2 增长率为 0%——持平。正在被 V4 变体取代。

总结

该排行榜衡量的是路由热度，而非模型质量。数值的接近表明市场竞争真正激烈——没有任何一个模型能好到 10 倍从而形成赢家通吃的格局。对于你的使用场景（代理管线、高 token 量），信号是：DeepSeek V4 Flash 用于成本优化的吞吐，Claude Opus 4.7/4.8 用于质量关键型任务——这已经与你的技术栈匹配。

参考：

OpenRouter 排行榜

返回捐助