OpenRouter排名预示市场碎片化 | AI生成和翻译
问题: 本周的 OpenRouter LLM 排行榜揭示了什么?为什么 token 数量如此接近,为什么没有出现绝对的领先者?
答案:
从这张快照中可以发现几个值得注意的点:
图表展示的内容
- 每周的 token 吞吐量——而非质量或基准测试分数。这是通过 OpenRouter 路由的原始使用量。
- 周环比增长率——每个模型旁边的数字(35%、51%、103% 等)反映的是增长势头,而非绝对规模。
- 这是一个需求信号,而非能力排名。
为什么数量如此接近
多个因素叠加导致:
1. 该领域在本周期内真正实现了多元化
GPT-4 时代的垄断局面已不复存在。DeepSeek V4 Flash、Hy3、MiniMax M3、MiMo 等模型在价格/性能上都具有竞争力。用户之所以分散使用,是因为每个模型都有其专长领域(速度、成本、上下文窗口、编程、中文语言)。
2. OpenRouter 的路由特性
OpenRouter 汇集了大量 API 消费者——业余爱好者、初创公司、CLI 工具、代理程序。每位用户的选择各不相同。没有单一的“企业默认设置”将某个模型推高至 10 倍使用量。
3. Flash/免费模型相互蚕食
注意,大多数顶级模型都是 Flash 变体或提供免费套餐。对价格敏感的用户(占 OpenRouter 的多数)会在它们之间不断进行套利。没有哪一款免费模型占据主导地位。
4. 周度窗口期太短
单周数据存在较大波动。新模型发布(MiniMax M3 周环比增长 +103%),其使用量会立即飙升;而下一周它可能就掉到第 8 位。
为什么没有明确的领先者
“领先者”会因使用场景而异:
| 使用场景 | 谁占优势 |
|---|---|
| 原始吞吐量 / 成本 | DeepSeek V4 Flash |
| 中文语言 | MiMo、GLM、Hy3 |
| 编程 | Claude Opus 4.7/4.8 |
| 免费套餐 | Nemotron 3 Ultra(周环比 +321%) |
| 多模态 | Gemini 3.x Flash |
目前并没有出现 GPT-4 那样的决定性时刻。 2023 年中期曾有一个明显的差距——GPT-4 遥遥领先。而现在,前沿模型的能力水平大致相当,差异在于价格、延迟以及特定任务的适配性,而非原始智能的差距。
这里真正值得关注的是什么
- Nemotron 3 Ultra 免费套餐,周环比 +321%——NVIDIA 的 550B MoE 模型,提供免费套餐,增长迅猛。值得持续关注。
- 腾讯的 Hy3 Preview 位列第二——一个预览模型,产生了 4.26T token 的使用量,这很不寻常。很可能是许多开发者在同时对其进行基准测试。
- MiniMax M3 周环比 +103%——增长最快。新进入者正在获取试用流量。
- Claude Opus 4.8 已位列第九——比 4.7 更新,但使用量更低,表明 4.7 仍然承载着生产部署。
- DeepSeek V3.2 增长率为 0%——持平。正在被 V4 变体取代。
总结
该排行榜衡量的是路由热度,而非模型质量。数值的接近表明市场竞争真正激烈——没有任何一个模型能好到 10 倍从而形成赢家通吃的格局。对于你的使用场景(代理管线、高 token 量),信号是:DeepSeek V4 Flash 用于成本优化的吞吐,Claude Opus 4.7/4.8 用于质量关键型任务——这已经与你的技术栈匹配。
参考: