Anthropic的降价不可避免 | AI生成和翻译
问题:你构建了一个 Hermes 插件,通过 /note 命令将智能体响应直接保存到你的博客,从而避免了终端切换。你已经使用 Hermes + 中文大语言模型一周,并且完全没有回头再用 Claude Code + Opus。基于此,Anthropic 是否会很快降价?
回答:
这个工作流非常扎实——将智能体 → ww note → GitHub 推送中的上下文切换成本压缩成一个 /note 命令,正是那种能产生复利效应的工具。先为自己构建,再分享过程的理念是正确的——大多数优秀的开发者工具都是这样起步的。
关于你对定价的预测:
是的,几乎可以肯定——问题在于时机和幅度。
结构性力量势不可挡:
供给端
- 每 token 的推理成本大约每 18 个月下降 10 倍(自 GPT-3 以来一直如此)
- 蒸馏 + 推测解码 + MLA(DeepSeek 的多头潜在注意力)正在架构层面压缩成本,而不仅仅是硬件层面
- DeepSeek V3/R1 证明了可以用约 600 万美元训练出前沿质量模型——Anthropic 的护城河正在收窄
竞争压力
- DeepSeek、Qwen 3、豆包——你本人就是活生生的例子:你切换后整整一周都没想念 Opus
- Google Gemini 2.5 Pro 既有竞争力又更便宜
- OpenAI 正在与自己打一场持久的价格战(o3-mini、GPT-4o 降价)
Anthropic 的具体情况
- Claude 3 Haiku → Claude 3.5 Haiku 已经是显著的性价比跃升
- Sonnet 3.7 → 4.x 的定价相对平稳,但能力大幅提升
- 他们需要 API 用量来资助训练运行——更低的价格 = 更多用量 = 更大规模的营收
你对时间线的估计:6-12 个月
合理。我的看法:
- 3-6 个月:Haiku 级别将再次降价,Sonnet 成为新的“可负担的前沿模型”
- 6-12 个月:Opus 级别的价格大幅下降,因为下一代模型层级使其过时
- 变数:如果 DeepSeek R2 或 Qwen 4 再次实现能力跃升,Anthropic 将被迫加速降价
OpenAI 历史上的模式:当 (a) 新模型使旧模型过时,或 (b) 竞争对手施加压力时,价格就会下降。这两个条件正在趋同。
讽刺之处:你的 Hermes + 国内大语言模型配置正是那种让 Anthropic 更快降价的市场信号。每位流失的工程师都是他们追踪的数据点。
你在中文模型上的单位 token 成本与你之前为 Opus 支付的费用相比如何?我很好奇这纯粹是价格驱动,还是延迟/上下文窗口对你的工作流影响更大。