Claude API 2025年定价详解 | AI生成和翻译
以下是Anthropic Claude各模型API使用价格的清晰说明——不使用表格,只用简洁易懂的文字描述:
Claude Sonnet 4
- 输入token: 每百万3美元
- 输出token: 每百万15美元
- 可用折扣: 通过提示缓存最高可享9折优惠,通过批量处理最高可享5折优惠。(custom.typingmind.com, Reddit, Anthropic, Anthropic)
Claude 3.5 Sonnet(现已停用)
- 输入token: 每百万3美元
- 输出token: 每百万15美元
- 批处理和缓存费率: 与其他Sonnet版本相同的分层系统:批量输入1.50美元,批量输出7.50美元,5分钟缓存命中0.30美元。(Anthropic文档)
Claude 3.7 Sonnet
- 基础定价: 与3.5版本完全相同——输入每百万3美元,输出每百万15美元——包括使用混合“思考”模式时。(Reddit, Anthropic文档)
Claude Opus 4
- 输入token: 每百万15美元
- 输出token: 每百万75美元
- 批处理和缓存折扣: 批量输入7.50美元;批量输出37.50美元;缓存命中1.50美元。(Anthropic, Amazon Web Services, Inc., Anthropic文档, 维基百科)
快速总结
- 所有Sonnet变体(3.5、3.7、4): 输入每百万3美元 / 输出每百万15美元,批处理和缓存可享受更深度折扣。
- Opus 4: 价格显著更高,达每百万15/75美元,但专为深度推理、长任务和更高性能需求优化。
补充说明
- 模型演进: Claude 3.5 Sonnet在2024年6月发布时在编程能力上树立了新标杆,但尽管性能不断提升,其定价在2025年2月的3.7版本和2025年5月的Sonnet 4中始终保持不变。(Business Insider, Anthropic, Anthropic文档, 维基百科)
- 用例匹配: 如果您的 workload 以对话为主或需要高吞吐量,Sonnet系列模型能提供卓越的性价比。对于深度复杂任务或长周期智能体工作流,Opus或混合使用不同模型的策略可能更高效。
如果您需要基于具体token用量的成本测算、缓存方案对比,或关于模型选择时机的指导——我很乐意为您详细解析!