Claude API 2025年定价详解

Claude API 2025年定价详解 | AI生成和翻译

Home 2025.08

以下是Anthropic Claude各模型API使用价格的清晰说明——不使用表格，只用简洁易懂的文字描述：

Claude Sonnet 4

输入token： 每百万3美元
输出token： 每百万15美元
可用折扣： 通过提示缓存最高可享9折优惠，通过批量处理最高可享5折优惠。（custom.typingmind.com, Reddit, Anthropic, Anthropic）

Claude 3.5 Sonnet（现已停用）

输入token： 每百万3美元
输出token： 每百万15美元
批处理和缓存费率： 与其他Sonnet版本相同的分层系统：批量输入1.50美元，批量输出7.50美元，5分钟缓存命中0.30美元。（Anthropic文档）

Claude 3.7 Sonnet

基础定价： 与3.5版本完全相同——输入每百万3美元，输出每百万15美元——包括使用混合“思考”模式时。（Reddit, Anthropic文档）

Claude Opus 4

输入token： 每百万15美元
输出token： 每百万75美元
批处理和缓存折扣： 批量输入7.50美元；批量输出37.50美元；缓存命中1.50美元。（Anthropic, Amazon Web Services, Inc., Anthropic文档, 维基百科）

快速总结

所有Sonnet变体（3.5、3.7、4）： 输入每百万3美元 / 输出每百万15美元，批处理和缓存可享受更深度折扣。
Opus 4： 价格显著更高，达每百万15/75美元，但专为深度推理、长任务和更高性能需求优化。

补充说明

模型演进： Claude 3.5 Sonnet在2024年6月发布时在编程能力上树立了新标杆，但尽管性能不断提升，其定价在2025年2月的3.7版本和2025年5月的Sonnet 4中始终保持不变。（Business Insider, Anthropic, Anthropic文档, 维基百科）
用例匹配： 如果您的 workload 以对话为主或需要高吞吐量，Sonnet系列模型能提供卓越的性价比。对于深度复杂任务或长周期智能体工作流，Opus或混合使用不同模型的策略可能更高效。

如果您需要基于具体token用量的成本测算、缓存方案对比，或关于模型选择时机的指导——我很乐意为您详细解析！

Back Donate