Claude 4 Sonnet模型性能指标详解 | AI生成和翻译
简而言之:这是正常结束。
finish_reason: "stop" 表示模型已自然完成回复(遇到停止序列如assistant-end标记),且未触发长度限制、错误或取消。
以下是该记录其余字段的通俗解释:
-
模型与路由 您通过Google Vertex(
provider_name: "Google")调用了anthropic/claude-4-sonnet-20250522。因此会看到状态码为200的provider_responses条目。 -
耗时/速度
latency: 2850→ 约2.85秒后出现首个令牌generation_time: 76365→ 完整生成回复总计约76.4秒- 结合
tokens_completion: 2376,可推算出全程生成速率约31令牌/秒(2376 ÷ 76.4 ≈ 31.1)
-
令牌计数(双体系)
tokens_prompt: 8446、tokens_completion: 2376→ 聚合器统计值native_tokens_prompt: 9007、native_tokens_completion: 2511→ 服务商自有分词器的统计。因分词器差异、系统封装或隐藏控制令牌等因素,两组数值常不同native_tokens_reasoning: 0→ 未启用”推理令牌”计量(部分服务商在特殊推理模式下会显示)native_tokens_cached: 0→ 未命中提示词缓存
-
流式传输与取消
streamed: true→ 采用流式传输cancelled: false→ 未中途取消
-
为何不是”length”? 若触及令牌上限,将显示
finish_reason: "length"。当前记录未触发该限制。 -
发生时间
created_at: "2025-09-02T17:26:45.92824+00:00"(UTC时间)。换算为您所在时区(亚洲/台北,UTC+8)为2025-09-03 01:26:45。 -
费用/用量字段
usage: 0.064686→ 系统内部计费指标(单位取决于结算层级)- 多个
null字段表示路由未记录额外信息(审核延迟、搜索结果等)
-
其他
finish_reason: "stop"(再次强调)是关键:通过停止标记正常终止origin: ""、app_id: null→ 未标记特定应用来源is_byok: false→ 非自带密钥调用
如果您需要,可以粘贴另一个显示length或cancelled的示例,我将逐行对比解析(无需表格形式)。